AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题

问题[string-searching](dba)

Martin Hope
Lisdengard
Asked: 2022-04-08 23:55:35 +0800 CST

列出并计算列中的单词

  • 0

我有一列包含物种列表的字符串:

+----------------------------------------+
|                species                 |
+----------------------------------------+
| Dinosauria, Ornitischia, indeterminado |
| Sirenia                                |
| Dinosauria, Therophoda                 |
| Dinosauria, Therophoda, Allosaurus     |
| and so on...                           |
+----------------------------------------+

我正在寻找一种在 PostgreSQL 12 中列出和计算所有唯一名称的方法,例如:

+---------------+-------+
|    species    | count |    
+---------------+-------+
| Dinossauria   | 3     |
| Ornitischia   | 1     |
| indeterminado | 1     |                        
| Sirenia       | 1     |    
| Theropoda     | 2     |              
| Allosaurus    | 1     |                 
+-----------------------+
postgresql string-searching
  • 1 个回答
  • 48 Views
Martin Hope
David Abragimov
Asked: 2019-11-14 12:12:18 +0800 CST

像'%'在MySql中使用longblob列搜索值很慢

  • 0

MySQL 版本是 5.7.25

我有桌子

CREATE TABLE `applications` (
  `id` varchar(25) NOT NULL,
  `application` longblob NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

“应用程序”是大约 50kb 的 xml 文本。

该表包含大约 120k 条记录。

当我进行搜索时

Select * from `applications`
where 
application like '%<l:name>8085%</l:name>%'

查询因 30 分钟超时而失败。

如果我做

Select A.* from (
Select * from `applications`
Limit 0,1000
)A where 
A.application like '%<l:name>8085%</l:name>%'

查询在 6 秒内完成。

所以通过分页我可以在 120*6 = 720 秒内得到查询结果

有趣的是,限制为 0,10000 的相同查询在 120 秒内完成,限制为 0,100000 的查询因超时 30 分钟而失败

从这篇 SO 帖子中,我了解到可能 longblob 查询性能与行数不是线性的。

我终于完成了通过分页和连接结果来获取查询结果。

Select A.id from (
Select * from `applications`
Limit 0,10000
)A where 
A.application like '%<l:name>8085%</l:name>%'

Select A.id from (
Select * from `applications`
Limit 10000,20000
)A where 
A.application like '%<l:name>8085%</l:name>%'
......

问题是如何更方便地获得结果。

搜索字符串会有所不同,并且事先是未知的,将列类型更新为TEXT现在不是一种选择,因为这需要应用程序重构,而此时没有人想要。查询是手动更新的一部分,所以执行时间不是问题。


伦纳特:

题外话,但即使没有人更新表,您也可能会错过某些行。如果要保证检查所有行,则需要与 limit 一起进行 order by。

添加ORDER BY和检查更新是有意义的,谢谢。

mysql string-searching
  • 1 个回答
  • 152 Views
Martin Hope
seng
Asked: 2019-09-07 08:04:17 +0800 CST

jsonb数组上的三元组匹配

  • 0

您好我正在尝试在包含数组的表上使用 pg_trgm 实现某种模糊字符串匹配jsonb,这是一个示例数据:

      name
------------------
[{"firstname": "jhon", "lastname": "doe"},{"firstname": "jhonny", "lastname": "doe"}]
------------------    
[{"firstname": "jane", "lastname": "doe"},{"firstname": "janne", "lastname": "doe"}]

这是我当前查询的示例:

SELECT * FROM persons WHERE exists(
    SELECT * FROM json_array_elements(persons.name::json)
        WHERE word_similarity('jhon', (COALESCE(value->>'firstname', '') || ' ' || (COALESCE(value->>'lastname', ''))) ) >= 0.7);

它可以完成这项工作,但速度很慢(没有索引)。我的问题是我可以做些什么来加快搜索(索引,替代查询)?TIA

postgresql string-searching
  • 1 个回答
  • 657 Views
Martin Hope
Charlie Clark
Asked: 2019-04-07 05:57:16 +0800 CST

搜索网站域名中的部分匹配项

  • 0

我有一个 Postgres 数据库,其中包含有关网站的信息和一个名为sitescolumn的表host。这已经有一个文本模式操作的索引,非常适合从域名的开头进行搜索:WHERE host LIKE 'www.bran%但对于部分匹配(例如WHERE host LIKE '%.bran%'导致扫描的部分匹配)来说不是很好。目前大约有 750 万台主机,因此搜索性能已经很明显了。

根据下面的建议,我添加了一个 trigrm 索引(您需要启用扩展才能执行此操作:

create extension pg_trgm;

然后添加一个合适的索引:

CREATE INDEX trgm_idx ON sites USING GIST (host gist_trgm_ops);

与所有索引一样,这可能需要一些时间,具体取决于数据库的大小。

在索引之前,我的查询大约需要 180 秒才能在 750 万个中找到 200 个项目,但这因相关子查询而变得复杂,这似乎使问题复杂化并主导查询,并建议我应该首先考虑优化其他内容,特别是日期索引。

所以比较的结果是:使用 text_ops 索引大约需要 2s,使用 trigram 大约需要 7。我想如果我创建一个只包含主机名相关部分的索引,我可能会更幸运。

postgresql string-searching
  • 1 个回答
  • 519 Views
Martin Hope
Mio
Asked: 2017-10-12 23:29:01 +0800 CST

搜索连接列

  • 2

我有这个 :

CREATE TABLE users
(
    first_name varchar(60) NOT NULL, 
    last_name varchar(60) NOT NULL
);

INSERT INTO users
    (first_name, last_name)
VALUES
    ('Sylvia ', 'Hoeks'),
    ('Harrison', 'Ford');

我得到这样的清单

SELECT first_name || ' ' || last_name AS user_full_name FROM users;

但我希望能够在该列上进行搜索user_full_name。没有子查询或 CTE 是否可能(如下所示)?

WITH users_list AS (
    SELECT first_name || ' ' || last_name AS user_full_name
    FROM users
)

SELECT * FROM users_list WHERE user_full_name ILIKE '%lvi%';

我试过第一列!?

SELECT first_name || ' ' || last_name AS user_full_name FROM users WHERE 1 ILIKE '%lvi%';
/*
ERROR:  operator does not exist: integer ~~* unknown
LINE 1: ...|| last_name AS user_full_name FROM users WHERE 1 ILIKE '%lv...
                                                             ^
HINT:  No operator matches the given name and argument type(s). You might need to add explicit type casts.
*/

我希望能够做这样的事情。

SELECT first_name || ' ' || last_name AS user_full_name FROM users WHERE user_full_name ILIKE '%lvi%';

目前我这样做:

SELECT first_name || ' ' || last_name AS user_full_name FROM users WHERE first_name ILIKE '%lvi%' OR last_name ILIKE '%lvi%';

如果需要,小提琴:https ://www.db-fiddle.com/f/c3HANw8M9W7kSWeEwidpne/0

postgresql string-searching
  • 1 个回答
  • 2064 Views
Martin Hope
Bassmanjase
Asked: 2013-08-12 18:22:21 +0800 CST

LEFT vs CHARINDEX 用于匹配 T-SQL 中字符串的开头

  • 8

我想匹配WHERE子句中字符串的开头。虽然我认识到数据库性能通常取决于底层数据结构,但是否有这样做的最佳实践?有没有一种选择总是优于其他选择?

我想避免LIKE,因为我认为它的效率会低于LEFTor CHARINDEX。据我所知,我的选择如下。欢迎其他建议:

DECLARE @MyField as varchar(10)
SET @MyField = 'HELLOWORLD'
SELECT 1 WHERE @MyField LIKE 'HELLO%'
SELECT 2 WHERE LEFT(@MyField, 5) = 'HELLO'
SELECT 3 WHERE CHARINDEX('HELLO', @MyField) = 1
sql-server string-searching
  • 1 个回答
  • 22066 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve