AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 323235
Accepted
smoka smokov
smoka smokov
Asked: 2023-02-09 07:25:43 +0800 CST2023-02-09 07:25:43 +0800 CST 2023-02-09 07:25:43 +0800 CST

Varbinary 模式搜索

  • 772

我正在尝试通过 varbinary 数据进行查询。问题是我无法真正完成我想要实现的目标。关于该列,您应该知道的是 varbinary(50) 并且出现的模式没有特定的书写顺序,这意味着每个前缀都可以在任何地方,只要它有 3 个字节 (0x000000) 第一个字节是前缀,第二个和第三个是值数据我想检查它是否在我喜欢的范围内。所有的数据都是这样写的。

我试过的:

DECLARE @t TABLE (
    val VARBINARY(MAX)
)

INSERT INTO @t SELECT 0x00000100000000000000000000000000000000000000000000000000
INSERT INTO @t SELECT 0x00001000000000000000000000000000000000000000000000000000
INSERT INTO @t SELECT 0x00010000000000000000000000000000000000000000000000000000
INSERT INTO @t SELECT 0x00100000000000000000000000000000000000000000000000000000
INSERT INTO @t SELECT 0x00000f00000000000000000000000000000000000000000000000000

declare @pattern varbinary(max)
declare @pattern2 varbinary(max)
set @pattern = 0x0001
set @pattern2 = @pattern+0xFF

select @pattern,@pattern2

SELECT
    *
FROM @t
WHERE val<@pattern
OR val>@pattern2

如果我使用 4 个符号作为模式,那么模式最多只能精确到 2 个符号,这完全是失败的,只有当模式处于预定义位置时它才会起作用。我试过这个和下面的所有内容的组合。

WHERE CONVERT(varbinary(2), val) = 0xdata

还有这个:

select * 
from table
where CONVERT(varchar(max),val,2) like '%data%'

这非常适合搜索精确模式,但不适用于范围,我需要两者的某种组合。

我需要一些可以自行检测的东西,而我只是指定一个起点和终点来查看两者之间的最高数字变化是“26ffff”,但将它限制为“ff00”之类的东西对于我来说是可以接受的寻找。

我最好的猜测是 2 个定义的数字,1 个是允许的最大范围,第 2 个是上限,所以它不会遍历所有可能的结果。但我很乐意做任何有用的事情。

数据来源与存储数据的游戏服务器有关。预定义的前缀是统计类型,其余数据是统计的实际数值。数据由 6 个字符数据间隔表示。这是数据流的示例。它总是 6-6-6-6-6 只要有空间来记录数据,因为它的上限为 50 个字符。 0x0329000414000B14000C14000D0F00177800224600467800473C00550F00000000000000000000000000

这些组总是以 3 字节的方式出现,我的想法是使用第一个字节来缩小搜索范围,然后使用第二个 2 字节来过滤它。我只是不知道如何有效地完成它。如果违反 3 字节模式,数据将变得不可读,这意味着即使您不需要额外的字节,您仍然必须对其进行计数,否则数据会破坏工作数据的示例。

0x032900'041400'

损坏数据的示例:

 0x0329'041400'

我能想到的唯一问题是前缀和部分值都是真实的例子:

0x262600

除非查询被特别命令以 3 字节序列读取数据,这意味着它知道第一个字节始终是前缀,其他 2 个字节是值。

问:是否可以将其用作对齐指示符,以便至少 3 个零字节之后的第一个非零字节指示组的开始?

A:是的,但我的意思不太可能,尽管它可能会按如下顺序编写:

0x260000'270000'

它不会向前跳过没有数据的整个 3 字节组。如果有人手动将其插入数据库,就会出现这种类型的条目,据我所知,服务器不会记录有这样的空白:

0x260000'000000'270000'

作为一个有效的查询,最接近我期望的结果是这个,但这很糟糕,它适用于小范围,但任何更大的范围都会很乏味。

select * from @t 
where (CONVERT(varchar(max),val,2) like '%262100%' or 
CONVERT(varchar(max),attr,2) like '%262200%' or 
etc...)

目标:

  1. 定位前缀(第一个二进制数据对)
  2. 在前缀后定义一个最大值,所有高于该阈值的都将在结果中列出。假设“26”是前缀,允许的最大数字是“9600”或“269600”。基本上,任何超过此模式“269600”的数据都应该被检测到,例如“269700”。或者查询结果会发布这个:

从表中选择 * CONVERT(varchar(max),attr,2) like '%269700%'


我正在尝试获取一个查询,该查询可以从一个表中循环 varbinary 数据,该表在设置参数示例中搜索特定结果:

0x263700,数据分为 3 个字节的段,1 个字节是将用于搜索模式的标头,其他 2 个字节是我必须检查其是否在设定范围内的值,例如:'3700' 以上的所有内容(+ 1 位差)二进制值,直到“FFFF”被归类为结果或最大可能结果为“26FFFF”。这不是针对要逐个循环的特定数据流。

sql-server
  • 1 1 个回答
  • 93 Views

1 个回答

  • Voted
  1. Best Answer
    Martin Smith
    2023-02-10T02:38:18+08:002023-02-10T02:38:18+08:00

    将值分成三个字节块并单独查看每个块可能是最简单的。

    由于最大长度仅为 50,而且您似乎不想查看三字节滑动窗口,因此将边界值硬编码到查询中是可行的(否则您可以创建一个包含序列号的表或使用它来避免这种GENERATE_SERIES情况)

    以下使用连接返回匹配的三元组值-如果您只想要匹配的行并且不希望同一二进制值的多个部分匹配时出现多行,id您可能更愿意更改为 a 。WHERE EXISTS

    DECLARE @YourTable table
    (
    Id INT PRIMARY KEY,
    Val VARBINARY(50)
    )
    
    INSERT @YourTable
    VALUES (1, 0x0329000414000B14000C14000D0F00177800224600467800473C00550F00000000000000000000000000),
           (2, 0x0329002637000B14000C14000D0F00177800224600467800473C00550F00000000000000000000000000);
    
    
    SELECT Id, Triplet
    FROM @YourTable T
    JOIN (VALUES (1),(4),(7),(10),(13),(16),(19),(22),(25),(28),(31),(34),(37),(40),(43),(46),(49)) Nums(Num) ON Num <= DATALENGTH(T.Val)
    CROSS APPLY (VALUES (SUBSTRING(T.Val, Num, 3))) V(Triplet)
    WHERE Triplet BETWEEN 0x263700 AND 0x2637FF
    

    您还应该检查以上是否适用于二进制长度不能被三整除并且最后一段短于三个字节的情况(也许您还需要一个谓词?DATALENGTH(Triplet) = 3)。

    • 5

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve