给定一个事件的 GUID,比如登录,我如何利用其他列数据搜索相似或不同的事件?
例如:查找与 [GUID] {Server:"s123", State="NY", Status="503", etc...} 类似的登录信息
或者
查找与给出的示例相反的登录名?
我觉得必须有一个名称,但我认为全文或“%Like%”语法是不够的。
使用 solr 或 elasticsearch 索引数据是解决方案吗?
给定一个事件的 GUID,比如登录,我如何利用其他列数据搜索相似或不同的事件?
例如:查找与 [GUID] {Server:"s123", State="NY", Status="503", etc...} 类似的登录信息
或者
查找与给出的示例相反的登录名?
我觉得必须有一个名称,但我认为全文或“%Like%”语法是不够的。
使用 solr 或 elasticsearch 索引数据是解决方案吗?
简单的方法是计算匹配的列数:
其中“姓名”和“电话”是表格中的列。如果需要,您可以使用同一张表作为 needle 和 haystack(以查找表中的重复项)。
http://blog.databasepatterns.com/2014/12/fuzzy-record-matching-in-sql-p1.html
更正确也更复杂的方法是使用Probabilistic Record Linkage。有一个 R 包(recordlinkage)