在 Oracle 中,我们可以使用 Jaro-Winkler 测量文本相似度,如下所示:
SELECT UTL_MATCH.JARO_WINKLER_SIMILARITY('STACKEXCHANGE', 'STAMPEXCHANGE') MYSTRING
FROM DUAL;
--98
事实证明,Teradata 也有 Jaro-Winkler,如此处所述。不幸的是,我只是不理解那里的文档和示例。
到目前为止,我在 Teradata 中可以做的是使用 EDITDISTANCE:
SELECT EDITDISTANCE('STACKEXCHANGE', 'STAMPEXCHANGE') MYSTRING;
--2
那么,如何在 Teradata 中使用 Jaro-Winkler 测量文本相似度?谁能给我一些简单的例子?
16.20.24.01 是 FU1,FU2 是 16.20.40.01+
此函数不是标量函数,它是用于集合处理的表运算符语法。你必须习惯它,但是那些运营商非常强大。