【PHP改进计算字符串相似度的函数similar_text()、levenshtein()_PHP】教程文章相关的互联网学习教程文章

字符串相似性的算法(优于Levenshtein和similar_text)? Php,Js【代码】

我在哪里可以找到比levenshtein()和php similar_text()方法更准确地评估错位字符拼写的算法? 例:similar_text('jonas', 'xxjon', $similar); echo $similar; // returns 60 similar_text('jonas', 'asjon', $similar); echo $similar; // returns 60 <- although more similar! echo levenshtein('jonas', 'xxjon'); // returns 4 echo levenshtein('jonas', 'asjon'); // returns 4 <- although more similar!/乔纳斯解决方法:...

php – 如何使用Levenshtein距离和错别字帐来创建类似字符串的阈值?

我们最近遇到了一个有趣的问题,我们在数据库中发现了重复的用户提交数据.我们意识到大部分数据之间的Levenshtein距离只是所讨论的2个字符串之间的差异.这表明如果我们只是将一个字符串中的字符添加到另一个字符串中,那么我们最终会得到相同的字符串,对于大多数情况来说,这似乎是我们考虑重复项目的最佳方式. 我们也想说明错别字.因此,我们开始平均考虑人们在每个单词上在线制作拼写错误的频率,并尝试在此距离内使用这些数据.我们找...