R中的模糊连接中文数据集

我正在尝试通过公司名称模糊连接两个数据集。我只需要60%的字符匹配即可匹配公司名称。问题在于公司名称全为汉字。我尝试使用difference_left_join包中的fuzzyjoin函数按公司名称连接数据集,但返回错误消息Error in v1 - v2 : non-numeric argument to binary operator。然后,我尝试使用levenshteinSim函数来查找公司名称之间的百分比匹配,但是它似乎不适用于汉字。还有其他方法可以模糊匹配公司名称并将其合并在一起吗?

pangdianjun 回答:R中的模糊连接中文数据集

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/3163168.html

大家都在问