汉字句型匹配

本文关键字:句型 汉字 | 更新日期: 2023-09-27 17:53:58

我有一个字符串与另一组字符串进行比较,需要得到这两个字符串相等的分数(百分比)(例如:一对一相同:100%,完全不同:0%)。但问题是这些字符串是由日语字符组成的(日语句子没有空格)。然而,有时它由一些数字字符组成(例如:)。

执行此操作的最合适方法是什么?

汉字句型匹配

日文字符仍然是Unicode。

使用一种标准的字符串比较算法,如Levenshtein距离。

除了其他的评论,如果你打算考虑到汉字和平假名的等价性,事情很快就会变得复杂起来。在进行比较之前,您可能希望将字符串语音化为,例如romaji或代表性令牌。