在c#中查找字符串的语言

本文关键字:语言 字符串 查找 | 更新日期: 2023-09-27 18:09:27

可能重复:
返回给定字符串的语言

在我的程序中,我必须找到输入字符串的语言。例如,如果用户输入

 "hello world" 

检测到的语言是英语,如果用户输入

"RUE"

应该是法语。

目前,在我的项目中,用户可以输入法语或英语。

我尝试使用CultureInfo类,但没有取得任何成果。

在c#中查找字符串的语言

我认为您需要包含语言词典,然后匹配输入的单词,以预测提供输入的准确语言。

TextCat在语言识别方面非常好。它有很多不同语言的实现。

Ivan Akcheurov制作了一个没有端口的版本,可以在这里找到。

它是纯.Net Framework dll+命令行接口。它与TextCat的74种语言模型完全兼容,因此它能够开箱即用地检测语言。

没有内置功能,这不是一项琐碎的任务,但看看这个问题和答案。如果你有足够大的学习基础,那么它可以用来确定一篇文章是用什么语言写的。这总是一个最好的猜测,因为一些文章,比如医学英语,使用了很多你在法语中会发现的单词(或者至少在那些单词更像法语而不是英语的地方,即使文章是用英语写的(

一个很好的例子说明了确定语言的难度,尤其是当文本很短时,它实际上是"rue"。这是法语中街道的意思,但至少在4个不同的国家也是一个城市,所以有五种可能的语言。一个是法国人,一个是英国人。(弗吉尼亚州有个小镇叫Rue(

.NET中没有这样的内置功能,因此您需要自己实现它(这在资源方面非常昂贵(,或者尝试利用公共服务,如谷歌翻译,这可能对该任务有用(也可能不有用(。

Google Translate API支持检测字符串的语言。这是一项付费服务,但可能物有所值。