如何让NMecab输出romaji
本文关键字:输出 romaji NMecab | 更新日期: 2023-09-27 18:03:15
我正在使用。net移植的Mecab(称为NMecab)来尝试将日语平假名、片假名和汉字解析为romaji。
下面是我的代码:
using NMeCab;
MeCabTagger _tagger;
public string Parse(string input)
{
_tagger = MeCabTagger.Create();
_tagger.OutPutFormatType = "lattice";
_tagger.LatticeLevel = MeCabLatticeLevel.Two;
var output = _tagger.Parse(input);
return output;
}
当我使用以下日语文本呼叫Parse(input)
时:"
我得到输出:"ども助詞,接続助詞,, , , ,ども,ドモ,ドモEOS"
我在找"某某"的罗马字母,也就是"domo"。"
我已经尝试使用Mecab直接讨论在这个SO回答,但得到相同的输出。
据我所知,MeCab使用的字典(IPA, Jumandic或Unidic)都没有包含单词的罗马语转录。实际上没有这个必要:
-
存在不同的转录方案(如Hepburn, kunrei, 99 siki);
-
词汇单位的发音信息已经可用(例如:)。
你必须写你自己的转录程序…或者寻找一个现有的片假名-romaji转录模块(与您的转录方案兼容)…