如何让NMecab输出romaji

本文关键字:输出 romaji NMecab | 更新日期: 2023-09-27 18:03:15

我正在使用。net移植的Mecab(称为NMecab)来尝试将日语平假名、片假名和汉字解析为romaji。

下面是我的代码:

using NMeCab;    
MeCabTagger _tagger;
public string Parse(string input)
{
    _tagger = MeCabTagger.Create();
    _tagger.OutPutFormatType = "lattice";
    _tagger.LatticeLevel = MeCabLatticeLevel.Two;

    var output = _tagger.Parse(input);
    return output;
}

当我使用以下日语文本呼叫Parse(input)时:"

我得到输出:"ども助詞,接続助詞,, , , ,ども,ドモ,ドモEOS"

我在找"某某"的罗马字母,也就是"domo"。"

我已经尝试使用Mecab直接讨论在这个SO回答,但得到相同的输出。

如何让NMecab输出romaji

据我所知,MeCab使用的字典(IPA, Jumandic或Unidic)都没有包含单词的罗马语转录。实际上没有这个必要:

  1. 存在不同的转录方案(如Hepburn, kunrei, 99 siki);

  2. 词汇单位的发音信息已经可用(例如:)。

你必须写你自己的转录程序…或者寻找一个现有的片假名-romaji转录模块(与您的转录方案兼容)…