将多语言字符串拆分为单词c#

本文关键字:单词 拆分 字符串 语言 | 更新日期: 2023-09-27 18:12:49

我使用return Regex.Split(s, @"'W")将字符串拆分为单词。

我的输入字符串是?[怀双胞胎,顺产或剖腹产都好]。

它在英语中工作得很好,但在日语或中文中却失败了。[分割成

]
Pregnant with twins
,
natural delivery or caesarean section is good

)

应该分成

Pregnant 
with 
twins
natural 
delivery 
or 
caesarean
section 
is 
good

在c#中有没有办法做到这一点。

请告诉我。

将多语言字符串拆分为单词c#

根据你对其中一个评论的回复,你提到的那个中文句子有两个词。由空间给定字符串的词一样,"怀了双胞胎,顺产还是剖腹产比较好呢"unicode字符,但无法确定是什么分隔符。但只是用通常的方式尝试了那个分隔符出现在字符串中。复制粘贴在单词和字符之间。它工作。

    string yourString = @"怀了双胞胎,顺产还是剖腹产比较好呢";
    string[] splitted = Regex.Split(yourString, ",");
    foreach(string s in splitted)
    {
        textBox1.AppendText(s + "'n");
    }

我不确定它是否适用于你的其他日语/汉语句子。

不是100%确定,但在繁体中文中,每个汉字都是单词本身,请尝试下面,如果它适合你。

string sentence = "怀了双胞胎,顺产还是剖腹产比较好呢?";
char[] chars = sentence.ToCharArray();
StringBuilder sb = new StringBuilder();
foreach (char s in chars)
{
    sb.AppendLine(s.ToString()+"<br/>");
}