将多语言字符串拆分为单词c#
本文关键字:单词 拆分 字符串 语言 | 更新日期: 2023-09-27 18:12:49
我使用return Regex.Split(s, @"'W")
将字符串拆分为单词。
我的输入字符串是?[怀双胞胎,顺产或剖腹产都好]。
它在英语中工作得很好,但在日语或中文中却失败了。[分割成
]Pregnant with twins
,
natural delivery or caesarean section is good
)
应该分成
Pregnant
with
twins
natural
delivery
or
caesarean
section
is
good
在c#中有没有办法做到这一点。
请告诉我。
根据你对其中一个评论的回复,你提到的那个中文句子有两个词。由空间给定字符串的词一样,"怀了双胞胎,顺产还是剖腹产比较好呢"unicode字符,但无法确定是什么分隔符。但只是用通常的方式尝试了那个分隔符出现在字符串中。复制粘贴在单词和字符之间。它工作。
string yourString = @"怀了双胞胎,顺产还是剖腹产比较好呢";
string[] splitted = Regex.Split(yourString, ",");
foreach(string s in splitted)
{
textBox1.AppendText(s + "'n");
}
我不确定它是否适用于你的其他日语/汉语句子。
不是100%确定,但在繁体中文中,每个汉字都是单词本身,请尝试下面,如果它适合你。
string sentence = "怀了双胞胎,顺产还是剖腹产比较好呢?";
char[] chars = sentence.ToCharArray();
StringBuilder sb = new StringBuilder();
foreach (char s in chars)
{
sb.AppendLine(s.ToString()+"<br/>");
}