UTF8: U+00E9 é is split into U+0065 e and U+00B4 ´
本文关键字:U+0065 #180 and into U+00B4 is U+00E9 #233 UTF8 split | 更新日期: 2023-09-27 18:32:54
我正在努力处理一些UTF8数据。
当我在十六进制视图中打开 UTF8 文件时,é 被拆分为两个字符(U+0065 e 和 U+00B4 '(,而不是使用明显的字符 U+00E9 é。
如果我将这些数据存储在我的数据库中(注意:排序规则设置为 German_PhoneBook_CI_AI(然后它被存储
德帕迪约,格拉德(!!!
而不是:德帕迪约,热拉尔。
所以我想知道数据本身是否有缺陷,或者我缺少什么样的信息。如果您需要更多信息以及此问题,请告诉我。
显而易见的问题是:我该如何解决这个问题?
注意:我将这个问题标记为 C#/VB.NET,因为可能有代码片段有用的答案。
我们解析 unicode 的网站没有提供正确的 unicode。