UTF8: U+00E9 é is split into U+0065 e and U+00B4 ´

本文关键字：U+0065 #180 and into U+00B4 is U+00E9 #233 UTF8 split | 更新日期: 2023-09-27 18:32:54

我正在努力处理一些UTF8数据。

当我在十六进制视图中打开 UTF8 文件时，é 被拆分为两个字符(U+0065 e 和 U+00B4 '(，而不是使用明显的字符 U+00E9 é。

如果我将这些数据存储在我的数据库中(注意：排序规则设置为 German_PhoneBook_CI_AI(然后它被存储

德

帕迪约，格拉德(！！！

而不是：德帕迪约，热拉尔。

所以我想知道数据本身是否有缺陷，或者我缺少什么样的信息。如果您需要更多信息以及此问题，请告诉我。

显而易见的问题是：我该如何解决这个问题？

注意：我将这个问题标记为 C#/VB.NET，因为可能有代码片段有用的答案。

UTF8: U+00E9 é is split into U+0065 e and U+00B4 ´

我们解析 unicode 的网站没有提供正确的 unicode。