是否可以检查字符串编码

本文关键字:字符串 编码 检查 是否 | 更新日期: 2023-09-27 18:13:42

在我的应用程序中,我从用户在网站上上传的文件中导入一些文本到数据库中。数据库SQL Server 2005,文本存储在nvarchar列,我使用EF和L2SQL。

用户应该用UTF-8制作他们的文件,但不幸的是,他们中的一些显然使用了不同的编码。结果有些字符是无效的。

我想找出哪些记录是有效的。我使用utf8checker。它可以很好地处理原始文件,但是当文本来自数据库时,IsUtf8方法总是返回true。

是否可以检查字符串编码

我认为SQL server将始终将Unicode存储为UCS-2。因此,您需要确保数据在插入时而不是读取时具有正确的编码。否则,SQL服务器将为您乱码,我认为没有办法确定数据插入后的原始编码-除非您在记录本身中有编码定义,如另一列或数据元素的前几个字符。如。XML就是这样做的。

希望这对你有帮助。