如何确定CSV文件是否为unicode

本文关键字:unicode 是否 文件 何确定 CSV | 更新日期: 2023-09-27 18:11:17

我使用c#,我有一个逗号分隔的csv文件与不同的语言不同的字符串。我的应用程序应该只打开CSV,如果它是unicode。

是否有一种简单的方法来确定这在代码中

如何确定CSV文件是否为unicode

当你说"Unicode"时,我假设你指的是UTF-8。Unicode不是编码,文件不能是"Unicode"。

您可以使用库,例如,ude是一个c#库,它试图确定文件使用的编码。它使用这里描述的算法。这并不是100%万无一失的。

CSV规范没有提供一种方法来提供描述编码格式的元数据。规范本身使用ASCII编码作为分隔符。但是分隔符之间的数据标记可以是任何东西。

您必须通读数据本身,并据此推断编码类型。

如果您控制输出和输入,您可以通过添加自己的元数据来根据自己的需要修改格式,但是如果在您的情况下这很重要,那么它将不适合CSV文件格式。

所以,没有一种"简单"的方法来确定编码