Weird Issue in Excel When Saved as ==> Csv

本文关键字:gt Csv as Saved Issue in Excel When Weird | 更新日期: 2023-09-27 18:15:50

我有一个excel文件,其中包含一些数据,当我将该文件保存到CSV然后一些奇怪的?符号出现在&正文结束。谁能告诉我怎样才能解决这个问题?

XXXXXX-XXX ?

以上是excel文件下载链接:http://www.filedropper.com/book1_5

Weird Issue in Excel When Saved as ==> Csv

在这个文件中,在C列中有以下数据:

 "‭0000468750-IN‬"
 "‭0000468750-IN‬"
 "‭0000843576AB‬"
 "‭0000843576AB‬"

它现在不是真正可见的,但是在每个数字的开始和结束处都有一个额外的不可见的空白字符。您可以自己看到它,只需编辑该单元格并通过方向箭头在文本中移动-当移动到不可见字符时,它会稍微停顿一下。如果我用下划线替换它,它看起来像这样:

 "_0000468750-IN_"
 "_0000468750-IN_"
 "_0000843576AB_"
 "_0000843576AB_"

如果我的文本编辑器没有欺骗我,那个字符的代码是0x00,它被称为空字符。

转换为CSV时,Excel不知道如何处理该字符。CSV是一个文本文件,必须遵循一些编码规则。例如,如果您将其保存为CSV/ANSI,那么就不可能存储一些Unicode字符,如ąęćżń。类似地,通常根本不可能在文本文件中存储0x00字符,因为这个字符在大多数编码中都是特殊的。有了这个字符,这样的文本文件可能会被阅读器检测为"二进制文件"并被拒绝。

Excel只是用"?"字符替换了这个奇数字符,以使数据对CSV格式安全。Excel不只是擦除0x00字符,让你知道原始数据中有一些奇怪的东西。

在文本数据中看到它是非常奇怪的。如果这个XLSX是由计算机程序生成的,则可能表明该程序有一些bug/错误。我非常怀疑这个文件是手工创建的。用手写"0x00"字符真的很难。我能想到的一种方法是,你可以通过使用一个蹩脚的条形码阅读器,将代码直接扫描到Excel表格中。条码扫描软件有时会将控制字符泄漏到文本数据流中。如果是这种情况,请更改阅读器或编写过滤器来删除这些字符。

顺便说一句。你应该能够找到&替换所有奇怪的字符。编辑其中一个单元格(F2键),到文本的末尾(end键)选择文本的最后一个字符(Shift + LeftArrow ONCE),复制该字符(Control + C),然后打开查找&替换窗口(Control + H)并将该字符粘贴到"查找"并按"替换全部"

在我的Excel中,这导致找到/替换8个这样的字符,所以它可以工作。

注意,在END键之后,你必须按一次ShiftLeft键。光标不会移动,也不会发生任何事情,不会显示任何选择。这是因为角色是隐形的。但它在那里,它将被选中并复制