关于在c#中使用Stream类读取不同类型的文件
本文关键字:读取 同类型 文件 Stream | 更新日期: 2023-09-27 18:02:47
注意:我问这个问题是因为我看到我需要导入许多库来处理不同的文件,这将增加应用程序的大小。而且在运行时在库之间切换非常耗时,因为每次都要处理随机文件。我只想要文件里的文字。
你好,最近我开始做一个项目,需要读取不同类型的文件,如txt, pdf, word, excel等。
我正在阅读
Excel -使用Microsoft Excel互操作
Pdf - using ITextSharp
txt -使用基于流的类。
我的问题是我可以使用基于流的类读取所有这些文件,因为它们将所有文件数据转换为字节?
或者我可以使用流类只读文本文件,因为文本文件将只有纯文本,而不是像pdf等其他文件类型的图像?
您可以按字节读取所有这些文件,但是
不是所有类型都像*.txt文件那样以字节形式保存数据,因为它们使用不同的格式来保存内容。
例如*.xlsx是一个开放的xml格式。该文件是包含大量XML文件的压缩文件夹。*.pdf也是一种特殊的格式——从二进制文件中获取内容是非常复杂的。
阅读这个答案以获得更多信息!