关于在c#中使用Stream类读取不同类型的文件

本文关键字:读取 同类型 文件 Stream | 更新日期: 2023-09-27 18:02:47

注意:我问这个问题是因为我看到我需要导入许多库来处理不同的文件,这将增加应用程序的大小。而且在运行时在库之间切换非常耗时,因为每次都要处理随机文件。我只想要文件里的文字。

你好,最近我开始做一个项目,需要读取不同类型的文件,如txt, pdf, word, excel等。

我正在阅读

Excel -使用Microsoft Excel互操作

Pdf - using ITextSharp

txt -使用基于流的类。

我的问题是我可以使用基于流的类读取所有这些文件,因为它们将所有文件数据转换为字节?

或者我可以使用流类只读文本文件,因为文本文件将只有纯文本,而不是像pdf等其他文件类型的图像?

关于在c#中使用Stream类读取不同类型的文件

您可以按字节读取所有这些文件,但是

不是所有类型都像*.txt文件那样以字节形式保存数据,因为它们使用不同的格式来保存内容。

例如*.xlsx是一个开放的xml格式。该文件是包含大量XML文件的压缩文件夹。*.pdf也是一种特殊的格式——从二进制文件中获取内容是非常复杂的。

阅读这个答案以获得更多信息!