使用C#将Tex转换为txt

本文关键字:txt 转换 Tex 使用 | 更新日期: 2023-09-27 18:20:34

我有一个Tex文件。我想用C#把它转换成txt文件。请帮忙。我确信它包含的信息是纯文本,但使用的格式是Tex.

使用C#将Tex转换为txt

TeX文件需要经过充分解释,才能可靠地提取任何类型的文本。用C#编写一个完整的TeX解释器可能是一项真正的任务,所以我建议使用现有的解释器,它可以输出更容易解析的格式,比如HTML。

你可能会倾向于编写一个正则表达式来简单地剥离所有的'command,但这不会给你一个非常准确的结果,因为有些命令会产生自己的文本,而[不太常见]有些命令会吞噬后面的文本。此外,你会遇到字符更改类别代码的问题,有些字符可能在活动类别代码中,意味着字符本身可以是命令。