修剪所有文件中文本的最快方法
本文关键字:方法 文本 中文 文件 修剪 | 更新日期: 2023-09-27 18:36:27
我有一个功能来修剪目录中所有文件中的所有文本。这是代码
var dbtables = System.IO.Directory.GetFiles(db);
foreach(var table in dbtables)
{
string text = File.ReadAllText(table);
File.WriteAllText(table, text.Trim());
}
此目录中有许多大文件,大约需要 30 分钟才能完成。您知道更快的方法来做到这一点吗?
以下是我建议为每个文件执行的操作:
-
阅读第一个字符。
-
如果是空格,则必须重写整个文件。
- 将整个文件读入内存。
- 从头开始逐个字符迭代以查找第一个非空格字符。
- 从末尾逐个字符迭代以查找第一个非空格字符。
- 查找到文件的开头。
- 仅将字符串的中间字符写入文件。
- 将文件的长度设置为您编写的字符数。
-
如果第一个字符不是空格,则不会修剪开头,因此可以截断结尾。
- 逐个字符向后读取文件,直到找到不是空格的字符。
- 如果找到空格,请将文件的长度设置为当前长度减去空格字符数。
您的代码当前从每个整个文件的开头和结尾修剪空格,而不是每一行。如果要在每行的基础上修剪空格,可以使用:
var dbtables = System.IO.Directory.GetFiles(db);
foreach (string table in dbtables)
{
string temp = table + ".tmp";
using (StreamWriter target = new StreamWriter(temp))
foreach (string line in File.ReadLines(table))
target.WriteLine(line.Trim());
File.Delete(table);
File.Move(temp, table);
}