根据文件名中的日期筛选目录中的文件
本文关键字:文件 筛选 日期 文件名 | 更新日期: 2023-09-27 18:13:38
我需要根据文件名中的日期过滤目录中的文件。
名称有四组数字:
9999.99999.201305021219.99999999.txt
当有多个文件重复第二组数字时,我想使用基于第三组数字(YYYYMMDDHHMM)上的日期的较新的文件。
如果目录中有以下文件:
1 1100.04037.201305090945.04542592.TXT
2 1100.04041.201305091108.04542707.TXT
3 1100.04041.201305091117.60563353.TXT
4 1100.04047.201305080942.04541666.TXT
5 1100.24084.201305021658.04539125.TXT
6 1100.24084.201305061731.04540560.TXT
我希望丢弃第2行和第5行中的那些。这就是我如何遍历目录文件的方法:
public static void Main(string[] args)
{
string directory = @"''some'net'path";
string[] arquivos = Directory.GetFiles(directory, "1100.*.txt", SearchOption.TopDirectoryOnly);
foreach (string arquivo in arquivos)
{
Console.WriteLine(arquivo.Substring(directory.Length + 1));
}
Console.ReadLine();
}
var files = arquivos
.Select(f => new{OrgName = f, Parts = new FileInfo(f).Name.Split('.')})
.GroupBy(x=>x.Parts[1])
.Select(g=>g.OrderByDescending(x=>x.Parts[2]).First().OrgName);
foreach (string arquivo in files)
{
.....
}
根据目录中有多少文件,我建议在遍历文件夹时使用Dictionary来保存您的值。您可以使用第二组数字作为键,然后检查键是否已经存在于字典中。如果是,则可以执行任何合适的比较,以确定保留哪一个。
var ci = CultureInfo.InvariantCulture;
// first, parse your input files:
var parsed =
from f in arquivos
let c = Path.GetFileName(f).Split('.')
select new
{
Key = c[1],
Name = f,
Date = DateTime.ParseExact(c[2], "yyyyMMddHHmm", ci)
};
// now, group by file id, and order by file date,
// picking record by latest date:
var result =
parsed.GroupBy(g => g.Key)
.Select(t => t.OrderByDescending(z => z.Date)
.Select(z => z.Name).First()).ToList();