根据文件名中的日期筛选目录中的文件

本文关键字:文件 筛选 日期 文件名 | 更新日期: 2023-09-27 18:13:38

我需要根据文件名中的日期过滤目录中的文件。

名称有四组数字:

9999.99999.201305021219.99999999.txt

当有多个文件重复第二组数字时,我想使用基于第三组数字(YYYYMMDDHHMM)上的日期的较新的文件。

如果目录中有以下文件:

1   1100.04037.201305090945.04542592.TXT
2   1100.04041.201305091108.04542707.TXT
3   1100.04041.201305091117.60563353.TXT
4   1100.04047.201305080942.04541666.TXT
5   1100.24084.201305021658.04539125.TXT
6   1100.24084.201305061731.04540560.TXT

我希望丢弃第2行和第5行中的那些。这就是我如何遍历目录文件的方法:

    public static void Main(string[] args)
    {
        string directory = @"''some'net'path";
        string[] arquivos = Directory.GetFiles(directory, "1100.*.txt", SearchOption.TopDirectoryOnly);
        foreach (string arquivo in arquivos)
        {
            Console.WriteLine(arquivo.Substring(directory.Length + 1));
        }
        Console.ReadLine();
    }

根据文件名中的日期筛选目录中的文件

var files = arquivos
           .Select(f => new{OrgName = f, Parts = new FileInfo(f).Name.Split('.')})
           .GroupBy(x=>x.Parts[1])
           .Select(g=>g.OrderByDescending(x=>x.Parts[2]).First().OrgName);
foreach (string arquivo in files)
{
    .....
}

根据目录中有多少文件,我建议在遍历文件夹时使用Dictionary来保存您的值。您可以使用第二组数字作为键,然后检查键是否已经存在于字典中。如果是,则可以执行任何合适的比较,以确定保留哪一个。

var ci = CultureInfo.InvariantCulture;
// first, parse your input files:
var parsed = 
from f in arquivos 
let c = Path.GetFileName(f).Split('.')
select new 
{ 
  Key = c[1], 
  Name = f, 
  Date = DateTime.ParseExact(c[2], "yyyyMMddHHmm", ci) 
};
// now, group by file id, and order by file date, 
// picking record by latest date:
var result = 
parsed.GroupBy(g => g.Key)
.Select(t => t.OrderByDescending(z => z.Date)
.Select(z => z.Name).First()).ToList();