如何递归加载Azure blob文件列表

本文关键字:Azure blob 文件 列表 加载 何递归 递归 | 更新日期: 2023-09-27 17:49:24

Azure blob文件存储在没有任何物理文件夹结构的普通列表中,但我们可以创建虚拟文件夹,其中每个文件的文件夹路径是其名称的一部分。

它带来了另一个问题,如何检索虚拟子文件夹中所有文件的列表,仅使用该文件夹的名称?

如何递归加载Azure blob文件列表

实际上,有一种更简单的方法可以做到这一点,它在库本身中可用。如果您查看CloudBlobContainer.ListBlobs方法,它接受两个参数:

  1. prefix:这是你的目录名。如果它是一个嵌套目录,你需要指定完整的路径,例如myfolder/mysubfolder。
  2. useFlatBlobListing:将此值设置为true将确保只返回blob(包括该目录下的任何子文件夹),而不是目录和blob。

    var account = new CloudStorageAccount(new StorageCredentials(accountName, accountKey), true);
    var blobClient = account.CreateCloudBlobClient();
    var container = blobClient.GetContainerReference("blob-container-name");
    var blobs = container.ListBlobs(prefix: "container-directory", useFlatBlobListing: true);
    

您将获得属于blobs变量"container-directory"中的所有blobs的列表。

这个静态类BlobHelper将加载给定blob文件夹中所有blob文件的列表,以及它的所有子文件夹。

就像这样命名:

var blobs = BlobHelper.ListFolderBlobs("blob-container-name", "container-directory");

以下是完整的BlobHelper代码:

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.IO;
using System.Linq;
using Microsoft.WindowsAzure;
using Microsoft.WindowsAzure.Storage;
using Microsoft.WindowsAzure.Storage.Blob;
// Class to contain list of blob files info
public class BlobFileInfo {
  public string FileName { get; set; }
  public string BlobPath { get; set; }
  public string BlobFilePath { get; set; }
  public IListBlobItem Blob { get; set; }
}
public static class BlobHelper {
// Load blob container
public static CloudBlobContainer GetBlobContainer(string containerName) {
  var storageAccount = CloudStorageAccount.Parse(CloudConfigurationManager.GetSetting("StorageConnectionString"));
  var blobClient = storageAccount.CreateCloudBlobClient();
  var container = blobClient.GetContainerReference(containerName);
  return container;
}
// Get recursive list of files
public static IEnumerable<BlobFileInfo> ListFolderBlobs(string containerName, string directoryName) {
  var blobContainer = GetBlobContainer(containerName);
  var blobDirectory = blobContainer.GetDirectoryReference(directoryName);
  var blobInfos = new List<BlobFileInfo>();
  var blobs = blobDirectory.ListBlobs().ToList();
  foreach (var blob in blobs) {
    if (blob is CloudBlockBlob) {
      var blobFileName = blob.Uri.Segments.Last().Replace("%20", " ");
      var blobFilePath = blob.Uri.AbsolutePath.Replace(blob.Container.Uri.AbsolutePath + "/", "").Replace("%20", " ");
      var blobPath = blobFilePath.Replace("/" + blobFileName, "");
      blobInfos.Add(new BlobFileInfo {
        FileName = blobFileName,
        BlobPath = blobPath,
        BlobFilePath = blobFilePath,
        Blob = blob
      });
    }
    if (blob is CloudBlobDirectory) {
      var blobDir = blob.Uri.OriginalString.Replace(blob.Container.Uri.OriginalString + "/", "");
      blobDir = blobDir.Remove(blobDir.Length - 1);
      var subBlobs = ListFolderBlobs(containerName, blobDir);
      blobInfos.AddRange(subBlobs);
    }
  }
  return blobInfos;
}

}

根据Gaurav Mantri的回答,这里有一种简单的方法来递归地将文件显示为层次结构。

public class UriNode
{
    public Uri ThisUri { get; private set; }
    public IEnumerable<UriNode> Children { get; private set; }
    public UriNode(CloudBlobContainer container, Uri thisUri = null)
    {
        ThisUri = thisUri;
        if (ThisUri == null)
        {
            Children = container.ListBlobs().Select(b => new UriNode(container, b.Uri));
            return;
        }
        if (!new Regex(@"'/$").IsMatch(ThisUri.AbsolutePath)) return;
        var prefix = string.Join("/", ThisUri.Segments.Skip(2).Take(ThisUri.Segments.Length - 2));
        Children = container.ListBlobs(prefix).Select(b => new UriNode(container, b.Uri));
    }
}

用法:

new UriNode(container);