在 hadoop 中对文件格式进行排序

本文关键字:排序 格式 文件 hadoop | 更新日期: 2023-09-27 18:35:14

是否有任何选项可以使用 C# 代码将 Hadoop 分布式文件系统文件编写为序列文件。如果是这样,您可以向我建议链接或其他详细信息吗

在 hadoop 中对文件格式进行排序

我没有在Hadoop工作中使用过C#,但我们可以做到这一点。

在爪哇语中

  Configuration conf = new Configuration();
    Job job = new Job(conf);
    job.setOutputFormatClass(SequenceFileOutputFormat.class);

这将写入序列文件。同样,在 C# 中应该有这样的

  HadoopJobConfiguration myConfig = new HadoopJobConfiguration();
            myConfig.InputPath = "/demo/simple/in";
            myConfig.OutputFolder = "/demo/simple/out";

更新:

 HadoopJobConfiguration myConfig = new HadoopJobConfiguration();
                myConfig.InputPath = "/demo/simple/in";
                myConfig.OutputFolder = "/demo/simple/out";
                myConfig.outputformat  =  // Your needed o/p format 

希望这会给你一个想法