将数据从数据集导入Excel工作表时出现格式问题
本文关键字:格式 问题 工作 数据 数据集 导入 Excel | 更新日期: 2023-09-27 18:21:32
我正在处理DataSet
中的一些数据,并试图在C#
中使用OpenXml
将其导入excel文件,我成功地做到了这一点,但在我的DataSet
中,我确实有一些类型为DateTime
、integer
和double
的列,但我的代码将所有列作为纯文本导入,使我无法根据工作表上的值对它们进行排序。我正在使用以下代码
public void ExportDataSet()
{
try
{
string fromFormat = "dd/MM/yyyy";
string toFormat = "MM-dd-yyyy";
DateTime newDate = DateTime.ParseExact(DateTime.Today.ToString(fromFormat), fromFormat, null);
string filedate = newDate.ToString(toFormat);
string destination = @"Z:'Physical DB Data " + filedate + ".xls";
using (var workbook = SpreadsheetDocument.Create(destination, DocumentFormat.OpenXml.SpreadsheetDocumentType.Workbook))
{
var workbookPart = workbook.AddWorkbookPart();
workbook.WorkbookPart.Workbook = new DocumentFormat.OpenXml.Spreadsheet.Workbook();
workbook.WorkbookPart.Workbook.Sheets = new DocumentFormat.OpenXml.Spreadsheet.Sheets();
DataSet ds = new DataSet();
ds = GetPhysicalGrainReportAutomation();
foreach (System.Data.DataTable table in ds.Tables)
{
var sheetPart = workbook.WorkbookPart.AddNewPart<WorksheetPart>();
var sheetData = new DocumentFormat.OpenXml.Spreadsheet.SheetData();
sheetPart.Worksheet = new DocumentFormat.OpenXml.Spreadsheet.Worksheet(sheetData);
DocumentFormat.OpenXml.Spreadsheet.Sheets sheets = workbook.WorkbookPart.Workbook.GetFirstChild<DocumentFormat.OpenXml.Spreadsheet.Sheets>();
string relationshipId = workbook.WorkbookPart.GetIdOfPart(sheetPart);
uint sheetId = 1;
if (sheets.Elements<DocumentFormat.OpenXml.Spreadsheet.Sheet>().Count() > 0)
{
sheetId =
sheets.Elements<DocumentFormat.OpenXml.Spreadsheet.Sheet>().Select(s => s.SheetId.Value).Max() + 1;
}
DocumentFormat.OpenXml.Spreadsheet.Sheet sheet = new DocumentFormat.OpenXml.Spreadsheet.Sheet() { Id = relationshipId, SheetId = sheetId, Name = table.TableName };
sheets.Append(sheet);
DocumentFormat.OpenXml.Spreadsheet.Row headerRow = new DocumentFormat.OpenXml.Spreadsheet.Row();
List<String> columns = new List<string>();
foreach (System.Data.DataColumn column in table.Columns)
{
columns.Add(column.ColumnName);
DocumentFormat.OpenXml.Spreadsheet.Cell cell = new DocumentFormat.OpenXml.Spreadsheet.Cell();
cell.DataType = DocumentFormat.OpenXml.Spreadsheet.CellValues.String;
cell.CellValue = new DocumentFormat.OpenXml.Spreadsheet.CellValue(column.ColumnName);
headerRow.AppendChild(cell);
}
sheetData.AppendChild(headerRow);
foreach (System.Data.DataRow dsrow in table.Rows)
{
DocumentFormat.OpenXml.Spreadsheet.Row newRow = new DocumentFormat.OpenXml.Spreadsheet.Row();
foreach (String col in columns)
{
DocumentFormat.OpenXml.Spreadsheet.Cell cell = new DocumentFormat.OpenXml.Spreadsheet.Cell();
cell.DataType = DocumentFormat.OpenXml.Spreadsheet.CellValues.String;
cell.CellValue = new DocumentFormat.OpenXml.Spreadsheet.CellValue(dsrow[col].ToString()); //
newRow.AppendChild(cell);
}
sheetData.AppendChild(newRow);
}
}
}
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
}
我应该怎么做才能让这些代码正常工作,而不将这些字段作为自己的类型导入?当我使用interop
循环和导入数据集时,它工作得很好,但这需要很长时间,因为我的DataSet
非常大,大约是15 columns
,而不是50000 rows
。
我认为问题在于将列List声明为字符串,如下所示
List<String> columns = new List<string>();
和
cell.DataType = DocumentFormat.OpenXml.Spreadsheet.CellValues.String;
但不知道该如何处理。
我建议您使用NPOI XSSF/HSSF来避免这种情况,因为它便于将单元格值属性设置为整数、日期时间、公式等,而且速度也很快。因此,您只需要检查数据集的值,并根据类型设置单元格属性。欲了解更多信息,请访问https://npoi.codeplex.com/SourceControl/latest