使用OpenXMLSDK将所有单元格值抓取为字符串

本文关键字:抓取 字符串 单元格 OpenXMLSDK 使用 | 更新日期: 2023-09-27 18:00:03

我想以类似SAX的方式使用OpenXMLSDKv2.0阅读Excel2007+文档。我使用这篇博客文章作为一个粗略的指南:http://blogs.msdn.com/b/brian_jones/archive/2010/05/27/parsing-and-reading-large-excel-files-with-the-open-xml-sdk.aspx

然而,在我的文档中,我混合了字符串和数值。因此,字符串值被存储为SharedString,因此当为这样的单元格读取CellValue时,我会得到一个数字,我读取的数字就是索引(因此需要获取InnerText)。这似乎增加了太多的复杂性。我是否可以简单地将工作表中的所有单元格都视为文本/字符串,并以类似于博客文章示例的方式遍历所有获取值的单元格?

感谢

使用OpenXMLSDK将所有单元格值抓取为字符串

以下内容有帮助吗?

List<string> listShared = new List<string>();
using (SpreadsheetDocument xl = SpreadsheetDocument.Open("YourFile.xlsx", false))
{
    SharedStringItem ssi;
    using (OpenXmlReader oxrShared = OpenXmlReader.Create(xl.WorkbookPart.SharedStringTablePart))
    {
        while (oxrShared.Read())
        {
            if (oxrShared.ElementType == typeof(SharedStringItem))
            {
                ssi = (SharedStringItem)oxrShared.LoadCurrentElement();
                // this assumes the shared string is a simple text format, instead of rich text.
                listShared.Add(ssi.Text.Text);
            }
        }
    }
    WorksheetPart wsp = xl.WorkbookPart.WorksheetParts.First();
    Cell c;
    using (OpenXmlReader oxrCells = OpenXmlReader.Create(wsp))
    {
        while (oxrCells.Read())
        {
            if (oxrCells.ElementType == typeof(Cell))
            {
                c = (Cell)oxrCells.LoadCurrentElement();
                // c.CellReference holds a string such as "A1"
                if (c.DataType != null)
                {
                    if (c.DataType == CellValues.SharedString)
                    {
                        // use whichever from-string-to-number conversion
                        // you like.
                        //listShared[Convert.ToInt32(c.CellValue.Text)];
                    }
                    else if (c.DataType == CellValues.Number)
                    {
                        // "normal" value
                        //c.CellValue.Text;
                    }
                    // there's also boolean, which you might be interested
                    // as well as other types
                }
                else
                {
                    // is by default a Number. Use this:
                    //c.CellValue.Text;
                }
            }
        }
    }
}

注意:没有错误绑定检查或无效性检查。它旨在说明如何以尽可能简单的方式获取共享字符串。

此外,共享字符串列表被假定为"简单"共享字符串,这意味着没有富文本。

其逻辑是将工作表中的共享字符串列表加载到一个可以轻松操作的列表中。然后,当您在单元格中迭代时,如果您看到数据类型为SharedString的单元格,则可以再次检查List。如果单元格的数据类型为Number,则照常进行。