OOXML-Linq用于提取带有特定标题的单词表
本文关键字:标题 单词表 用于 提取 OOXML-Linq | 更新日期: 2023-09-27 18:28:15
我正在使用Open XML SDK 2.6来尝试&更新Word文档。我可以使用<w: tbl适应>元素来标识表。我的问题是,我需要使用什么Linq查询来获得对整个<w: tbl>结构,给定具有特定<w: tbl适应>w: val属性?
DocumentFormat.OpenXml.Packaging.WordprocessingDocument doc = WordprocessingDocument.Open(@"D:'dev'openxml'table.docx", false);
var tables = doc.MainDocumentPart.Document.Descendants<Table>().ToList();
//WHAT LINQ STATEMENT DO I USE?
DOCX TBL XML
<w:tbl>
<w:tblPr>
<w:tblW w:w="4814" w:type="dxa"/>
<w:tblInd w:w="247" w:type="dxa"/>
<w:tblBorders>
<w:top w:val="single" w:sz="4" w:space="0" w:color="auto"/>
<w:left w:val="single" w:sz="4" w:space="0" w:color="auto"/>
<w:bottom w:val="single" w:sz="4" w:space="0" w:color="auto"/>
<w:right w:val="single" w:sz="4" w:space="0" w:color="auto"/>
<w:insideH w:val="single" w:sz="4" w:space="0" w:color="auto"/>
<w:insideV w:val="single" w:sz="4" w:space="0" w:color="auto"/>
</w:tblBorders>
<w:tblLayout w:type="fixed"/>
<w:tblLook w:val="0000" w:firstRow="0" w:lastRow="0" w:firstColumn="0" w:lastColumn="0" w:noHBand="0" w:noVBand="0"/>
<w:tblCaption w:val="TBL_TEST"/>
</w:tblPr>
<w:tblGrid>
<w:gridCol w:w="1468"/>
<w:gridCol w:w="1444"/>
<w:gridCol w:w="1902"/>
</w:tblGrid>
<w:tr>
</w:tr>
</w:tbl>
您可以尝试以下操作:
XDocument doc;
XNamespace ns =
XNamespace.Get(@"http://schemas.openxmlformats.org/wordprocessingml/2006/main");
using (WordprocessingDocument doc = WordprocessingDocument.Open(stream, true))
{
using (StreamReader sr = new StreamReader(doc.MainDocumentPart.GetStream()))
using (XmlReader xr = XmlReader.Create(sr))
xdoc = XDocument.Load(xr);
XElement table;
//Descendants() gets all children,grandchildren etc.
//First get document -> body ->
XElement tablecapt = xdoc.Elements().First().Elements().First()
.Descendants().Where(d => d.Name == XName.Get("tblCaption", ns)
&& d.Value == "TBL_TEST").FirstOrDefault();
if (tablecapt != null)
table = tablecapt.Parent.Parent;
}
我现在不能测试它,但我认为它应该不会太远。