通过类排除

本文关键字:排除 | 更新日期: 2023-09-27 18:17:37

我有一个Ul元素,它有3种不同类型的li子元素,我想通过它们的类排除其中2种类型的子元素。使用class = map和class = map-button排除li元素

这是我正在摆弄的,

HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(Constants.New_York.GetOffenderPageById(""+ 41586));
var querylist3 = from list in 
                   doc.DocumentNode.SelectNodes("//ul[@class='address label-value']")
                  .Cast<HtmlNode>()
  from row in list.SelectNodes("not(li[@class='map']) and not(li[@class='map-button'])")
                  .Cast<HtmlNode>()
  select new { CellText = Utilities.RemoveHtmlCharacters(row.InnerText) };
foreach (var q1 in querylist3)
        Console.WriteLine(q1.CellText);

所以我在看HtmlAgilityPack SelectNodes表达式忽略具有特定属性的元素,但要么我不能正确理解解决方案,要么它不工作。

我不喜欢创建对象实例和比较linq…

作为参考,这是HTML,

<ul class="address label-value">
   <li><span class="label">Type</span><span class="value">RES&nbsp;(Primary)</span></li>
   <li><span class="label">County</span><span class="value">Suffolk</span></li>
   <li class="no-border-bottom"><span class="label">Address</span><span class="value">1010 OLD MEDFORD RD<br>FARMINGVILLE,&nbsp;New York&nbsp;11738</span></li>
   <li class="map-button"><a class="cta cta-blue cta-small" href="https://www.google.com/maps/embed/v1/place?key=AIzaSyDLQ6Qf1v0RJyudkTTEcAYsXPIewwO4F3w&amp;zoom=17&amp;q=1010 OLD MEDFORD RD,FARMINGVILLE,NY,11738">View on Map</a></li>
   <li class="map">
      <iframe src="" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" class="map-iframe">&lt;!----&gt;</iframe>
      <p><a href="../nsor/mapping-exceptions.htm">Learn about possible mapping exceptions.</a></p>
   </li>
</ul>

通过类排除

我的答案不是我希望学到的…但它解决了这个问题。我仍然想知道如何使用不在htmlnode选择的搜索参数…

我暂时使用linq…不知道哪个更好…

 var querylist3 = from list in doc.DocumentNode.SelectNodes("//ul[@class='address label-value']").Cast<HtmlNode>()
                     from row in list.SelectNodes("li").Where(x => !x.Attributes.Contains("class") || !x.Attributes["class"].Value.Contains("map")).Cast<HtmlNode>()
                     select new { CellText = Utilities.RemoveHtmlCharacters(row.InnerText) };