如何在C#中获取链接HTML

本文关键字：获取链接 HTML | 更新日期: 2023-09-27 18:27:51

我有以下代码：

<div id="list">
  <table>
    <tr>
      <th>STT</th>
      <th>Link</th>
    </tr>
    <tr>
      <td>Line 1</td>
      <td><a href="http://website.com/link1">Link 1</a></td>
    </tr>
    <tr>
      <td>Line 2</td>
      <td><a href="http://website.com/link2">Link 2</a></td>
    </tr>
  </table>
</div>

如何获取：

http://website.com/link1

http://website.com/link2

如何在C#中获取链接HTML

以您给定的确切结构获取表中a元素的hrefs的Xpath：

htmlDoc.DocumentNode.SelectNodes("//div[@id='list']/table/tr[td]/td[a]/a");

然后刮去所有的@href属性。

开箱：

查找属性为id、值为'list'的div，然后导航到子table，然后是那些带有td子级的tr行，然后类似地，导航到带有a子级的td元素。