如何在C#中获取链接HTML
本文关键字:获取 链接 HTML | 更新日期: 2023-09-27 18:27:51
我有以下代码:
<div id="list">
<table>
<tr>
<th>STT</th>
<th>Link</th>
</tr>
<tr>
<td>Line 1</td>
<td><a href="http://website.com/link1">Link 1</a></td>
</tr>
<tr>
<td>Line 2</td>
<td><a href="http://website.com/link2">Link 2</a></td>
</tr>
</table>
</div>
如何获取:
http://website.com/link1
http://website.com/link2
以您给定的确切结构获取表中a
元素的href
s的Xpath:
htmlDoc.DocumentNode.SelectNodes("//div[@id='list']/table/tr[td]/td[a]/a");
然后刮去所有的@href
属性。
开箱:
查找属性为
id
、值为'list'的div,然后导航到子table
,然后是那些带有td
子级的tr
行,然后类似地,导航到带有a
子级的td
元素。