Decoding HTML with Regex
本文关键字:Regex with HTML Decoding | 更新日期: 2023-09-27 18:02:41
我正在尝试解码这个HTML输入字符串:
<tbody>
<tr class="row0 first" >
<td class="col0 first" data-colid="0" >
<span>Previous close</span>
</td>
<td class="col1 last" data-colid="1" >
<span>39.64</span>
</td>
</tr>
<tr class="row1" >
<td class="col0 first" data-colid="0" >
<span>Open</span>
</td>
<td class="col1 last" data-colid="1" >
<span>39.50</span>
</td>
</tr>
<tr class="row2" >
<td class="col0 first" data-colid="0" >
我试过这个正则表达式:
'<span'>Previous'sclose'<'/span'>['w'n'r'<'/'s'>'='"'-]+'<span'>[0-9'.]+'<'/span'>
我得到的输出是:
<span>Previous close</span>
</td>
<td class="col1 last" data-colid="1" >
<span>39.64</span>
我只对39.64的值感兴趣。是否有一种方法可以使用REGEX只匹配"39.64"而不获得HTML的其余部分?
Thx
您应该尝试解析HTML,而不是试图在其中查找值。
请检查HtmlAgilityPack解析HTML