Decoding HTML with Regex

本文关键字:Regex with HTML Decoding | 更新日期: 2023-09-27 18:02:41

我正在尝试解码这个HTML输入字符串:

            <tbody>
     <tr  class="row0 first" >
                     <td  class="col0 first" data-colid="0" >
<span>Previous close</span>
        </td>
         <td  class="col1 last" data-colid="1" >
<span>39.64</span>
        </td>
     </tr>
     <tr  class="row1" >
                     <td  class="col0 first" data-colid="0" >
<span>Open</span>
        </td>
         <td  class="col1 last" data-colid="1" >
<span>39.50</span>
        </td>
     </tr>
     <tr  class="row2" >
                     <td  class="col0 first" data-colid="0" >

我试过这个正则表达式:

'<span'>Previous'sclose'<'/span'>['w'n'r'<'/'s'>'='"'-]+'<span'>[0-9'.]+'<'/span'>
我得到的输出是:
<span>Previous close</span>
        </td>
         <td  class="col1 last" data-colid="1" >
<span>39.64</span>

我只对39.64的值感兴趣。是否有一种方法可以使用REGEX只匹配"39.64"而不获得HTML的其余部分?

Thx

Decoding HTML with Regex

您应该尝试解析HTML,而不是试图在其中查找值。

请检查HtmlAgilityPack解析HTML