如何使用c#从给定的HTML字符串获取IMG标签's源

本文关键字:标签 IMG 获取 字符串 何使用 HTML | 更新日期: 2023-09-27 18:14:48

我从DB得到这个HTML字符串:-

<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex</p><img class="classname" alt="alttext" src="http://www.domain.com/uploads/myimage.jpg" width="612" height="612" /><p>Going by the Itinerary, we will be at the official launch on the 22nd May.</p><img class="classname" alt="alttext" src="http://www.domain.com/uploads/myimage1.jpg" width="612" height="612" />

可以看到,在字符串中有两个图像标签。我想获得第一个图像标签的来源,例如:-

http://www.domain.com/uploads/myimage.jpg

谁能告诉我如何从HTML字符串中得到这个文本。

Thanks in advance

如何使用c#从给定的HTML字符串获取IMG标签's源

您可以使用html解析器,如htmllagilitypack来处理这个

string html = .......
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var link = doc.DocumentNode.SelectSingleNode("//img").Attributes["src"].Value;

我推荐HTML敏捷包:http://htmlagilitypack.codeplex.com/wikipage?title=Examples有一个例子甚至展示了如何做。

使用字符串。子字符串查找单词src .

记住它出现的位置