如何从 HTML 网页获取某些信息

本文关键字:信息 获取 网页 HTML | 更新日期: 2023-09-27 18:33:59

我想从网页中提取统计数据,但我完全不知道该怎么做。例如,在这个网页上,https://www.google.ca/,我想从HTML代码中获取按钮"我感到幸运"的文本,或者如果可能的话,使用更简单的方法。我有代码,但它与我的问题不太相关。如果你能帮忙,那就太好了。

编辑:我正在使用C# Windows窗体应用程序

如何从 HTML 网页获取某些信息

此链接可能会对您有所帮助

http://www.dotnetperls.com/scraping-html

如果你正在使用Java

http://htmlcleaner.sourceforge.net/javause.php

祝你好运

<html> 
<body>
  <form action="get_btn_val.php" method="GET">
     <input type="submit" name="btn_click" value="I'm Feeling Lucky" >
  </form> 
</body>
</html>
/

/在get_btn_val.php页面

<?php
   echo $_GET['btn_click'] ;
?>
我不

了解 C#,但你需要一个 html 解析库。Python的BeautifulSoup非常强大。我会看一看。

我必须说你的问题不清楚。很难给出具体的答案,所以我只能尽力给大家一些起点。从标签中,我想您正在寻找从站点解析HTML文件的方法?

首先,当你在这个问题中标记C#时,我想你可能想先在C#中找到解决方案?你可以看看 Html Agility Pack

其他语言也有类似的库。

PHP: PHP Simple HTML DOM Parser

Python:官方HTML解析器

爪哇:jsoup

或者,最简单的方法是使用javascript(或jquery或其他javascript库)来解析HTML。但是,请注意,如果 HTML 不是托管您自己的计算机,则由于同源策略,您无法使用 javascript 来解析该页面的 HTML。不过,您需要以其他方式运行 javascript,例如在开发人员工具控制台、Chrome 扩展脚本中运行或在服务器端节点.js中运行。