如何从HTML页面中读取特定的数字

本文关键字:读取 数字 HTML | 更新日期: 2023-09-27 17:50:26

例如,如果我想设置这个页面的Index值:http://ca.finance.yahoo.com/q; _ylt = Agfc5O8HHTlOLgX.q6V4HEtyzJpG; _ylu = X3oDMTFkdnZqMHBkBHBvcwMyBHNlYwN5ZmlNYXJrZXRTdW1tYXJ5RnJvbnRwYWdlBHNsawNzcHRzeA——? s = ^ GSPTSE

到一个变量,我怎么能做到??

我对编程很陌生,如果你能解释每一行,我将非常感激。我的目的不是完成它,我想理解它。

提前非常感谢!

如何从HTML页面中读取特定的数字

如果您查看网页的源代码,您会发现索引号在一个具有唯一id的span标记内:<span id="yfs_l10_^gsptse">13,702.33</span>

这意味着你可以刮掉这个页面,然后挑出那个单独的标签。

您需要首先连接到主机并下载该页面。你这样做的方式取决于你使用的语言。有很多教程-只要搜索"[language] web抓取"。

然后你需要从html源代码中创建一个文档对象模型——同样,这取决于语言,在一些地方很容易,在另一些地方很难。完成后,只需搜索id为yfs_l10_^gsptse的标记并获取内容。

希望这对你有帮助-显然有很多我没有说,但这取决于你想用什么语言。