如何阅读RSS全文

本文关键字:全文 RSS 何阅读 | 更新日期: 2023-09-27 18:16:20

有些站点可以在Rss地址没有全文的情况下获得全文Rss提要like this site this

我该怎么做呢?

如何阅读RSS全文

我对c#了解不多,但我仍然可以给出一个关于如何解决你的问题的一般答案。RSS提要(几乎)总是链接到报纸/博客网站上的文章,在那里可以看到整篇文章。因此,"RSS填充器"从网站内容中提取文章的内容,并基本上将其放回提要中,取代可用的(简短的)介绍。

要做到这一点,你需要:

  • 解析/生成RSS/Atoms源(我相信有很多c#库可以做到这一点)
  • 从原始RSS提要中链接的html页面中查找实际文章。事实上,链接页面包含了很多你不想放在"完整"RSS提要中的东西(比如网站标题、导航栏、广告、评论、facebook喜欢按钮等等)。最简单的方法是使用readability(快速谷歌检查给出这个库)。

如果你把这两者结合起来,你就能达到你的目标。

您可以在http://fivefilters.org上找到这种工具的一个实现,它们的源代码(对于旧版本)在/content-only/http://code.fivefilters.org/full-text-rss/。它是在PHP中,但它可以提供一个如何进行的粗略想法。

您可以从完整的帖子rss提要网站获得放大部分rss提要的完整脚本步骤包括:-从RSS源获取文章的URL。
-获取帖子URL的全部内容,它将使用curl获取内容。
-解析内容,它使用模板。他们不断更新最流行的网站和wordpress主题的模板。基于模板,将html内容解析为html dom对象,然后根据html dom对象查找内容。
-最后,再次生成具有完整内容的rss提要。

你可以检查一下用PHP编写的脚本来获得一些想法,之后你可以将逻辑重写为任何语言