Azure上的Rss聚合器-最佳方式

本文关键字:最佳 方式 上的 Rss Azure | 更新日期: 2023-09-27 17:58:58

我的应用程序(后端)在Windows Azure上运行。应用程序必须读取rss提要,并将信息写入数据库。有很多问题,但这些都是基本问题。

1.组织应用程序架构的最佳方式是什么?

2.如何从订阅源获取更新(定期请求或使用PubSubHubbub)?

3.我怎么知道渠道支持PubSubHubbub?

感谢提供任何信息

Azure上的Rss聚合器-最佳方式

问题归结为您正在聚合哪些RSS源,我怀疑您可能有支持和不支持PuSH的RSS频道。

如果你是一个大型的RSS聚合器,那么我想说你应该支持PuSH和定期获取请求,但当你很小的时候,这归结为一件事,那就是你的代码和维护时间。

如果你有不兼容PuSH的RSS源的可能性,那么我说代码只用于定期更新。如果需要,您可以稍后在PuSH中进行编码。

在体系结构方面,它取决于您的可扩展性要求。我个人喜欢这种方法

  1. Azure调度程序>消息到存储队列

    • 这将启动一个过程,确定所有需要更新RSS提要的网站
    • 将需要检查的站点推送到Azure服务总线
  2. Azure服务总线>进程(转到站点并更新RSS提要)

将所有这些保持在服务总线上意味着您可以根据需要扩展服务器,它们都读取同一个队列,但这会分散工作负载。

在您的数据库中保持哪些支持PuSH的状态。稍后,您可以更改获取这些RSS提要的方法,只将不支持PuSH的RSS提要放入队列中。