为什么有些RSS上的文章收录不下来? - 专家答疑

美加精英学校——世界领先的精英实习基地,提供高品质低价位的教育培训,管理培训,软件培训,创业培训,投资培训等精英培训课程。
欢迎各位同学和世界精英团队一起,在参与世界级项目的过程中提升自己的能力!
现在的时间是 2012年 5月 22日 18:55
当前时区为 UTC + 8 小时

版面规则


作为美加新闻聚合系统 Elite RssPortal的官方新闻发布渠道, 讨论 Elite RssPortal 的各种使用方法,



发表新帖 回复这个主题  [ 1 篇帖子 ] 
客座讲师
*

注册: 2009年 10月 9日 16:25
帖子: 278
*
  离线 用户资料  
引用回复  
*
为什么有些RSS上的文章收录不下来?
帖子 2010年 6月 24日 13:42 
正如有些站长发现的状况一样,对于某些 RSS 信息源,无论怎么刷新,收录数总是 0。

可能原因如下:

1。RSS 信息源已经失效。即通过该 URL,已经访问不到该 RSS 信息源。这时管理员后台会记录访问失败。一旦访问失败次数达到上限,将不再访问该 RSS 信息源。

2。该 RSS 信息源对访问者作了限制。 比较典型的就是 http://www.webmasterworld.com 提供的 RSS 信息源,它会自动区分访问者的浏览器类型和访问频率,从而判断出是否是个人读者,并据此给出不同的内容。对于此类 RSS 信息源,我们很难解决,因为它们的算法可能会动态调整,而我们注定访问量巨大。故此我们能做的就是回避此类 RSS 信息源,毕竟还有很多其它 RSS 信息源可供选择。

还有一种情况就是该文章的访问需要登陆论坛才可以访问。这样的文章同样美加新闻聚合系统也无法访问到。故此我们能做的还是回避此类 RSS 信息源。

3。RSS 文章格式不规范。 有些 RSS 信息源提供的文章几乎不包含正文,故此抽取出来的内容太过简短。于是美加新闻聚合系统抛弃了这些超短文章。对于此类 RSS 信息源,我们还是建议不要选择。

4。网络临时故障。 由于翻译引擎通讯发生临时故障,或者您的服务器发生临时故障,都有可能造成抽取出来的内容太过简短。于是美加新闻聚合系统抛弃了这些超短文章。对于此类情况,您只需等待此临时故障自动消除即可恢复正常。


举报此文章
显示帖子 :  排序  
发表新帖 回复这个主题  [ 1 篇帖子 ] 


在线用户

正在浏览此版面的用户:没有注册用户 和 7 位游客


可以 在这个版面发表主题
可以 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

查找:
前往 :  
cron
本论坛的全部信息由培训专家——美加精英学校负责维护并拥有全部版权。旗下网站有:美加精英研究院美加精英研究院全球推广中心货比3家网等。