自2002年推出以来,它已经成为网络上最大的新闻内容聚合器。在去年《大西洋月刊》年9月的一篇文章中,网站总监曾经说过,网站收集了5万多个新闻来源,每周独立访客超过10亿。该网站完全由计算机生成,每天收集和显示来自世界各地数千个新闻来源的标题。
相关算法和规则披露的很少,只说会定期调整新闻排名,以保证显示内容的质量。据信,自2003年以来,排名算法已经调整了三次。
去年偶然发现一个专利申请——《改进新闻文章排名的算法与系统》,专利申请号。通过对应用文档的分析,我们可以知道一些新闻故事排名的指标。这些指标决定了哪些新闻可以放在显著的位置。
在专利申请中,使用12个以上的索引对其他网站的新闻文章进行排名。包括新闻网站定期生成的新闻数量、新闻来源的平均长度、来自新闻来源的新闻报道的重要性、突发新闻评分、使用模式、公众意见、发行量、相关新闻机构的员工数量、新闻来源的办公室数量、新闻报道的广度、新闻中使用的原始命名实体数量、国际多样性甚至写作风格。
以下是一些算法规则
相关阅读
标签: #最新资讯算法相关报道