蜗牛风采网

登录

今日头条算法推送 广告推送逻辑算法

admin 举报

今日头条算法推送 广告推送逻辑算法

原标题:宋建武:个性化新闻信息推送服务现有算法的局限性及改进

近日,人民日报连续发表三篇评论,分析个性化新闻信息推送服务的混乱。这三篇文章引导我们冷静而深刻地思考算法技术的本质特征及其对通信方式的影响。

通过研究以今日头条为代表的“个性化信息发布平台”,我们对现有算法及其改进方法的局限性有了一些认识和判断。

第一,内容杂。信息平台为了最大限度地占用内容资源,往往会在特定的发展阶段,不加区别地扩大所谓的“自媒体”内容,让虚假低俗的信息在内容数据库中占便宜。平台上大量低质量内容的供应,造成了大规模的低俗内容需求。而信息平台缺乏管理手段,有的平台甚至主观上试图增加“流量”和“用户数”。

zX。WNfCw。cN

第二,算法单一。目前各种“个性化信息发布平台”基本都是根据用户信息点击的历史数据来判断自己的信息偏好,并据此推送更多类似的内容。点击率高的内容和内容类别将作为初始设置推送给更多用户。考虑到用户对移动终端的使用几乎是私人的、私密的,这种状态下表达的信息需求往往对好奇、低俗的内容比较敏感,这种低质量的信息往往具有较高的点击量。

第三,价值偏差。信息发布平台以具体信息的个体点击量和整体点击量(所谓热度)作为算法的主要甚至唯一的价值标准,使其成为机器推送算法的依据。通过对“热度”的客观综合分析,我们发现该指标反映了用户对特定信息的兴趣程度,可以映射出新闻信息的“兴趣”,但不能反映特定信息对于用户个人和社会的选择和决策行为的真实价值,即新闻信息的“重要性”。反映在平台运营者的概念中,他们错误地将用户对特定信息的“关注”视为“重要”。众所周知,从新闻信息本身的特点来看,这种“关注”,在移动终端上,往往反映的是用户对特定信息的“兴趣”,而不是信息本身的“重要性”。

zX。WNfCw。cN

虽然基于海量信息聚合和算法驱动的精确分发的个性化信息服务具有这些局限性,但商业信息平台也容易受到逐利动机的影响,从而加剧了这些问题。然而,不可否认的是,算法技术促进了信息传播的显著进步。

在移动互联网时代,移动新闻客户端已经成为公众接收新闻信息的主要渠道。移动终端的个性化特征增强了个性化信息需求,其便携性促进了基于场景的信息的使用,而信息交互使用户成为交流的主体。同时,自PC互联网时代以来,内容生产和传播的门槛降低,社交媒体的繁荣进一步开放了传播环境,社会的普遍信息化大大扩大了公共信息的规模。这些因素交织在一起,构成了移动通信的一个特殊矛盾。——如何实现海量信息资源与个性化信息需求的高效匹配。我们认为基于大数据和算法的人工智能是解决这个问题最有效的工具。算法技术对通信方式进步的贡献在于,它能够在社会信息化产生的海量信息供给中,以更高的效率和更低的成本,为个性化需求找到准确的匹配结果,这是人工智能在信息通信领域的应用,也是技术进步的体现。

正如邓小平同志所说,科学技术是第一生产力。与其站在技术进步的对立面,不如更积极地拥抱技术进步,在实践中改进技术,利用技术取得更大的进步。我们应该看到,创新技术的应用和推广通常需要经历一个长期的适应和调整过程,探索过程中的困难和不足不应成为否定或质疑技术进步总体方向的理由。

zX。WNfCw。cN

具体来说,为了妥善解决当前算法应用中的问题,不仅需要改进算法,还需要改进识别信息真实性和价值的手段,丰富信息价值的评价维度。

如何识别信息?

该算法的核心优势在于海量信息与个人需求之间的准确匹配,高效匹配的前提是对信息真实性和优劣性的准确判别。

要鉴别信息的真实性,国外的Facebook和Google,国内的微信和微博多采用第三方验证的方法。但这些方法都是事后应对,未能形成预警机制,难以提前防范虚假信息的发布和传播。随着各种传播平台用户的不断扩大,虚假信息一旦广泛传播,信息源的资质审查和处罚难以弥补负面舆论效应。所以传输前的拦截意义重大。目前,互联网信息传播平台采用的常见方法是通过技术手段进行事先验证。包括今日头条在内的一些网站,以“人工机器”的模式搭建防火墙拦截敏感词、“标题党”和虚假信息,还利用人工智能技术模仿人脑机制拦截低俗图片。目前很多大型信息平台,比如今天的头套,都建立了5000多储备的谣言数据库,用于筛选虚假信息。但是面对海量的、层出不穷的虚假信息,不如建立一个常识库,而不是谣言库,因为错误可以是花样百出,而常识是相对稳定的。

信息的识别与评估标准和内容数据库的源结构相关。信息平台应建立筛选系统,有效筛选信息源。目前,互联网信息平台广泛采用高质量自媒体内容的奖励机制,并开始与一些深入特定内容领域多年的传统媒体联手,增加高质量内容的供应。

如何改进算法?

既然人工智能在海量信息与个体需求的精确匹配方面有着明显的优势,那么具体的匹配规则即算法应该如何制定才能满足个体需求,促进高质量信息的传播呢?其实这个问题包含了一个很深的矛盾,就是个人和社会在信息的价值判断上能达成多大程度的一致?假设可以达成这种一致,如何在算法规则中体现个人和社会对信息价值的判断?

算法规则体现了新闻信息生产和传播组织的价值。商业大型信息发布平台旨在追求商业利益,

在算法设计中往往倾向于迎合用户需求,以获得尽可能多的点击量。即便如此,作为一个公共信息分发平台,其基本的社会责任也要求它,不能偏废“重要性”这一最本质的新闻价值维度。对于正打算采用算法技术,落实移动优先战略,以提升传播力和影响力的主流媒体来说,他们的社会功能和历史使命决定了,他们不能照搬商业平台以点击量为主导的算法规则,而必须更全面地考虑用户个人更本质的信息需求,尤其是个人在社会化过程中用于建立其个人与社会的一致性的信息需求,以有效地帮助其降低选择和决策的“不确定性”。因此,主流媒体的算法规则设计应该在吸取现有算法运用的经验和教训的基础上,着力于体现新闻的“重要性”。

如何丰富取值?

目前资讯分发平台普遍使用的信息价值评判标准是点击量,点击量越大的信息,传播范围越广。对于新闻信息而言,这样的取值虽然可以使新闻供给趋近于所谓“公众兴趣的最大公约数”,但对于使用移动终端的用户而言,受兴趣牵引的点击会偏向于娱乐性和猎奇性较强的信息,而主要基于点击量取值的算法规则,又会把这类信息推送到更大范围,在商业资讯平台上色情低俗信息的大量传播就是典型例子。由此可见,信息价值评判的取值方法对基于算法的个性化资讯服务影响重大。目前以点击量为主的取值方式,维度单一,导致了推送的内容过于娱乐化,而缺乏对信息重要性的真正体现。

在新闻传播学科内,新闻价值的内涵有普遍接受的定性描述——接近性、时效性、显著性、趣味性和重要性。前两个价值要素分别指的是新闻事件发生的地点和时间,显著性指的是新闻事件涉及的重要人物和组织。这三个要素实际上都是场景性指标,具有量化特定价值判断的作用。在我们的实际考察中发现,发生在移动终端上的点击量主要体现了趣味性要素。最后,重要性要素是新闻价值中最难以通过量化标准来体现的,而它恰恰是新闻信息价值判断的核心,它既需要在个人价值判断与社会整体价值判断的统一中寻找,还体现着浅表的事件描述与深层的数据分析的区别,通常也反映着业余的信息贡献者与专业的内容生产者的差异。目前的实践尚未探索出恰当体现新闻“重要性”的取值方法及与之匹配的算法规则,对于这一问题的理论研究也刚刚起步。

从操作层面来看,主流媒体生产的内容通常有专业水平的保障,也自然趋向于与社会主流价值观相一致;而自媒体生产的内容,则受到成本投入和运营水平的限制,也难免因逐利动机而标新立异、哗众取宠。因此,在更为细致的算法规则研发成功之前,按照信源类型对信息价值赋值,也许是具有较高可行性的策略。

(作者是中国人民大学新闻学院教授、博士生导师)

今日头条算法推送 广告推送逻辑算法

相关阅读

  • google商店排行 谷歌搜索排名算法
  • pk今日头条、一点资讯 同样是个性化分发 谁能笑到最后
  • 个性化资讯推荐算法 4大优化最新资讯算法相关报道策略
  • 推荐算法应该向媒体记者学习的 图文
  • 一点资讯刘爽 谈成功出售一点资讯
  • 最新资讯算法相关报道
  • 一点资讯刘爽 谈成功出售一点资讯
  • 推荐算法应该向媒体记者学习的 图文
  • 今日头条算法推送 广告推送逻辑算法
  • 标签: #最新资讯算法相关报道