本篇文章主要介绍了"Facebook 动态消息揭秘(完)",主要涉及到方面的内容,对于创业投资感兴趣的同学可以参考一下:
编者按:本文编译自 Slate 的探秘文章。作者难得探访到了 Facebook 的动态消息团队,了解到了是谁控制着你在 Facebook 看到的动态消息,以及为...
编者按:本文编译自 Slate 的探秘文章。作者难得探访到了 Facebook 的动态消息团队,了解到了是谁控制着你在 Facebook 看到的动态消息,以及为什么它那全球最有影响力的算法要不断改变。篇幅较长,我们将连载刊出,此为第三部分。
Facecook 的动态消息揭秘(一)
Facebook 的动态消息揭秘(二)
几个月内,Mosseri 和他的团队对这个专门小组的反馈已经变得越来越依赖,以至于他们开始把小组扩大到全国的范围,付费让全美各地有代表性的样本每天对他们的动态消息进行评级和点评。到了 2015年 夏天,Facebook 解散了诺克斯维尔的小组,但同时把质量小组扩大到海外范围。Mosseri 的直觉是对的:动态消息算法存在着 Facebook 的数据科学家自身无法识别的盲点。于是他们用人类的量化反馈来补盲。
新闻质量小组对算法当然至关重要,但该公司也越来越意识到单一来源的数据无法说明一切。对此 Facebook 的做法是开发一套相互制衡的体系,每一次动态消息调整都必须通过一连串不同类型受众的测试,然后用各种不同的指标来进行判断。
这种平衡做法就是 Menlo Park 的排名工程师、数据科学家和产品经理团队每天都要做的任务。他们是一群像 Sami Tas 这样的人,后者是一名软件工程师,其工作是将动态消息排名团队提议的变更转化为计算机能理解的语言。这个下午,我朝他身后看过去的时候,他正在向我解释一个看似微不足道的问题。然而,Facebook 现在认为,这类小问题正是关键所在。
大多数时候,大家对动态消息里面看到的故事不关心的话就会往下翻过去。有些故事甚至会把他们给惹毛了,他们就会跑到帖子右上方点开那个小小的下拉菜单狠狠地点一下 “隐藏帖子。”
但是,每个人对 Facebok 的用法都不一样。Facebook 的数据科学家意识到,85%的隐藏动作其实是一小部分的用户(5%)干的。再深挖下去,Facebook 发现这 5%里面又有一小部分人几乎把看到的所有故事都隐藏掉了—甚至连自己喜欢和评论过的故事也这样。结果证明,对于这些 “超级隐藏癖” 而言,隐藏故事并不意味着他们不喜欢它,这只是他们用来标记 “已读” 的方式罢了,就像把消息归档进 Gmail 一样。
但是他们的动作给 Facebook 赖以对故事进行排名的数据造成了偏差。由于这东西太复杂,动态消息算法并不打算根据每个用户的行为进行单独建模。你的点赞在价值方面跟我的完全是一样的,隐藏的价值也一样。然而,对于超级隐藏癖,排名团队决定进行特别处理。Tas 的任务是对代码进行调整,识别出这一小部分人,然后把他们隐藏动作的负值打个折扣。
这个修补听起来好像很简单。但这个算法对 Facebook 来说太宝贵了,所以对算法的每一次调优都必须进行测试—首先是离线模拟,然后让很小的一组 Facebook 员工试,接着是一小部分 Faebook 用户,最后才是全面上线。每一步公司都会收集变更对指标的影响,这些指标包括用户互动情况、在网站的消耗时间、广告收入,以及页面加载时间等。他们还利用分析工具来实时观测任何上述关键指标大的异常变化,并设定了一些内部告警,自动发通知给动态消息团队的关键成员。
一旦变更通过了上述测试,Tas 就会在每周例行的 “排名会议” 上呈交结果数据,然后得经受住 Mosseri、Allison、Marra 以及同事的有关对各种指标影响的连珠炮攻击。如果团队认为变更是好的,不会产生意外后果,负责 iOS、Android 以及 Web 代码的团队就会逐步把它推给公众。
即便是这个时候,Facebook 也无法确定变更不会产生某些预想不到的、微妙而又长期性的影响。为了预防这一点,Facebook 保留了一个 “抵抗小组”—有小部分的用户在几周或几个月的时间之后才会看到变化。
把动态消息算法说成一个会让人误解。这不仅是因为它其实是数百个解决(组成显示哪些故事给人看这个大问题的)更小问题的小算法的结合,而且由于所有这些测试、“抵抗小组” 的存在,实际上这个主算法在全球随时都会有十几个版本在同时跑。Tas 针对 “隐藏故事” 的调整是在去年7月31号宣布的,大部分人都没注意到他在 Facebook 上的那篇提醒的帖子。但是现在那些超级隐藏癖也许会对自己的动态消息更加满意了,进而会继续使用 Facebook,跟朋友分享故事,并观看让这家公司活下去的广告。