facebook怎么看明星的?
作为一个在facebook工作的人,看到这个问题还是有点感触的。其实大家心里都明白,facebook这样的大公司,数据量巨大,有上百亿的活跃用户和每天数亿条的新内容加入,任何一条内容的流行程度都可以从数据的波动得到反映。所以其实判断热点内容和事件,对于人工智能或者大数据这样领域的工程师来说并不是很难的事情。因此当facebook的用户群体达到一定的规模之后,利用机器学习算法来推测人们感兴趣的内容就是很自然的事情了。
这里我还需要解释一个概念,叫做item based recommendations ,直译为基于项的建议,也就是推荐你可能喜欢的内容。举个例子,假如你关注了足球俱乐部,并且你关注的另一家俱乐部的人气也很旺,那么facebook就会给你推荐这家俱乐部的相关内容。虽然在这个例子中,两项的内容本身是没有关联的(体育和人气),但是它们都具有共同的主题(足球)。因此如果其中一项内容获得了大量的关注,可以推断另一项也应该获得更多人的关注。 所以最后的结果实际上反映了人们的兴趣偏好,而不是真正的热度排行。举个例子,假设你一直对物理都很感兴趣,但是某一天你却突然给爱因斯坦的某篇著作点赞(当然这种概率很小),那么按照这种推荐机制,类似《时间简史》之类的霍金著作很有可能被推送到你面前。虽然这些作品都是热门,但是他们与你的兴趣偏好是不相符的。因此这种机制虽然能有效的推送人们可能感兴趣的内容,但并不能准确反映热点事件的真正情况。当然对于不经常使用facebook的人来说,他们发布的一条状态有可能引起无数人的关注和评论,这种情况会误导机器学习的算法,认为这种事情是热点事件,从而增加其推荐的权重。
说了这么多,也许你会问,那这种推荐机制准吗?答案是肯定的,它确实能够有效地降低人们遇到“垃圾邮件”或者“垃圾话题”的概率。同时由于它是基于人群的数据分析,所以对于个人而言,也并没有什么可讳言的。不过作为一个有良知的企业,facebook应该会在确保用户体验的前提下,尽力避免过度推荐。