APP推广合作
联系“鸟哥笔记小乔”
深度好文:揭秘微信“朋友在看”背后的推荐逻辑
2020-09-14 11:22:11

本文基于ECML-PKDD-2020论文《Social Influence Attentive Neural Network for Friend-Enhanced Recommendation》,由北京邮电大学、腾讯微信、新加坡管理大学合作完成。


作者 | 陆元福
来源 | 北邮 GAMMA Lab(BUPT_GAMMA)

导语

随着在线社交网络的兴起,许多社交应用程序中出现了一种新的基于社交的推荐方式,微信看一看推荐系统中的朋友在看就是其代表应用之一。在本文中,我们将微信看一看的朋友在看推荐称为“好友增强型推荐(Friend-Enhanced Recommendation,FER)”。在 FER 中,对于某一从未交互过的商品,用户显式可见其好友对该商品的交互行为(这些好友被称作好友推荐圈),例如微信“看一看”场景下的文章推荐场景。与传统社交推荐不同, FER 中特有的好友推荐圈可能会因为其重要性和可解释性而显着改变推荐结果。

针对这一好友增强型推荐场景,作者提出了一种新颖的社交影响力专注的神经网络(SIAN)。SIAN从异质信息网络的角度建模推荐场景,构建了注意力特征聚合器,其对多类型的异质信息进行节点级和类型级的特征聚合,并学习得到用户和商品的向量表示。更重要的是,SIAN模型设计了一个社交影响力耦合器,以专心地捕捉好友推荐圈的影响力。

基于两个公开数据集和一个看一看的数据,作者进行了丰富的实验分析,模型与对比方法相比,均有显著提升。尤其是,在看一看数据集上,作者进行了一些定量分析讨论,并得到了一些有趣的发现以及有价值的社会学模式。

背景简介

当下,随着在线社交网络的兴起,人们更愿意在社交平台上表达自己的观点并与好友共享信息。好友成为重要的信息来源和高质量的信息过滤器。好友互动过的商品(共享的,喜欢的等)会对用户产生重大影响,这很可能会成为用户未来的兴趣所在。工业界,也有许多推荐系统专注于好友的社交影响,例如,关注 YouTube中的信息流和微信中的“看一看”文章推荐。

在本文中,作者基于微信“看一看”文章推荐场景,形式化了一个全新的推荐场景,叫做好友增强的推荐系统(Friend-Enhanced Recommendation,FER),其大大增强了推荐系统中好友对用户行为的影响力。相较于传统的社交化推荐,好友增强推荐两个主要区别

(1)鉴于好友可以看作高质量信息过滤器为用户提供高质量的商品,好友增强推荐只为用户推荐好友交互过的商品(读过的文章);

(2)与某一商品交互过的所有好友都会显式的展示给当前用户,即当前用户已知哪些好友与当前物品有过交互。这一特点重点强调了显式的社交影响力对用户行为的影响,这也有益于用户行为的可解释性。

图1. 好友增强性型推荐场景


左侧显示了推荐给 Jerry 的两篇文章的场景,下面是与两篇文章互动(共享,喜欢等)的朋友(如 Tom)。右侧显示了好友增强推荐问题的形式化,其中仅推荐朋友交互过的文章,并且与该项目进行交互的朋友被明确暴露给用户 Jerry。

图 1 展示了微信“看一看”场景下的一个形式化示例。对于每一个用户-物品对,好友增强型推荐显式地展示已经和当前物品交互过的好友集合,这个集合被定义为:针对当前商品,当前用户的好友推荐圈(Friend Referral Circle, FRC)。举例来说,对于关于AirPods的文章,Jerry的好友推荐圈是{Tom, Lily, Jack}。在传统社交推荐中,好友推荐圈对于 Jerry是不可见的(不会展示给Jerry),因此Jerry可能会基于自身的兴趣阅读某一篇文章。然而,在好友增强型推荐场景中,好友推荐圈对用户Jerry是显式可见的,因此他阅读这篇关于AirPods的文章,更可能是因为科技专家Tom读过这篇文章。而Jerry阅读一篇关于 Disneyland的文章,完全有可能是因为他的妻子Lily读过这篇文章。更进一步地,当文章与科技相关时,相较于妻子和科技文章,专家和文章的同时出现对 Jerry 的耦合影响力更大,而在娱乐方面,可能是完全相反的情况。

因此,在好友增强型推荐场景中,多个因素导致了用户的行为。用户阅读/点击一篇文章的原因可能来自

(1)其自身对文章的兴趣(文章本身);

(2)专家的推荐(文章-好友的组合);

(3)对某一好友的关注(好友);

可以看到,在好友增强型推荐场景中,用户有窥探好友在看的内容的倾向,而非仅仅看自己本身感兴趣的内容。甚至可以说,传统社交推荐关注于结合社交信息去推荐物品,而好友增强的推荐旨在推荐物品和好友的组合。

作为好友增强型推荐的关键特性,显式的好友推荐圈为该推荐场景带来两个挑战:

(1)如何从多方面的异质因素中提取关键信息?好友增强的推荐场景涉及多个异质目标,例如物品内容,好友推荐圈及用户-物品交互行为等。在用户,物品和朋友推荐圈的不同组合下,这些因素的影响甚至也有所不同。因此好友增强的 推荐场景更具挑战性,因为它不仅需要学习用户对商品的偏好,还需要预测不同 因素对好友的影响。

(2)如何利用显式的好友推荐圈信息?显式的好友推荐圈推荐极大地强调了推荐中社交信息的重要性,这在好友增强的推荐场景中是至关重要。但是,很少有工作在实际推荐中探索好友推荐圈的影响和特性。因此需要一种精心设计的策略,以充分利用好友增强的推荐场景中的显式的好友推荐圈信息。

为了解决这些问题,作者提出了一种新颖的社交影响力专注的神经网络(SIAN)。具体来说, SIAN将好友增强推荐定义为异质社交图上的用户-物品交互预测任务,该任务将丰富的异质信息灵活地集成到异质对象及其交互连接中。首先,作者设计了一个注意力特征聚合器,它同时考虑节点级和类型级的特征聚合,以学习用户和物品的表示向量。接下来,作者实现了一个社交影响力耦合器,以建模通过显式好友推荐圈传播的耦合影响力,该耦合器利用注意力机制将多种因素(例如,朋友和物品)的影响力耦合在一起。总体而言,SIAN 模型捕获了好友增强的推荐场景中有价值的多方面因素,从而成功地从异质信息网络和显式好友推荐圈中提取了用户的最基本偏好。

模型结构

图2. 模型SIAN总览


首先,考虑到相同类型的不同邻居可能对特征聚合的贡献是不同的,并且不同类型包含多方面的信息,因此作者设计了分层的节点级和类型级的注意力特征聚合器。在每个级别,注意力机制区分和捕获邻居和类型的潜在关联性,使得 SIAN 模型能够更细粒度地编码多方面的异质信息。与之前的一些工作不同的是, SIAN 不需要基于任何先验知识手动选择元路径。

其次,作者设计了一个社交影响力耦合器,其用来捕获一个有影响力好友(例如 Tom)和一个物品(例如 Disneyland 相关文章)的耦合影响力, 从而量化它们的耦合影响力程度。最后,带有注意力地融合来自好友推荐圈内的多个耦合影响力,以表示整个好友推荐圈对当前用户和物品的影响。

实验分析

基于两个公开数据集(Yelp和Douban)以及微信看一看数据(FWD),作者进行了丰富的实验评估和分析。数据集统计信息见下表1。

表1. 数据集统计


在主实验中,作者对比了四类代表性的方法,并报告了在不同表示维下的模型表现,结果可以见表2。可以看到,在多个数据集上,提出的SIAN模型明显优于对比方法。特别是,和传统社会化推荐方法相比,SIAN模型依然表现突出,这得益于社交影响力耦合器在为好友增强推荐场景编码各种社交因素时的能力,也这进一步证实了社交影响力在好友增强推荐中的重要性。

表2. 用户行为预测实验结果


其次,作者分析了多方面异质信息的影响。在注意力特征聚合器中,每个节点的向量表示都是从其具有不同权重的各种类型的异质邻居聚合而来的,作者分析发现:SIAN模型学习得到的好友类型的平均注意力权重值显著大于物品类型的平均注意力权重,这表明了SIAN模型更加关注用户的社交关系,也验证了好友推荐圈是好友增强推荐中最重要的因素。实验结果如图3所示。

图3. 多方面信息影响分析


更进一步地,在微信看一看数据集上,作者分析了不同的用户属性如何通过社交影响力耦合器的影响力强度来影响好友增强推荐场景中的用户行为,并得出了一些有趣的发现。例如,在图4(a)中,可以观察到用户行为受到更具权威性的朋友的影响, 而与用户自己的权威度无关。同时,高权威朋友对中等权威用户具有更大的影响力,用户通常更容易受到权威人士的影响,这和我们的常识也是相符的。因此,在好友增强推荐场景中,可能存在一个有趣的现象,即有时用户会更多地关注老板或某一权威人士的喜好,而不是他们自己的实际喜好。我们也观察到其它用户基础属性对于好友增强推荐场景中的用户行为产生影响。

图4. 社交影响力分析

总结

在这一工作中,作者首次形式化定义了微信看一看中的推荐场景,即好友增强型推荐,其显式地展示已经和当前物品交互过的好友。针对这一新型且应用广泛的推荐场景,作者提出了社交影响力注意的神经网络SIAN,SIAN模型通过一个两级注意力聚合器学习user和item的表示,并设计了一个社交影响力耦合器的用于提取朋友推荐圈中的影响力信息。实验结果表明,在三个真实的数据集上,SIAN的性能明显优于最新基准,丰富的模型分析揭示出有趣的社会学模式。

我们认为未来以微信看一看朋友在看为代表的好友增强型推荐将会成为人们获取信息的重要方式,通过推荐连接用户与世界。现在对好友增强型推荐的研究仅仅处于初级阶段,我们希望未来能有更多新的研究工作与分析。

参考文献:

[1] Chen, Chong, et al. "Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 34. No. 01. 2020.


[2] Dong, Yuxiao, Nitesh V. Chawla, and Ananthram Swami. "metapath2vec: Scalable representation learning for heterogeneous networks." Proceedings of the 23rd ACM SIGKDD international conference on knowledge discovery and data mining. 2017.


[3] Fan, Wenqi, et al. "Graph neural networks for social recommendation." The World Wide Web Conference. 2019.


[4] Grover, Aditya, and Jure Leskovec. "node2vec: Scalable feature learning for networks." Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining. 2016.


[5] Kipf, Thomas N., and Max Welling. "Semi-supervised classification with graph convolutional networks." arXiv preprint arXiv:1609.02907 (2016).


[6] Perozzi, Bryan, Rami Al-Rfou, and Steven Skiena. "Deepwalk: Online learning of social representations." Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014.


[7] Shi, Chuan, et al. "Heterogeneous information network embedding for recommendation." IEEE Transactions on Knowledge and Data Engineering 31.2 (2018): 357-370.


[8] Veličković, Petar, et al. "Graph attention networks." arXiv preprint arXiv:1710.10903 (2017).


[9] Wang, Xiao, et al. "Heterogeneous graph attention network." The World Wide Web Conference. 2019


[10] Wu, Le, et al. "A neural influence diffusion model for social recommendation." Proceedings of the 42nd international ACM SIGIR conference on research and development in information retrieval. 2019.


[11] Xiao, Wenyi, et al. "Beyond personalization: Social content recommendation for creator equality and consumer satisfaction." Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2019.



-END-


鸟哥笔记,职场成长,刘润,成长,职场,思维,总结,工作

运营那些事儿
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
运营那些事儿
运营那些事儿
发表文章43456
确认要消耗 0羽毛购买
深度好文:揭秘微信“朋友在看”背后的推荐逻辑吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接