Multiview Deep Learning for Cross Domain User Modeling in RS(MV-dssm)背景概要

Abstract:

根据用户在web上的浏览信息和搜索信息提取出用户的特征集(feature set)用来表征用户。用一种深度学习的方法把用户和item投影到一个潜在空间,使得在这个潜在空间中用户和用户偏爱的item的相似度是最大的。multi-view deep learning model 模型会学习用户特征以及来自不同domain的item的特征。(同时,通过减少输入的维度以及训练数据的大小,这种基于大量丰富特征的用户表征也具有可拓展性。)这种用户特征表征可以让模型学习到相关的用户行为模式,即使用户在某一个domain里面没有任何行为,只要该用户有足够多的浏览和搜索历史记录,就能为用户进行比较满意的推荐。把不同的domain融合成一个模型有两个好处:一是提高对于所有domain的推荐系统的质量,二是可以生成更简洁更具有语义丰富性的用户特征向量。效果:将这种方法运用到了微软的三个推荐系统Windows APP推荐 News推荐 和 Movie/TV推荐,对于现存用户提升49%,对于新用户提升115%。对于一些开源数据集,相比于传统的生成主题模型,mv模型也显示出了优越性。可拓展性分析表明这种模型可以很轻松扩展到数百万级的用户和十亿级的item。实验结果表明,融合不同domain的特征去训练model,比单独为每一个domain训练各自的model的表现更好。

INTRODUCTION

在线网络服务中推荐系统和内容个性化扮演着越来越重要的角色。一个比较主流的方法是协同过滤,利用用户在web上的历史行为来为用户推荐最相关的内容。更具体来说,基于物品的协同过滤就是通过用户对物品的行为数据来计算物品与物品之间的相似度,为用户推荐喜欢的物品相似的物品,举个例子如果一个用户喜欢物品A的同时也喜欢物品B那么就认为物品A与物品B相似,基于用户的协同过滤就是通过物品的对用户的行为数据来计算用户与用户的相似度,为用户推荐相似用户喜欢的物品。除此之外还有一种主流方法是基于内容的推荐,根据物品与物品特征上的相似度,比如说相同的topic,为用户推荐用户喜欢过的其他类似属性的物品。或者是,根据用户与用户特征上的相似度,比如说age,gender,location相似,可以为一个用户推荐与这个用户相似的用户喜欢过的物品。这些方法虽然也解决了很多的实际场景,但随着对推荐质量与个性化的不断追求与提升也面临着限制和挑战。
这些限制具体来说,CF在能够进行高质量推荐之前需要大量的历史数据,也就是面临着冷启动问题。而对于基于内容的推荐,是根据物品与物品属性的相似度,或者用户与用户属性的相似度去进行推荐的,可以很好地去避免冷启动的问题,但是用户级别的特征往往是从web上有限的用户画像中提取的,不能够很准确的捕捉到用户的兴趣。
所以论文提出了一种结合用户和物品特征的推荐系统。用户特征的构建不依赖于用户画像,而是通过用户的浏览搜索的历史记录来构建用户兴趣。这种方法的提前假设是,用户在线历史活动反映了用户的背景及偏爱,从而可以根据用户在线历史行为为用户提供更准确的推荐。比如,如果一个用户有着大量怀孕相关的搜索或者访问相关的网址,很可能就说明这个用户是一位孕妇。用户大量的线上浏览搜索记录能使推荐系统更加高效。
这个模型能够把用户和物品投影到一个共享的语意空间中,为用户推荐与用户相似度最大的物品。具体做法是将用户和物品用特征集表示,通过非线性转换层将其投影到共享的语意空间,使得在这个语意空间中用户与用户偏爱的物品的之间的相似度最大。这样可以让模型学习到很多有趣的映射,比如说经常访问fifa.com的人会偏爱阅读有关世界杯的News文章,会在PC或者Xbox上玩足球游戏。这些user侧的丰富的特征可以表征用户行为并且克服了基于内容推荐的一些限制。另外这种模型可以避免冷启动问题,因为模型可以从搜索浏览记录中捕捉用户特征用来推荐相关物品。
MV learning是指从不共享特征空间的多个domain中学习模型。MVDNN可以通过渗透多domain的数据来学习到更好的用户表征。实验结果表明mv模型的推荐质量同时高于各个领域单独的模型。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容