当前位置: 首页 » 资讯 » 行业资讯 » 正文

网络短文本(UGC)中用户意图发现及其在商品推荐中的应用 北京大学 王锦鹏

放大字体  缩小字体 发布日期:2015-11-20  作者:17小编整理  浏览次数:673
核心提示:徐小良:接下来我们有请王锦鹏博士,王博士是北京大学网络和信息系统的研究生,他是在读的博士,他跟我们分享的是《网络短文本中
 

    徐小良:
    接下来我们有请王锦鹏博士,王博士是北京大学网络和信息系统的研究生,他是在读的博士,他跟我们分享的是《网络短文本中用户意图发现及其在商品推荐中的应用》,掌声有请!
    
    王锦鹏:
    谢谢大家,刚才听到几位大咖的演讲受益匪浅,我班门弄斧,讲一个我们最近在做的小应用,就是微博和数字营销相结合的应用,是做商品精准推荐的。
    大家知道电子商务现在火的一塌糊涂,在电子商务中有一项比较重要的技术,就是商品的推荐。下面这两个图,是在亚马逊和京东上面的商品推荐图。当一个用户在这些网站上进行消费,我再次来到这个网站,这个网站给我做一些相关的推荐。
    比如说这里我买了一个相机,我国际天上这个网站,它给我推荐储存卡等等。商品推荐的好处,它可以提升用户体验,有时候用户不知道自己想买什么东西,但是网站就给我推荐一些东西出来,我一看很合适,然后我就买了。
    另外一个好处非常明显,它可以盘活电子商务网站的流量,也可以给电子商务网站带来很多销量的提升,这个好处非常的明显。但是我们这里也意识到它的问题,就是电子商务网站它的推荐系统是集成在自己网站上的。也就是说,当一个用户他在这个网站上的时候,我可以给他推荐。但是如果他没有来我这个网站,我没法给他推荐,这就带来一个问题。比如说现在我们很多人上网并不是每天都会去电子商务网站,我可能浏览是用邮箱,我可能用微信或者是微博,把我大多数在互联网的时间都投入在社交网站上,而不是在电子商务网站上面。
    这样就带来一个问题,比如说一个用户我在社交网站上有买东西的意图,这时候电子商务网站无法给精准的推荐,这就错失了营销的机会。我们也知道社交网站它的浏览量比电子商务网站高很多。
    也有研究表明,用户在社交网站上倾向于表达自己的意图。大家可以想一想,很多人会在微博上表达,我想买某种手机,我想买摄影机让大家来推荐,或者是大家看了某一部电视剧受到里面的影响,突发奇想跟朋友表达说,我也想买这样的商品。
    还有一个问题,在社交网站上面,可能会有很多用户注册的信息,用户在网站上面会填写自己的兴趣、爱好、职业等等。用户经常说一些自己关注的话题等等。这些信息都是非常有用的,可以用来做精准的营销。
    这是我们总结出的,目前传统电商网站商品推荐的一点不足。在这样一个实践中,我们做了尝试想联合在线的社交网站,比如说微博、FaceBook等等来做精准推荐,增大产品的曝光受众率。
    它的好处是在这些社交网站上,用户的意图能够及时的捕获进来,进而推荐,这两类网站联合也可以扩大受众面。这里有一个好处,就是可以大大的增大用户的冲动消费,用户一旦在社交网站表露自己的意图,我们马上做精准的推荐,让他有更多的机会做冲动消费提升销量。
    目前我们做的尝试就是在微博和京东做推荐,左边这个图是微博上用户的信息。还有就是用户表达说想买一个手机,比如说这里所说的,他想给他妈妈买一个手机,还提了要求。另外一个微博是受雾霾的影响,他想买口罩,我们可以用这些信息做精准推荐,用户的意图也可以从文本里面捕获。
    还有一个很重要的特点,微博它的更新量非常大,每天都是实时更新的,我们能够非常及时的来捕获用户的意图,这是很重要的点。右边这个图是京东上的用户购买之后的商品评论,我们可以看到用户可能会对它做一些评价,它非常耗用等等各种特性,这是用户的口碑评价。如果我们能够把这些特性,以及用户在微博上提的要求匹配上来,可以做更好的推荐。
    另外一个很重要的点,用户说剃须刀是给她老公买的,我们从从评论里面推测到这样一个商品,它的受众是怎样的群体。可能这个剃须刀是给中年人用的,有的是给老年人用的,我们可以从商品评论里面提取很多信息,一方面是商品的特性,一方面是商品的受众。我们想联合利用这两种信息,利用商品的特性做精准营销,把用户在微博上的注册信息和商品的受众进行联合,这样两层信息的联合来做非常精准的推荐。
    先来看一下我们现在做的系统,左边这个图是很多用户发表的微博,里面有一些微博是平时的吐槽或者是带有购买意图的。比如说第二个微博,说他儿子想给他买一个手机,他不知道买什么,想让大家做一个推荐,这里我们提取他的需求,看他的注册信息,他是一位年长者,他想买一部手机,他没有提其他的需求。我们根据他的需求从京东购买评论里面做分析,分析哪一类手机适合这个年龄段的人来使用。从分析里面,我们发现偏暗色的手机比较适合年长者使用,字体要大,而且是非智能手机。右下角的图是我们给用户推荐的商品列表,可以看到这些手机都是比较适合的。
    第二个例子,这是一个人看了一部电影,他说他想买一部手机,两到三千块钱,黑色的,这里我们提取它的需求,我们看这个人的注册信息,他是金融男生,他想买手机,还有他对颜色、价格都提出了一些需求恩,我们这边进而做一些推荐,这是非常符合他的需求的。
    还有一个例子,这是一个男生,他想给他的女朋友买手机,这不是他本人想买,是给他的女朋友买的。我们从评论里面挖掘,发现哪一类手机是适合女生使用的,进而给他做一个推荐。目前我们支持一些偏自然语言和偏口语查询的检索,我们可以把这样一个查询,给女朋友的漂亮手机进行查询,最后反馈出来商品的检索列表。
    可以看到这里的查询,我们把女朋友也扩展到媳妇和女友的查询词,外形好看也扩展到了美观或者是漂亮形容词,增大检索的效果。
    这是京东的案例,它目前不支持这样的口语化查询,这是我们系统的技术点,我可能不会讲的太详细,系统主要由三部分构成,一部分是微博用户的意图识别,我们需要实时识别出用户的购买意图,对那些有购买意图的微博进行商品推荐。最下面这部分是我们对每个商品和用户绿色信息做一些挖掘储存下来,以供在线推荐使用,中间这部分是在线推荐部分。
    下面我们稍微点一下,在购买意图识别方面,我们之前也做过很多的技术尝试,我们最早是通过规则来做,后来我们发现规则有一些不足,用户语言多边有很多新的词,后来我们用了自动学习规则的技术来解决意图识别的事情。
    对拥护和商品信息的挖掘,我们这里是对大量的微博用户信息和京东的购买记录进行挖掘的。比如说第一个图是微博用户信息,第二个是京东购买记录里面的受众信息。我们通过这两种信息提取出各种属性出来,最后对这两种属性进行匹配,我们对三星手机做了受众挖掘,可以发现这一部手机是白色的,可能是比较适合女生的。最后一个技术点是在线推荐部分,这是我们用一些决策树分类排序做商品的排序和推荐,这是主要的工作。
    最后做一个总结,在小的尝试中,我们实时检测用户微博中的购买意图,对他进行商品推荐。这是跨两类网站的系统,在线的社交引擎和商品,这两类网站的推荐。它的技术其实不止适用于微博,也适合很多其他的场景。比如说QQ聊天场景、微信或者其他很多社交网站都是同样适用的,我主要讲这些内容,谢谢大家。
    
    提问:
    在京东和微博上怎么样识别这是同一个顾客呢?
    
    王锦鹏:
    如果能够识别这两个网站是同一个人,可以大大的增强推荐的效果。但是目前的数据是非常困难的,我们很难有一家公司同时能够拥有这两类网站的数据,很难识别是同一个用户,我们做的推荐其实是基于用户注册信息。比如说用户他的专业或者是他的年龄、性别,我们采取这些注册信息跟商品受众进行匹配,用这样的信息来匹配做推荐,目前没有做同一个用户的匹配,我们避开了这个问题。
    
    提问:
    推荐系统很好,我问两个问题,一个是你怎么评估你推荐的成功率,第二个是你如何做优化提高推荐的效果呢?
    
    王锦鹏:
    目前我们所做的是离线评测的方法,举一个例子,我们有京东大概几亿条购买数据,我们只用几千万条来做训练,用后面的一个多亿条做测试,来做离线的模拟,模拟推荐的效果好不好。目前我们正在跟一些公司谈合作,如果成功以后我们可以做线上的测试,直接在真实的场景下来看看这个系统效果好不好。
    第二个问题是增强推荐效果,目前我们主要是根据离线的实验,以及比较好的基础模型做对比看看效果好不好,以及增大用户购买意图的识别和特征提取等等这样一些手段来提升推荐效果。
    
    徐小良:
    为什么王博士那么年轻站到第九届双年会重要的舞台上,为什么在宝洁论文奖里面设有学生组和专业组,不仅仅是因为这些年轻的精英对这块有兴趣和研究,同时也是我们行业的前辈们,他们为我们行业培养新鲜血液,引领一些人爱上研究、痴迷研究,不断的为我们这个行业输送优秀人才,发展和壮大我们的行业,我们共同为行业的前辈们和年轻的新生代们鼓掌。

 
 
[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 

 
推荐视频
推荐资讯
点击排行
 
分享按钮