事件社交网络:深度用户模型的内容事件推荐

论文《Deep User Modeling for Content-based Event Recommendation in Event-based Social Networks》的阅读笔记。

 

论文下载链接: https://pan.baidu.com/s/1vfBHx7zSsgBCZp8gdO6s-A

 

笔者从以下5点来表达对论文的理解和心得,以飨读者。

 

 

1 基本术语

 

事件社交网络(Event-based social networks (EBSNs)),一种新兴的社交平台 ,让用户在线发布活动,吸引本地城市的其他用户线下参加活动。例如我们所熟知的 meetup

 

推荐系统(recommender systems),一种解决用户信息过载而自主向用户推荐东西(电影,音乐,商品,人物,事件等)的系统。例如我们所知的Netflix,Pandora,亚马逊,FaceBook等。

 

词袋模型(bag-of-words model),一种常用的文本表示方法,它仅表示文本的词频,忽略了文本中词的顺序和句子结构,因此,它不能完全揭示文本的上下文信息。

 

卷积神经网络(Convolutional Neural Network),一种深度神经网络结构,利用卷积核进行特征表示,可以很好地考虑特征的位置和时空关系,适合于解决图像识别,NLP和语音识别等问题。

 

概率矩阵分解(Probabilistic Matrix Factorization),是现代推荐系统的基础算法之一。基于两个假设设计模型,一是观测噪声(观测评分矩阵和近似评分矩阵之差)满足高斯分布;二是用户属性U和项目属性I均服从高斯分布。通过最大化后验概率估计出U和I。

 

2 为什幺做这个研究?

 

首先,看一下这个研究的价值:

 

事件社交平台有着海量的事件,给用户推荐感兴趣的事件,对解决用户的信息过载和提升用户的参与度,非常的有价值。

 

推荐系统,不是一个陌生的领域。前辈们已经做了很深入地研究,并且也诞生了很多有巨大商业价值的产品和服务。

 

但是, 事件的独特性 使得事件推荐相比传统推荐(电影推荐|商品推荐等)有着更大的挑战性。

 

第一个独特性:EBSN中每个事件的生命周期都很短,需要在事件开始之前进行事件推荐。也就是说,事件的时间特性,决定事件推荐的难点之一。

 

第二个独特性:由于事件推荐发生在事件开始之前,那幺基于事件评分或者评论的经典推荐方法在EBSN是无用的,换句话说,这些经典的推荐算法就不能直接应用到事件推荐,事件的冷启动造就了事件推荐的难点之二。

 

总之,事件推荐是个有价值的问题,事件推荐的难点由事件的独特性所决定。

 

接下来,看一下事件推荐的当前研究现状:

 

基于事件的内容对事件推荐其中重要作用,出现了一些基于事件内容的事件推荐方法。算法设计的思路,基本上是: 事件的内容方法+现有推荐算法 ,以计算事件之间的相似分实现推荐。但是,这类方法不是那幺有效,一是新事件的冷启动特质;二是事件的短生命周期特性。

 

虽然事件生命周期短,但是事件社交平台上面的用户具有很强的生命周期,这些用户会参加多个事件。基于这个事实, 启发从用户的角度出发,探索和挖掘用户对事件的兴趣偏好以实现事件推荐 。利用上下文信息,从用户角度获得对事件的偏好比基于新事件和历史事件之间的相似性推荐事件更为合理。

 

如何基于上下文信息,从用户角度获得其对事件的偏好呢?这是本论文的关键点和创新点。在后续会介绍。

 

3 怎幺做这个研究?

 

做这个研究的逻辑如下。

 

第一步:从用户角度出发,基于用户参与事件的上下文深挖用户对事件的潜在偏好,研究者采用词嵌入和卷积神经网络来构建深度用户模型。

 

第二步:把用户对事件的潜在偏好融合到PMF模型(现代推荐系统基础算法之一)以预测用户对事件的偏好

 

第三步:在实际数据集上面做实验,验证这个算法的有效性。

 

这个研究的算法框架如下图:

 

 

DUMER算法框架

 

为了理解这个研究逻辑,需要进一步阅读下面相关材料:

 

1 词嵌入算法,论文采用了斯坦福大学提出的GLoVE算法,论文链接:

 

https://nlp.stanford.edu/pubs/glove.pdf

 

2 CNN算法,可以阅读斯坦福大学的这个讲义。

 

https://web.stanford.edu/class/cs231a/lectures/intro_cnn.pdf

 

3 PMF算法,PMF论文链接:

 

https://papers.nips.cc/paper/3208-probabilistic-matrix-factorization.pdf

 

4 这个研究是什幺?

 

这个研究是 深度用户模型的内容事件推荐 。

 

关键词:事件推荐,深度用户潜在偏好模型,词嵌入算法,卷积神经网络,PMF算法

 

结果集:模型性能的评价,采用RMSE,Rcall,NDCG三个评价指标。

 

5 这个研究的启发是什幺?

 

这个研究给予我三点启发。 一是, 推荐系统归根结底就是要解决用户项目的最佳匹配问题 ,因而,针对具体的应用场景,我们要充分地挖掘用户和项目的特性,有时候,我们从用户的角度入手,有时候我们从项目的角度入手,有时候我们两者兼而用之。

 

二是, 针对不同的推荐场景,用户和项目的特性会有有着不同的描述形式 。比方说,本文基于事件的推荐,数据的形态更多是文本,不管是从文本来描述用户,还是从文本来描述项目,如何基于文本深挖出用户或者项目的特征集,以构建它们之间的关联性,这是值得深入思考的问题。同时,基于文本这种数据形态,有哪些算法可以有效地进行处理,论文中介绍的文本向量化,词袋模型和卷积神经网络等。

 

三是,试想,对于我们所研究的东西,结合深度学习的思想, 能否设计一系列深度表示的算法和模型 ,以有效解决具体场景下的有价值问题。

发表评论

电子邮件地址不会被公开。 必填项已用*标注