Press "Enter" to skip to content

知识图谱+社交网络分析

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

干货提要

 

1、秒针在消费者洞察方面的能力:

 

a) 信息获取方面:社会化数据能力始终领先行业,且拥有各类社交数据源。

 

b) 信息处理方面:拥有标准化、系统化的去水去噪流程及人工支持,实现数据分类准确性;同时利用NLP自然语义分析系统,系统化实现情感分类判定。

 

c) 数据展示方面,拥有多套成熟的解决方案。

 

2、知识图谱如何在洞察市场辅助决策中应用

 

通过知识图谱,构建行业百科全书,实现即时的信息搜索与趋势发现。不仅可以避免人工定义的局限性,更能够从数据自身出发挖掘内容,且能胜任在多种应用场景中的探索式分析,为产品、品牌、市场,等各个部门提供决策依据。

 

知识图谱的应用场景

 

以辅食为例,我们可以看到消费者在谈及辅食时都关心哪些内容,市面上的辅食有哪些类型,不同月龄的宝宝选择什幺,以及当我们想在微博上发布一些辅食菜谱分享时,有哪些KOL可以使用。从这里可以看出,知识图谱能够根据使用者的目的不同,来完成不同的分析任务,当这个母婴图谱被产研部门使用时,可以用来探索热门的产品形式、产品口味、营养搭配等信息,为新产品的开发提供方向;给市场部门使用时,可以作为KOL推荐,产品卖点的策略推荐。当这个图谱被品牌部门使用时,可以用来分析竞品的市场表现、投放策略、产品布局等信息。

 

知识图谱的另一个应用,是在人群分析的场景。在人群关系图谱中,我们可以将关注关系、互动关系、合作关系等导入图谱,形成一个庞大的关系网络。在这个网络中,通过推演发现,例如:明星的共同粉丝、综艺的粉丝,或者参加相同活动的人,对这个图谱进行进一步的扩充,同时,维持图谱人群的更新。得到一个大的人群关系图谱后,通过社群的聚集模型算法,将大的人群分成一个个相对较小、联系更加紧密的社群,并通过中心度的算法,找到每个社群中的关键人物。

 

社交网络结构分析与建模

 

社交网络模型许多概念来自于图论,因为社交网络模型本质上是一个由节点(人)和边(社交关系)组成的图。笔者将简要介绍社交网络模型中常用的统计概念。

度(Degree):节点的度定义为与该节点相连的边的数目。在有向图中,所有指向某节点的边的数量叫作该节点的入度,所有从该节点出发指向别的节点的边的数量叫作该节点的出度。网络平均度反应了网络的疏密程度,而通过度分布则可以刻画不同节点的重要性。
网络密度(Density):网络密度可以用于刻画节点间相互连边的密集程度,定义为网络中实际存在边数与可容纳边数上限的比值,常用来测量社交网络中社交关系的密集程度及演化趋势。
聚类系数(Clustering Coefficient):用于描述网络中与同一节点相连的节点间也互为相邻节点的程度。其用于刻画社交网络中一个人朋友们之间也互相是朋友的概率,反应了社交网络中的聚集性。
介数(Betweeness):为图中某节点承载整个图所有最短路径的数量,通常用来评价节点的重要程度,比如在连接不同社群之间的中介节点的介数相对于其他节点来说会非常大,也体现了其在社交网络信息传递中的重要程度。

社区静态发现算法

 

模块度最优化算法
Mark Newman 提出了针对模块度的最大化的贪心算法FN。可参考文献:Newman,Mark EJ. “Fast algorithm for detecting community structure innetworks.” Physical review E 69.6 (2004): 066133.

 

多目标优化算法
Zhao, Yuxin, et al. “Acellular learning automata based algorithm for detecting community structure incomplex networks.” Neurocomputing 151 (2015): 1216-1226.

 

Du, Jingfei, Jianyang Lai,and Chuan Shi. “Multi-Objective Optimization for Overlapping CommunityDetection.” International Conference on Advanced Data Mining andApplications. Springer, Berlin, Heidelberg, 2013.

 

基于概率模型的算法
Newman, Mark EJ, andElizabeth A. Leicht. “Mixture models and exploratory analysis innetworks.” Proceedings of the National Academy of Sciences104.23(2007): 9564-9569.

 

Ren,Wei, et al. “Simple probabilistic algorithm for detecting communitystructure.” Physical Review E 79.3 (2009): 036111.

 

信息编码算法
Rosvall, Martin, and Carl T.Bergstrom. “Maps of random walks on complex networks reveal communitystructure.” Proceedings of the National Academy of Sciences 105.4(2008): 1118-1123.

 

Kim, Youngdo, and HawoongJeong. “Map equation for link communities.” Physical Review E 84.2(2011): 026110.

 

2.4 社区动态发现算法

 

派系过滤算法
Palla, Gergely, et al.”Uncovering the overlapping community structure of complex networks innature and society.” arXiv preprint physics/0506133(2005).

 

Kumpula,Jussi M., et al. “Sequential algorithm for fast cliquepercolation.” Physical Review E 78.2 (2008): 026109.

 

基于相似度的聚合算法
Shen, Huawei, et al.”Detect overlapping and hierarchical community structure innetworks.” Physica A: Statistical Mechanics and its Applications388.8(2009): 1706-1712.

 

Huang,Jianbin, et al. “Density-based shrinkage for revealing hierarchical andoverlapping community structure in networks.” Physica A:Statistical Mechanics and its Applications 390.11 (2011): 2160-2171.

 

标签传播算法
Raghavan, Usha Nandini, RékaAlbert, and Soundar Kumara. “Near linear time algorithm to detectcommunity structures in large-scale networks.” Physical review E 76.3(2007): 036106.

 

Gregory, Steve. “Finding overlapping communitiesin networks by label propagation.” New Journal of Physics 12.10(2010): 103018.

 

局部扩展优化算法
Lancichinetti, Andrea, andSanto Fortunato. “Benchmarks for testing community detection algorithms ondirected and weighted graphs with overlapping communities.” PhysicalReview E 80.1 (2009): 016118.

 

Lee,Conrad, et al. “Detecting highly overlapping community structure by greedyclique expansion.” arXiv preprint arXiv:1002.1827 (2010).

 

参考文献

冯允:技术共克时艰,知识图谱挖掘市场洞察,辅助企业决策 | 明略智能营销课程回顾
知识图谱 | (转)一文读懂社交网络分析

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注