知洋娱乐:微博热门的新浪社区有什么发现?相信不少人是有疑问的,今天深圳市知洋文化传媒有限公司就跟大家解答一下!
知洋娱乐:微博热门的新浪社区有什么发现如下:
新浪微博社区是指在新浪微博中关系紧密的人组成的团体,社区内部的人之间联系紧密,社区之间的联系则比较稀疏。
这里所指的关系紧密有两层含义:
1、社区内部的人之间的兴趣相似度大;
2、指社区内部的人之间的关系要近,比如要求社区内部的两个用户粉丝不能超过二度关联,二度关联即好友的好友。
兴趣相似度在上文已有叙述,关系相似度则需要利用用户粉丝之间的关注关系来进行计算,以用户粉丝的关注关系为单向链,可以将所有的新浪微博用户粉丝之间的关系表示为一个巨大的有向图,用户粉丝之间的关系相似度可以简单的考虑,比如使用用户粉丝间的最短路径的倒数。
但是这种方法衡量的不精确,我们知道,在现实世界中,存在着六度理论,在新浪微博网络及其他社交网络中,往往关系会更加紧密,因而这种简单的关系相似度只能有至多六个离散值,显然不够精确,微博热门的新浪社区有什么发现?接下来就跟着知洋娱乐小编一起来看下吧!
为了达到更好的效果,这里不仅以最短路径作为显式量度,还要考虑一些隐式的量度,这里先给出两个假设:
两个用户粉丝的共同粉丝越多,这两个好友的关系相似度越高。
这里可以借鉴Jaccard相似度的计算方式,将这两种假设的量化函数表示为交集的大小与并集的大小之商,以假设为例,其量化指标又被称为共指向性相似度,量化时使用两个用户粉丝共同好友的数目除以两个用户粉丝所有好友的数目。
假设的量化指标被称为共被指向性相似度,计算方式与共指向性相似度类似,从意义上讲,这两种相似度不仅仅是关系上的度量,在一定程度上也衡量了用户粉丝之间的兴趣相似程度,直观上看,两个用户粉丝共同关注的好友越多,他们的兴趣相似程度也越大,这两种相似度还有一个专业的名字,是基于结构情景的相似度计算。
得到了最短路径相似度、共指向性相似度、共被指向性相似度后,可以采用一种加权函数将它们融合起来,得到最后的相似度。
之后可以采用一些聚类微博算法,比如K-Means、DBSCAN等进行聚类操作,得到最后的社区簇,也可以采用相似度加权的标签传播微博算法,把具有相同标签的人作为一个社区。
以上就是深圳市知洋文化传媒有限公司小编给你们介绍的知洋娱乐:微博热门的新浪社区有什么发现,希望大家看后有所帮助!