• 北大核心期刊(《中文核心期刊要目总览》2017版)
  • 中国科技核心期刊(中国科技论文统计源期刊)
  • JST 日本科学技术振兴机构数据库(日)收录期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于内容相似度的社区发现算法研究

钟磊

钟磊. 基于内容相似度的社区发现算法研究[J]. 微电子学与计算机, 2021, 38(4): 69-73.
引用本文: 钟磊. 基于内容相似度的社区发现算法研究[J]. 微电子学与计算机, 2021, 38(4): 69-73.
ZHONG Lei. Research on community detection algorithm based on content similarity[J]. Microelectronics & Computer, 2021, 38(4): 69-73.
Citation: ZHONG Lei. Research on community detection algorithm based on content similarity[J]. Microelectronics & Computer, 2021, 38(4): 69-73.

基于内容相似度的社区发现算法研究

基金项目: 

新疆社会科学基金项目 18BXW076

新疆高校研究项目 40031018

详细信息
    作者简介:

    钟磊 男(1980-),博士研究生,讲师.研究方向为信息管理和数据挖掘.E-mail: 873770090@qq.com

  • 中图分类号: TP301.6

Research on community detection algorithm based on content similarity

  • 摘要: 传统的社区发现算法中网络节点相似度多以空间距离度量,这种度量往往不容易理解,或者只能从距离的角度予以解释.本文提出一种基于文本内容相似度的谱聚类方法,它以网络社区用户的文本信息的相似性来度量网络节点的属性相似度,考虑网络结构的同时使节点的属性联系更有意义.在此基础上使用谱聚类的思想进行社区划分.本文以实际数据进行实验发现,发现划分结果的模块度和节点平均相似度较高,聚类效果良好.
  • 图  1  网络拓扑结构

    图  2  加权网络

    图  3  社区划分

    图  4  算法对比

    表  1  内容相似度矩阵

    节点 1 2 3 75
    1 0 0.21 0.6 0.05
    2 0.21 0 0.59 0.02
    3 0.6 0.59 0 0.12
    75 0.05 0.02 0.12 0
    下载: 导出CSV

    表  2  模块度和平均相似度比较

    初始社区数 模块度 平均相似度
    2 0.212 0.346
    5 0.329 0.382
    8 0.298 0.362
    11 0.281 0.379
    下载: 导出CSV
  • [1] 中国互联网络信息中心. 第43次中国互联网络发展状况统计报告[R]. 北京: 中国互联网络信息中心, 2019.

    CNNIC. The 43rd statistical report on the development of internet in China[R]. Beijing: CNNIC, 2019.
    [2] FORTUNATOS. Community detection in graphs[J]. Physics Reports, 2010, 486(3-5): 75-174. DOI:  10.1016/j.physrep.2009.11.002.
    [3] FIEDLER M. Algebraic connectivity of graphs[J]. Czechoslovak Mathematical Journal, 1973, 23(98): 298-305. DOI:  10.21136/CMJ.1973.101168.
    [4] GIRVAN M, NEWMAN M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(12): 7821-7826. DOI: 10.1073/pnas.122653799.
    [5] SHANG R H, BAI J, JIAO L C, et al. Communitydetection based on modularity and an improved genetic algorithm[J]. Physica A: Statistical MechanicsandItsApplications, 2013, 392(5): 1215-1231. DOI:  10.1016/j.physa.2012.11.003.
    [6] LANCICHINETTI A, FORTUNATO S, KERTLSZ J. Detecting the overlapping and hierarchical community structure in complexnetworks[J]. New Journal of Physics, 2009, 11(3): 033015. DOI:  10.1088/1367-2630/11/3/033015.
    [7] 解诌, 汪小帆. 复杂网络的一种快速局部社团划分算法[J]. 计算机仿真, 2007, 24(11): 82-85. DOI: 10.3969/j.issn.1006-9348.2007.11.026.

    XIE Z, WANG X F. A fast algorithm for detecting local community structure in complex networks[J]. Computer Simulation, 2007, 24(11): 82-85. DOI:  10.3969/j.issn.1006-9348.2007.11.026.
    [8] 张思源, 覃森, 张智丰. 基于邻居节点相异性的社团发现新算法基于邻居节点相异性的社区发现新算法[J]. 杭州电子科技大学学报(自然科学版), 2018, 38(05): 98-102. DOI:  10.13954/j.cnki.hdu.2018.05.019.

    ZHANG S Y, QIN S, ZHANG Z F. A new algorithm for community detecting based on neighbor node dissimilarity[J]. Journal of Hangzhou Dianzi University (NaturalScience), 2018, 38(5): 98-102. DOI:  10.13954/j.cnki.hdu.2018.05.019.
    [9] 姜雅文, 贾彩燕, 于剑. 基于节点相似度的网络社团检测算法研究[J]. 计算机科学, 2011, 38(7): 185-189. DOI:  10.3969/j.issn.1002-137X.2011.07.041.

    JIANG Y W, JIA C Y, YU J. Community detection in complex networks based on vertex similarities[J]. Computer Science, 2011, 38(7): 185-189. DOI:  10.3969/j.issn.1002-137X.2011.07.041.
    [10] 陈东明, 王云开, 黄新宇, 等. 基于社团密合度的复杂网络社团发现算法[J]. 东北大学学报(自然科学版), 2019, 40(2): 186-191. DOI:  10.12068/j.issn.1005-3026.2019.02.007.

    CHEN D M, WANG Y K, HUANG X Y, et al. Community detection algorithm for complex networks based on group density[J]. Journal of Northeastern University (Natural Science), 2019, 40(2): 186-191. DOI:  10.12068/j.issn.1005-3026.2019.02.007.
    [11] 孟彩霞, 李楠楠, 张琰. 基于复杂网络的社区发现算法研究[J]. 计算机技术与发展, 2020, 30(1): 82-86. DOI:  10.3969/j.issn.1673-629X.2020.01.015.

    MENG C X, LI N N, ZHANG Y. Research on community detection algorithm based on complex network[J]. Computer Technology and Development, 2020, 30(1): 82-86. DOI:  10.3969/j.issn.1673-629X.2020.01.015.
    [12] HONG L J, DAVISON BD. Empirical study of topic modeling in Twitter[C]//Proceedings of the 1st Workshop on Social Media Analytics. Washington, DC, USA: ACM, 2010: 80-88. DOI: 10.1145/1964858.1964870.
  • 加载中
图(4) / 表(2)
计量
  • 文章访问数:  281
  • HTML全文浏览量:  40
  • PDF下载量:  21
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-06-23
  • 修回日期:  2020-08-10
  • 刊出日期:  2021-04-05

目录

    /

    返回文章
    返回