我要投稿 投诉建议

聚类分析的网络论坛社团探测算法探究论文

时间:2021-02-18 14:20:36 毕业论文范文 我要投稿

聚类分析的网络论坛社团探测算法探究论文

  1引言

聚类分析的网络论坛社团探测算法探究论文

  网络论坛(BBS)由于具有及时性、交互性、开放性等特点,因而也是网络舆论产生、形成和发展的主要场所,整个网络论坛的参与者呈现一种特性—社团结构,即整个网络由若干个社团构成,每个社团内部的节点之间的连接相对紧密,各社团之间的连接相对稀疏.研究网络论坛的社团结构,对了解BBS中网络舆论的传播特点具有现实意义.

  网络论坛中成员根据兴趣或背景而形成真实的社会团体,网络中的这些社区有助于更加有效地理解其成员结构和分析网络舆论传播特性.目前对网络社团结构研究主要有两类主要的方法—社会学中的分级聚类和计算机科学中的图形分割方法.分级聚类是探测网络社团的传统方法,基于各个节点间连接的相似性或强度将网络划分成子群,并根据划分时是往网络中添加还是移除边可分为凝聚算法和分裂算法,Girvan和Newman提出基于边介数的分裂算法(简称GN算法);Kemighan—Lin算法和谱平分法则是较为出名的图形分割算法,其中Kernighan—Lin算法根据使社团内部及社团间的边最优化的原则对原始的网络进行分类,谱平分法是根据网络图的Laplace矩阵进行向特征向量空间的谱映射.该文算法是谱平分法的一种改进算法,将模块度函数与聚类分析算法结合进行社团结构探测.

  2试验及结果

  海峡四川钓友联谊会是海峡钓鱼网的一个子板块,其中参与者大部分为四川本地钓鱼爱好者,论坛成员具有共同的兴趣爱好.该板块为四川钓鱼爱好者的学习与交流提供了一条新途径.针对相关主题,论坛成员可以提出问题、发表各自的观点和看法,相互交流,相互帮助.

  实际数据处理时,根据对己掌握的id对应关系,对部分id进行了特别处理,例如将“清凉油”和“151”这2个id合并处理,将“被草压死的骆驼”与“骆驼”,“黑武器”与“黑版”视为同一个id.

  2. 1连接权矩阵的生成

  该文从6000余名在该论坛中发言的成员中筛选出满足各种阈值条件的`成员1436人,并生成对应的连接权矩阵.

  2. 2对比试验

  为验证算法的有效性,该文将该论坛数据分别运用K-Means算法,CNN算法以及该文的基于模拟退火的社团探测算法.其中,K -Means算法是常见的聚类算法,是基于距离聚类中心最近法则为标准对个体进行分类的;而CNN算法则采用竞争型神经网络模型,进行无监督学习的分类.这里要注意的是,这里所有的算法程序都用matlab编写.

  这里运行次数为得到最优解的平均运行次数,时间为平均运行时间.

  表2给出了应用C - based SA算法模块度在0.36以上的聚类结果,k=3,4,5时模块度较高.

  图1给出了k =5,降温速率为0.997时的探测算法的迭代过程,迭代到2300次左右就己经求出了最优解.

  2. 3结果分析

  通过对实际数据运行3种不同的社团探测算法,结果表明:K-Means算法速度较快,但受初始化条件影响较大,可靠性也比其他两种算法差,网络规模扩大对算法性能影响较大;CNN算法对初始化条件依赖程度较K-Means算法较低,但运算速度较慢,并且对数据预处理需要花较长的时间;三种算法中,C-based SA算法不依赖初始化条件的选取,直接使用模块度函数作为目标函数对网络进行社团探测,能保证达到全局最优解,可靠性较其他两种算法要高,该算法的复杂度依赖于系统降温速率的设置,其缺点是运行时间较长.

  3结束语

  提出了针对网络论坛的社交网络的构建方法,将组合优化的方法与聚类分析的思想相互结合并应用到网络论坛社团结构的求取上,并提出了用模拟退火算法来求解,解决了实际工作实践中遇到的问题.试验结果验证了算法的准确性,模拟退火算法与聚类分析的思想能有效的结合起来,对论坛社团结构进行分析有较大的实用价值.

  试验结果同时说明,基于兴趣的网络论坛中的社交网络社团结构不太明显,值得注意的是,该文使用的是非重叠性的社团探测算法,考虑到实际网络中,个体往往具有多群体特性,因此,改进社团结构的定义以及在此基础上探索新的社团划分方法是一个值得研究的方向.

【聚类分析的网络论坛社团探测算法探究论文】相关文章:

算法类论文开题报告11-11

应用文写作网络化教学探究论文07-27

《路史》的写作特征探究论文07-29

绩效工资的算法10-13

失业保险的算法06-10

小学语文写作教学探究论文04-03

关于教师备课探究开题报告的论文07-24

辞退员工补偿的算法05-10

年假加班工资的算法10-10

高中英语写作教学探究的论文06-19