写在前面

之前用过ROST CM6 来进行毕设中有关景区整体的感知,但是ROST CM6似乎已经是2010年的产品了,用在2022年毕设有点稍旧(当然Gephi似乎是2009年的产品 )不管怎么说,Gephi不管是从名字上还是内容上似乎好像也许可能比 ROST CM6 高端辣么一点点,现在学习一下绘制过程和方法,将毕设部分进行调整和改进。

正餐开始

其实利用Gephi来进行相关分析和LDA差不多

LDA所做的内容主题是割裂的,无法得知各主题间的相关关系,丢失了词语和句子之间的联系,常常导致我们无法给主题进行准确的命名。

LDA还会遇到一个常见的问题是困惑度不减反增,出现这个问题的原因可能是:

由于短文本的特征稀疏性,传统的LDA获PLSA主题模型分析短文本的效果并不理想
[1] 蔡永明,长青.共词网络LDA模型的中文短文本主题分析[J].情报学报,2018,37(03):305-317


(毕设中用的都是长段的评论文本,所以没出现问题)

开始说一下语义网络分析

语义网络分析是指从文章中提取某些关键词,然后利用这些词语直接的相似度关系来构建词语的关系网。进而来探索文本想表达的意思,比方说我们可以用其来做主题聚类分析。

相较于割裂的 LDA 主题我们能通过关系图更清晰了解主题及内容之间的关系讯息。

动手实操

需要在 data 文件夹中放入相关数据

在进行完停用词去除、合并同义词、词语规定标准后(当然这需要先粗浅地RUN一次再来进行调整和修改),即可利用相关代码构建相关词语的共线矩阵,然后即可得到相关的文件,这时即可导入Gephi软件进行分析。

一点题外话+补充

定义自己的文件(CSV)

虽然这个可能不很常用(毕竟边的权重啥的很主观 )但是还是提一下吧。

首先是导入边文件:

注意观察文字有无乱码,如果出现了乱码,记得用记事本打开另存为utf-8的形式

此时已完成边文件的导入,下一步要进行节点内容的导入(操作方法同上)

注意要把所有的图选项改为 无向图

在导入边的时候,由于我们是首创一个文件,所以选择的是 New Workspace 选项,现在我们导入节点是基于前一步导入的边,所以要选择 Append to existing workspace 选项

可以通过这个来设置节点的大小
(但是平常感觉用 Size 的机会很小,而且也不怎么好看 )

备注:
继续深入了一下,发现这个其实还是很好用的

可以将重点部分进行突出,把 csv 数据导出后再进行 Size 列的调整修改,这样的话也还不错。再按照上述内容进行修改:

真正的正餐开始

现在是利用毕设中自己的数据集来做一遍,自己定义CSV并不常用,这才是比较常规的 Gephi 方法。

首先打开result文件夹下的网络图

由于内容是中文的,必须选用中文才能让其得以显现

如果遇到标签过于紧密,点选标签调整,标签即会自动移动
(下图非最终结果)

点选统计相关的按键(虽然不知道为啥要点 )
最重要的感觉是模块化
模块化即是主题,然后点选颜色,不同的节点就被赋予不同的颜色


可以对线条和字体进行调整

保存图片记得调整像素,更高清

Gephi网络调整

——①过滤节点 ②调整重叠标签

总结

Gephi大概的内容操作就是这样了,接下来就是把图调整好看的过程了

# 研究杂感 × Gephi(第一辑)相关推荐

  1. # 研究杂感 × Gephi探秘飞升(第三辑)

    写在前面 现在是2022年03月26日,周六晚20:35 前段时间准备将ROST CM6 绘制的图像转用 Gephi 软件来进行替代 也学习了一些前人的经验,但据我个人总结,Gephi具有以下2个硬伤 ...

  2. python玩我的世界盒子_省培预存|编程教学建议第一辑“教材分层次梳理”

    编程教育公益活动系列之一 编程教学建议第一辑"教材分层次梳理"(初中适用,高中参考) 重要提示:全文请从阅读原文下载使用.本文是声明原创.提供信息. 说   明 本材料仅供教材分析 ...

  3. 【比特大数据】第一辑:手机信令大数据格式及应用价值

    [比特大数据]第一辑:手机信令大数据格式及应用价值 一.什么是手机信令大数据 手机信令是手机用户与发射基站或者微站之间的通信数据,只要手机一开机,并且手机屏幕上显示出运营商(中国移动.中国联通.中国电 ...

  4. 《大学科普丛书》(第一辑)入选2020年度全国优秀科普作品名单

    2022.1.28<大学科普丛书>(第一辑) 入选2020年度全国优秀科普作品名单 2022年1月28日,<大学科普丛书>(第一辑) 入选2020年度全国优秀科普作品名单 智能 ...

  5. 人工智能领域中声源定位的研究与发展------第一章 绪论

    人工智能领域中声源定位的研究与发展------第一章 绪论 转自: https://blog.csdn.net/jojozhangju/article/details/45157309 版权声明:本文 ...

  6. 射手科技公开课第一辑 『项目管理和代码规范』

    射手玩的东西越来越全面了,从当年的字幕下载站,到播放器,到射手科技,发展的思路值得借鉴和思考. 射手科技成立3个月以来,我们内部已经组织了不少培训.每次内部培训我们都留有录像和录音,以便后续参与项目的 ...

  7. 美国加州中学课本 教材介绍 - Glencoe系列第一辑 - 介绍

    Technorati Tags: McGraw,Mcgraw-Hill,Macmillan,textBook,American Home School Book,Home School books C ...

  8. 第一辑 回家的路--幸福参照系

    第一辑 回家的路 前言: 上帝似乎在此和我们开了个不大不小的玩笑,他告诉我们人生的目的地,却拒绝给我们地图.于是在上帝慈祥而狡黠的目光下,我们在人生的莽原上无助地跋涉.在跋涉的行程中,我们都有这样的感 ...

  9. 心灵指南 刘墉 第一辑 超越自己 笔记

    心灵指南 刘墉 第一辑 超越自己 笔记 序: 我们最强的对手, 不一定是别人, 而可能是我们自己! 在超越别人之前, 先得超越自己! [中庸之道] 一个人如果20岁而不美丽.30岁而不健壮.40岁而不 ...

  10. 临床路径论文、系统及其他资料汇总【88个】【第一辑】

    主要内容包括临床路径论文.试点方案.系统.手册.讲义.讨论交流贴等.收集了2010年11月10日之前HC3i中国数字医疗论坛关于临床路径的资料,整理汇总吗,方便大家查找. 本帖还有部分补充内容,请见: ...

最新文章

  1. BZOJ.3004.[SDOI2012]吊灯(结论)
  2. 【转载】MongoDB 1000W级数据 Insert和Query和Delete性能测试
  3. DirectInfo.GetFiles 排序
  4. SqlServer中char,varchar,nchar,nvarchar的区别
  5. c #include如何找到文件_使用 MATLAB Function 模块集成 C 代码
  6. Atitit etl之道 attilax著 1. ETL 1 1.1. (数据仓库技术) 2 1.2. ETL的质量问题具体表现为正确性、完整性、一致性、完备性、有效性、时效性和可获取性等几个特性
  7. 真正的卡巴斯基key 教你使用正版KASPERSKY授权到2008年
  8. 一款开源的截图神器,支持 macOS/Windows/Linux
  9. 解决mescroll固定位置上拉加载无效果?真的只需一步
  10. 云计算5G的基本概念
  11. RapidMiner简单入门教程——入门必看超详细
  12. 金多多配资盘面预测收益大于风险
  13. 斐波那契数列+pyton
  14. 运行tensorflow以及caffe出现各种虽小但足以致命的错误
  15. mysql必知必会第5版pdf_sql必知必会
  16. ps命令 proc文件系统
  17. 中国人寿如何基于容器搭建金融PaaS云平台 1
  18. 大数据开源框架技术汇总
  19. 计算机音乐好想爱这个世界,好想爱这个世界啊歌词
  20. MySQL 之 多表查询

热门文章

  1. matlab求差分方程的单位响应,实验一:线性卷积和求差分方程的单位样值响应
  2. 隐藏在计算机网卡怎样删除,卸载电脑中隐藏虚拟网卡设备的解决方法
  3. Linux kali2021 密码学PBC库安装
  4. jtm 一键安装mysql_MySQL数据实时增量同步到Redis
  5. WebShell -- 开启3389服务
  6. 圈圈教你学USB学习资料大全(包含完整光盘和教程)
  7. Normalize.css的使用及下载
  8. WinForm转WPF
  9. xe android 联系人,Delphi XE 开发android后台服务例程
  10. 折腾AX2012,安装成功,发帖庆祝