R语言做文本挖掘:基于网购评论提炼电热水器的差异化卖点
这是我参加一个数据挖掘竞赛的作品,这是代码部分,论文正文并没有贴出来。
水平一般般,很多还可以改进的地方。
不过辛辛苦苦做出来的东西,多少还是有些地方可以借鉴的,贴出来大家共同探讨下。
#读入数据
guomei = read.csv("C:\\Users\\hormy\\Desktop\\电热评论原始数据\\汇总-国美.csv",stringsAsFactors=F,header=T)
jingdong = read.csv("C:\\Users\\hormy\\Desktop\\电热评论原始数据\\汇总-京东.csv",stringsAsFactors=F,header=T)
suning = read.csv("C:\\Users\\hormy\\Desktop\\电热评论原始数据\\汇总-苏宁.csv",stringsAsFactors=F,header=T)
tianmao = read.csv("C:\\Users\\hormy\\Desktop\\电热评论原始数据\\汇总-天猫淘宝.csv",stringsAsFactors=F,header=T)
yixun = read.csv("C:\\Users\\hormy\\Desktop\\电热评论原始数据\\汇总-易迅.csv",stringsAsFactors=F,header=T)#去掉不必要的列,统一列名
guomei = guomei[,4:5]
names(guomei)= c('品牌','评论')
jingdong = jingdong[,5:6]
names(jingdong)= c('品牌','评论')
suning = suning[,c(5,7)]
names(suning)
R语言做文本挖掘:基于网购评论提炼电热水器的差异化卖点相关推荐
- R语言做文本挖掘 Part2分词处理
Part2分词处理 [发现有人转载,决定把格式什么重新整理一遍,有时间做个进阶版文本挖掘,恩!原文地址:CSDN-R语言做文本挖掘 Part2分词处理] 在RStudio中安装完相关软件包之后,才能做 ...
- R语言做GGEbiplot_基于R语言的GGE双标图在大豆区试中的应用
基于 R 语言的 GGE 双标图在大豆区试中的应用 * 昝 凯,陈亚光,徐淑霞 ** ,周青,张志民,杨慧凤,王凤菊,李明军,郭海芳 [摘 要] 摘要:为合理评价大豆区域试验中品系的丰产性.稳产性和适 ...
- r语言数据变量分段_R数据分析:用R语言做meta分析
这里以我的一篇meta分析为例,详细描述meta分析的一般步骤,该例子实现的是效应量β的合并 R包:metafor或meta包,第一个例子以metafor包为例. 1.准备数据集 2.异质性检验 in ...
- 使用r语言做garch模型_使用GARCH估计货币波动率
使用r语言做garch模型 Asset prices have a high degree of stochastic trends inherent in the time series. In o ...
- R语言geodetector包基于栅格图像实现地理探测器操作
本文介绍基于R语言中的geodetector包,依据多张栅格图像数据,实现地理探测器(Geodetector)操作的详细方法. 需要说明的是,在R语言中进行地理探测器操作,可以分别通过geod ...
- R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据
R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据 目录 R语言聚类分析之基于划分的聚类KMeans实战:基于葡萄酒数据
- R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据
R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据 目录 R语言聚类分析之基于划分的聚类KMeans实战:基于菌株数据
- 通过R语言做灰色预测
通过R语言做灰色预测 GM(1,1)模型的定义 数据的检验与处理 数据的生成 级比检验 GM(1,1)建模 生成累加数据和均值数据 构造矩阵BBB及数据向量YYY,有 计算: 建立模型,求解,并还原数 ...
- R语言GD包基于栅格图像实现地理探测器与连续参数的自动离散化
本文介绍基于R语言中的GD包,依据栅格影像数据,实现自变量最优离散化方法选取与执行,并进行地理探测器(Geodetector)操作的方法. 首先,在R语言中进行地理探测器操作,可通过geode ...
最新文章
- 时隔两年,EfficientNet v2来了!更快,更小,更强!
- 什么是REST?以及RESTful
- 1号店11.11:分布式搜索引擎的架构实践
- hp designiet 500_2020年HP学院壁纸
- 行业精英聚首谈智慧营销:团队打造、管理策略、权力分配、成功因素、IT 治理……...
- OpenCV级联分类器Cascade Classifier
- 【Linux】一步一步学Linux——systemctl命令(147)
- C语言数组相似度比对,某课程设计---文件相似度判断
- Spring源码学习笔记:经典设计模式之装饰者模式
- freebsd 运行linux,Freebsd 下运行 QQ For Linux 的方法
- 利用安卓手机的OTG共享有线网络
- c语言编程串行静态数码显示实验,十天学会单片机和C语言编程-数码管动态扫描显示.ppt...
- JAVA基础——接口(全网最详细教程)
- c语言怎么写最小公倍数的函数,C语言 · 最小公倍数
- 美军马赛克战三大技术优势!融入未来作战还需克服的四大难点
- a标签 vue 动态点击_vue 中a标签如何实现点击赋值
- 以HT82K629B为主控的程序员专用CV键盘(无需代码烧写)
- 从零基础到斩获BAT算法岗offer,围观复旦大佬的秋招之路
- 加载java ie停止工作_OpenLayers webapplication在IE11中停止工作
- 北京市财政局数据备份设备购置建设项目招标公告7,977,038.00万元
热门文章
- jpa的多表关联查询
- servlet3.0中 @WebServlet注解无效的情况
- Python微信自动回复机器人
- Linux基础命令-dd拷贝、转换文件
- WIN10如何修改host文件
- miniui不显示textbox边框_新品发布艺卓推出31.5英寸4K超高清大屏幕显示器:EV3285...
- 钉钉打卡5.1.12脚本(基于auto.js)开发
- python类的定义与实例化
- Linux命令·at
- html添加添加只读属性,JavaScript如何将readonly属性添加到input标签