数据集-用于数据挖掘、信息检索、知识发现等
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b
2、几个实用的测试数据集下载的网站
http://www.cs.toronto.edu/~roweis/data.html
http://www.cs.toronto.edu/~roweis/data.html
http://kdd.ics.uci.edu/summary.task.type.html
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/
http://www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/
http://www.phys.uni.torun.pl/~duch/software.html
在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters21578.html
以下网址上有各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html
进行文本分类,还有一个数据集是可以用的,即rainbow的数据集
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
3、找了很多测试数据集,写论文的同志们肯定需要的,至少能用来检验算法的效果
可能有一些不能访问,但是总有能访问的吧:
UCI收集的机器学习数据集
ftp://pami.sjtu.edu.cn/
http://www.ics.uci.edu/~mlearn//MLRepository.htm
statlib
http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm
http://lib.stat.cmu.edu/
样本数据库
http://kdd.ics.uci.edu/
http://www.ics.uci.edu/~mlearn/MLRepository.html
关于基金的数据挖掘的网站
http://www.gotofund.com/index.asp
http://lans.ece.utexas.edu/~strehl/
reuters数据集
http://www.research.att.com/~lewis/reuters21578.html
进行文本分类&WEB
http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
时间序列数据的网址
http://www.stat.wisc.edu/~reinsel/bjr-data/
apriori算法的测试数据
http://www.almaden.ibm.com/cs/quest/syndata.html
癌症基因:
http://www.broad.mit.edu/cgi-bin/cancer/datasets.cgi
金融数据:
http://lisp.vse.cz/pkdd99/Challenge/chall.htm
以下网址上有各种数据集:
http://kdd.ics.uci.edu/summary.data.type.html
kdnuggets 相关链接数据集:
http://www.kdnuggets.com/datasets/index.html
还有另外一个很好的资源网址为:http://kdd.ics.uci.edu/,里面包含的数据资源如下(按应用领域划分):
这里又找到一个,在一个老外的blog上找到的http://www.fs.fed.us/fire/fuelman/
摘自:http://www.shamoxia.com/html/y2009/490.html
数据集-用于数据挖掘、信息检索、知识发现等相关推荐
- 宝贵数据集——用于数据挖掘、机器学习、文本挖掘
1.气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b 2.几个实用的测试数据集下载的网站 http://www.cs.toronto.edu/~roweis/data ...
- 数据挖掘和知识发现的技术、方法及应用
[-] 数据挖掘和知识发现的技术方法及应用 一幅凝固的油画 数据挖掘和知识发现的技术方法及应用 一幅凝固的油画 Keywords 概念 技术 统计分析statistical analysis 决策 ...
- 【深度学习】制作VOC2007数据集用于Faster-RCNN训练
制作VOC2007数据集用于Faster-RCNN训练:VOC2007格式是faster-RCNN中官方给出的用于训练的数据集,把它下载下来用frcnn/tool里的训练程序跑一跑就可以得到自己的训练 ...
- AI:人工智能概念之机器学习ML、深度学习DL、数据挖掘、知识发现、模式识别等重要领域之间比较关系结构图之详细攻略
AI:人工智能概念之机器学习ML.深度学习DL.数据挖掘.知识发现.模式识别等重要领域之间比较关系结构图之详细攻略 目录 AI与ML.DL的概念 AI与ML.DL的结构关系图 参考文章:<201 ...
- 排名前50的开源Web爬虫用于数据挖掘
有各种用途的网络爬虫,但本质上是一个网络爬虫是用来从互联网收集挖掘数据.大多数搜索引擎使用它作为提供了最新数据的方法,并用于查找互联网上有什么新的内容. 在这篇文章中,介绍前50个开源的Web爬虫可在 ...
- 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载...
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...
- 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统 微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的 ...
- 利用大数据挖掘和知识发现技术辅助智慧城市发展
陈聪1,张国惠 1,马晓磊 2,王印海 3 1. 美国新墨西哥大学土木工程系,美国 新墨西哥州 阿尔伯克基市 87106: 2. 北京航空航天大学交通科学与工程学院,北京 100191: 3. ...
- python葡萄酒数据集_Python 数据挖掘- Kaggle红酒品质数据
数据挖掘或机器学习在商业智能领域的案例在Kaggle 很多,我今天分享一下红酒数据. 按照CRISP模型第一步去了解业务,也就是数据集描述的业务场景,如果不理解这一点,那么数据分析的意义又在哪儿呢,就 ...
最新文章
- ROS发行版列表完整版
- 深度对话林元庆:AI创业历史性窗口到来,将诞生下个BAT
- JAVA常用基础知识点[继承,抽象,接口,静态,枚举,反射,泛型,多线程...]
- Apple Watch开发快速入门教程
- Zookeeper常用命令详解(Zookeeper3.4.14)
- 认识协程gevent
- 网络管理软件免费linux,最新Xmanager Power Suite6网络管理工具免费官方下载6.0.199 - 系统之家...
- redis之列表字典操作
- android 常用软件包
- SMOTE算法原理及Python代码实现
- amd cpu排行_2019 CPU天梯图(intel和AMD CPU性能排行)
- Maven学习(七)Maven工程单一架构案例
- svchost.exe占用cpu过高怎么处理(原因及解决办法)
- [TensorFlow深度学习深入]实战一·使用embedding_lookup模块对Word2Vec训练保存与简单使用
- 在字节跳动干软件测试5年,2月无情被辞,想给划水的兄弟提个醒
- 【win10】笔记本(台式)如何用根网线(WI-FI)实现完全控制另一台电脑教程
- 好奇号火星车是我梦中的情人
- python红楼梦人物统计_基于共现使用Python来分析《红楼梦》中贾宝玉与金陵十二钗的关系...
- 弘辽科技:淘宝宝贝标题怎么找准关键词?做标题的3个学问
- 弱网工具-NEWT应用
热门文章
- wordcount代码_通过腾讯云 Serverless Regsitry 快速开发与部署一个 WordCount 实例
- VoxelNet: 基于点云的三维空间信息逐层次学习网络
- VTK修炼之道6_仔细分析一个复杂程序
- A review of 3D/2D registration methods for image-guided interventions(1)
- Linux的Page Cache
- BUUCTF-WEB:[极客大挑战 2019]EasySQL 1(收藏了URL编码表)
- 结构体:计算学生平均分
- linux 内存显示括号内字母的含义
- 禁止复制的网页怎么复制
- 数据结构与算法 -- 队列 ADT