一,CSV

逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的的英文逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(注)来开启,再则先另存新档后用EXCEL开启,也是方法之一。

CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。的使用字符编码同样没有被指定,但是7位ASCII是最基本的通用编码。

  • CSV其实就是文本文件,而并不是表格;
  • 的.csv和.xls的区别在于,.xls的只能用Excel中打开,而且,XLS和CSV的编码格式也不一样,简单来说,CSV可以用文本(TXT)打开也可以用EXCLE打开,而XLS只能用擅长打开
  • 最后,如何在CSV与XLS之间抉择呢?这里我们要弄清楚几个问题,CSV只是单纯的文本文件,同样的,也只是单纯的以文本格式存储,CSV无法生成公式,依赖,也无法保存公式,依赖!所以,如果单纯的只是存储文本格式的数据,可以直接选择使用CSV文件,读写方便,易于实现,数据可以表格化展示,这就是优点!

注意:CSV文件可以通过改变文件后缀名或者通过练成工具强制转换成的的.xls文件,但是要注意乱码问题。


二,CSV文件读和写

(1)通过标准的Python中的库导入CSV文件

CSV,用来处理CSV文件。 
这个类库中的阅读器()函数用来读入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个numpy的数组,用来训练算法模型。

#!/usr/bin/python3from csv import reader
import numpy as np
filename='pima_data.csv'      #这个文件中所有数据都是数字,并且数据中不包含文件头。
with open(filename,'rt') as raw_data:readers = reader(raw_data, delimiter=',')x=list(readers)data=np.array(x).astype('float')print(data.shape)

(2)采用numpy的导入CSV文件

可以使用Munpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型都是一样的。

#!/usr/bin/python3import numpy as np
filename='pima_data.csv'
with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)

(3)采用Pandas导入CSV文件 - 机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。

使用熊猫来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是数据帧,可以很方便地进行下一步的处理。

#!/usr/bin/python3from pandas import read_csv
filename='iris.data.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)

《机器学习Python实践》——数据导入(CSV)相关推荐

  1. 写csv文件_机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  2. csv逗号分隔符转换_机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  3. python怎么导入csv文件数据-机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  4. 机器学习Python实践》——数据导入(CSV)

    一.CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样 ...

  5. python爬虫案例分析:爬取肯德基门店地址数据导入csv文件并最终用excel文档呈现

    1.用到的模块: requests pprint csv 2.找到肯德基门店网站进入门店位置页面后,打开抓包工具,找到response中包含所需信息的正确的url信息 3. 导入地址url 4.为防止 ...

  6. python第三章上机实践_《机器学习Python实践》读书笔记-第三章

    <机器学习Python实践>,第三章,第一个机器学习项目 以往目录:橘猫吃不胖:<机器学习Python实践>读书笔记-第一章​zhuanlan.zhihu.com 书中介绍了一 ...

  7. 机器学习 Python实践 第一天 18.11.08

    本人是某大学大二学生 专业是 软件工程. 由于大一贪玩,大二这学期才有所学习,目前只会C,Python.目前在本学校嵌入式开发实验室.但是我们实验室可以自选喜欢的东西.于是我指向了人工智能.询问了老师 ...

  8. C# 将List中的数据导入csv文件中

    //http://www.cnblogs.com/mingmingruyuedlut/archive/2013/01/20/2849906.html C# 将List中的数据导入csv文件中 将数据保 ...

  9. Python 爬虫数据写入csv文件中文乱码解决以及天眼查爬虫数据写入csv

    python爬虫数据写入csv文件中文乱码,用'utf-8'在pycharm中打开文件没有问题,但是用excel打开却出现了问题,以下为解决方法. (最近在练习爬虫,这个博文是对自己学习的记录和分享, ...

  10. python 保存本地乱码,解决python保存数据到csv文件中文乱码的方法

    解决python保存数据到csv文件中文乱码的方法 发布时间:2020-07-08 13:49:53 来源:亿速云 阅读:695 作者:清晨 小编给大家分享一下解决python保存数据到csv文件中文 ...

最新文章

  1. MLPerf训练最新发榜:谷歌、NV、浪潮 ,冠军榜“三国杀”
  2. mysql查询语句在哪里编写_mysql编写语句:更新查询
  3. 基于DirectUI技术开发的发卡系统
  4. [css] 你是怎样对css文件进行压缩合并的?
  5. android.support.v7.widget.,关于android.support.v7.widget.RecyclerView的使用,总是找不到类...
  6. 心得 | 《用得上的商学课》 004 边际成本 | 飞机起飞前的座位,只卖一块钱?...
  7. 又见The request sent by the client was syntactically incorrect ()
  8. c/c++文件操作之缓冲区
  9. 软件开发模式之敏捷开发模型,应用之DevOps
  10. HTTP权威指南 笔记
  11. Web全栈工程师养成记
  12. Unity插件——Odin 学习笔记(二)
  13. JAVA Future类的使用详解
  14. 梯度(gradient)
  15. [51nod 1051 最大子矩阵和]前缀和+dp
  16. 基于Unity3d的FPS与塔防相结合的游戏设计
  17. win10 android叹号,win10系统设备管理器驱动显示黄色感叹号的详细技巧
  18. 团队管理33-典型场景(向下沟通)
  19. 历史上的今天mysql数据库包含详情分类以及图片(免费分享)
  20. android 电话表情,歪,小人打电话表情包完整版下载

热门文章

  1. Linux 忘记密码如何登陆—续篇2救援模式
  2. 火遍全国的网络热梗“yyds”,创造者被判刑3年
  3. 深入理解Netty-从偶现宕机看Netty流量控制
  4. 面对复杂业务架构,阿里架构师是如何做的?(第一期)
  5. 多个线程为了同个资源打起架来了,该如何让他们安分?
  6. 【高并发】32位多核CPU并发读写long型数据为何会出现诡异问题?看完这篇我懂了!...
  7. 扎心一问!为什么前后端分离后,你比从前更痛苦?
  8. 我作为Java后端,分享一下入门Spark编程的经历!
  9. 如何成为一名数据工程师
  10. 极致进化-敏捷进化型企业的未来畅想