一、工具准备

在库中加入selenium

为了用它控制网站
要安装一个chromedriver

这里加的是他的一个低版本
因为新版本有些地方仍然不兼容

1.获取当前谷歌浏览器版本信息:chrome://version/
用谷歌浏览器登录上面网站获得自己的谷歌浏览器版本

在下面网址下载chromedriver
chromedriver下载地址:http://chromedriver.storage.googleapis.com/index.html

选取一个最近的版本,即与你的版本最近的

下载文件,解压
放入python安装目录
就可以使用了

用下面代码测试,能不能打开谷歌浏览器

from selenium.webdriver import Chromeb = Chrome()
b.get('https://www.baidu.com')

如果运行完了,跳出谷歌浏览器就是成功安装工具

二、csv文件操作

1. 什么是csv文件 - 逗号分隔值文件

一种后缀是.csv的文本文件,文件中每一行通过逗号分割成不同的列。
csv可以用excel软件像打开excel文件一样去打开。
导入库

import csv

2. csv文件读操作

1)创建reader

csv.reader(文件对象) - 创建reader获取文件内容,文件内容每一行一个列表的形式返回

csv.DictReader(文件对象) - 创建reader获取文件内容,文件内容每一行一个字典,并且将第一行的数据作为键的形式返回

f = open('files/电影.csv', 'r', encoding='utf-8', newline='')
# reader = csv.reader(f)
reader = csv.DictReader(f)# reader获取文件内容,将每一行内容作为一个**迭代器**中的元素返回
```python
print(next(reader))
print(next(reader))
print(list(reader))f.close()

3. csv文件写操作

1)创建一个writer

csv.writer(文件对象) - 写入数据的时候每一行数据对应一个列表

writer1 = csv.writer(open('files/students1.csv', 'w', encoding='utf-8', newline=''))

2)写入数据

python网页爬虫selenium与csv文件写入储存应用相关推荐

  1. c++ 写入文件_利用Python把数据存储在csv文件中

    鼠年第一天开盘,很多股票跌停,太闹心了!今天再找点开心的事情做吧.人生最幸福的事情莫过于看到自己写的程序调试通过了! 前面我们介绍了,如何用Python做一个串口通讯的上位机.用这个上位机我们可以从E ...

  2. pandas读取csv写入mysql_使用python的pandas库读取csv文件保存至mysql数据库

    第一:pandas.read_csv读取本地csv文件为数据框形式 data=pd.read_csv('G:\data_operation\python_book\chapter5\\sales.cs ...

  3. python 如何使用 pandas 在 flask web 网页中分页显示 csv 文件数据

    目录 一.实战场景 二.知识点 python 基础语法 python 文件读写 python 分页 pandas 数据处理 flask web 框架 jinja 模版 三.菜鸟实战 初始化 Flask ...

  4. python网页爬虫+简单的数据分析

    python网页爬虫+简单的数据分析 文章目录 python网页爬虫+简单的数据分析 一.数据爬取 二.数据分析 1.我们今天爬取的目标网站是:http://pm25.in/ 2.需要爬取的目标数据是 ...

  5. 将CSV文件写入到MySQL中(用Pandas库实现MySQL数据库的读写)

    转载自公众号:python-china 转载自公众号:python-china 本次分享将介绍如何在Python中使用Pandas库实现MySQL数据库的读写.首先我们需要了解点ORM方面的知识. O ...

  6. 【puthon】把大量csv文件写入h5文件制作数据集

    背景 每一个样本的数据被写入了一个csv中,在制作数据集时,需要先将大量的csv文件写入到一个h5文件中 样例代码 import os import sys import h5py import nu ...

  7. python网页爬虫-python网页爬虫浅析

    Python网页爬虫简介: 有时候我们需要把一个网页的图片copy 下来.通常手工的方式是鼠标右键 save picture as ... python 网页爬虫可以一次性把所有图片copy 下来. ...

  8. python网页爬虫-Python网页爬虫

    曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python.离开腾讯创业后,第一个作品课程图谱也是选 ...

  9. Python 网页爬虫 文本处理 科学计算 机器学习 数据挖掘兵器谱 - 数客

    曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python.离开腾讯创业后,第一个作品课程图谱也是选 ...

  10. ETL KETTLE 读取csv文件写入数据库

    任务: 将大量CSV文件写入数据库中:可以一张表一个csv文件输入,表输出:但是如果表文件太多,达到100多张表入库:那会写死人的:所以我们可以偷懒一下:采用配合kettle java脚本代码:完成任 ...

最新文章

  1. LVS Nginx HAProxy 优缺点
  2. android手机上的ancs,Android BLE开发之操作IOS ANCS
  3. Java自带的线程池Executors.newFixedThreadPool
  4. shell下function报错
  5. androidrunnable使用,Android的:如何停止的Runnable?
  6. C++ auto关键字
  7. (枚举)餐厅点餐(fzu2086)
  8. 个性屏幕保护程序_Mac高清鸟瞰屏幕保护程序,酷毙了
  9. 大白话5分钟带你走进人工智能-第二十二节决策树系列之概念介绍(1)
  10. Python 数据结构 树
  11. Python学习笔记(6) xml转换为excel
  12. Java 应用Nginx+ffmpeg实现海康视频web直播
  13. 最简短的加入收藏代码
  14. 武汉申报|2022年洪山区科技企业梯次培育专项资金申报指南
  15. 北航机械学院计算机制图,北航机械制图在线作业一含答案.pdf
  16. iTunes出现“iTunes不能读取iPhone的内容,请前往iPhone偏好设置的摘要选项卡,然后点击“恢复””的解决办法
  17. vlan局域网对战平台
  18. SAS数据导入input要点
  19. 游戏是怎么赚钱的 - 进阶篇
  20. vue3.0+ts+element-plus多页签应用模板:element-plus按需引入与动态换肤

热门文章

  1. 【操作系统】Mac OS 操作技巧
  2. 12、Mybatis中用#{}和${}获取输入参数的区别
  3. ChatGLM-6B如何推理在MLU370
  4. 梭子鱼推出AI解决方案实时防御鱼叉式网络钓鱼和网络欺诈
  5. @Transactional注解在类上还是接口上使用,哪种方式更好?
  6. JS 深浅拷贝区别案例(代码实现)
  7. vscode配置 easy sass
  8. 【Python学习笔记】【待完善】(二十)爬虫初识:提取豆瓣电影排名前20
  9. 混蛋政治经济学--人类文明周期论
  10. 【微服务】Nacos 认证机制