系列文章目录

python爬虫实战


前言

本文主要用python爬取豆瓣电影TOP250数据并将爬取到的数据保存到MySQL中。同时也介绍了该项目中遇到的问题。
爬取内容:电影名称,电影别名,导演,主演,电影类型,评分分数,评价人数,电影描述。


一、使用的库

import requests
from lxml import etree
import pymysql
import re
from pymysql.converters import escape_string

二、运行图


三、项目遇到的问题

1.python将包含有单引号或者双引号的字符串保存到MySQL中

案例

给出一个含有单引号的字符串,将其保存到Mysql中会发现错误。


无法保存,是因为单引号’ 无法保存?想想也不可能。去验证:


可以看到是可以保存单引号的,也能保存双引号。是什么原因导致的呢?

原因

是因为字符串中添加了单引号或者双引号,python在读取过程中会将其进行字符串分割,例如:“Smith’s Friend” 读取到单引号后就会以为是 Smith s Friend两个字符串,从而与你sql语句不相符,出现错误

解决办法

将含有单引号或者双引号的字符串不进行转义,这样就能将其正常保存到数据中了。

from pymysql.converters import escape_strings = "Smith's friend"
s = escape_string(s)

python爬虫实战—豆瓣电影TOP250相关推荐

  1. 爬虫实战——豆瓣电影Top250

    爬虫实战--豆瓣电影Top250 准备阶段 网页分析 在目标网页直接ctrl+u查看网页源代码(或者F12审查),豆瓣的网页源代码就出现了(非常友好): <!DOCTYPE html> & ...

  2. 第一期:【python爬虫】豆瓣电影top250

    1.首先看最后的爬取结果 还有电影的信息,我保存的是csv文件.可以学到爬虫的相关知识和数据保存的信息. 删除信息,直接上代码. 红色圆点旁边的是清空.(如上图所示) 下面请求中的第一个或者前几个(如 ...

  3. Python3 爬虫实战 — 豆瓣电影TOP250【requests、Xpath、正则表达式、CSV、二进制数据储存】

    爬取时间:2019-09-27 爬取难度:★★☆☆☆☆ 请求链接:https://movie.douban.com/top250 以及每部电影详情页 爬取目标:爬取榜单上每一部电影详情页的数据,保存为 ...

  4. Python爬虫获取豆瓣电影TOP250

    最近在学python,研究了下,写了两个爬虫成功爬取了一些东西.有一个很黄很暴力,就不放出来了,还有一个比较绿色,简单,适合初学者学习,思路也比较清晰,也方便我以后再捡起来,注释写的很清楚,特把源码放 ...

  5. xhr get获取文件流下载文件_python爬虫实战——豆瓣电影get初体验

    影评许可证 公众号[2019]第22期 本栏目由"数据皮皮侠"独家呈献 专场 python爬虫实战--豆瓣电影get初体验 2019.10.28 / 早上7点场 / 免费 本期&q ...

  6. python爬虫获取豆瓣图书Top250

    在上一篇博客<python爬虫获取豆瓣电影TOP250>中,小菌为大家带来了如何将豆瓣电影Top250的数据存入MySQL数据库的方法.这次的分享,小菌决定再带着大家去研究如何爬取豆瓣图片 ...

  7. Python爬虫实战----------豆瓣TOP250

    *前段时间学习了一些浅显的爬虫知识,防止遗忘写个博客记录一下,如果能帮到其他人是更好的 本篇介绍一下如何一步一步实现使用python爬取豆瓣电影TOP250,博主是个小白,如果内容有误,请将宝贵的建议 ...

  8. python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

  9. Python爬取豆瓣电影top250的电影信息

    Python爬取豆瓣电影top250的电影信息 前言 一.简介 二.实例源码展示 小结 前言 相信很多小伙伴在学习网络爬虫时,老师们会举一些实例案例讲解爬虫知识,本文介绍的就是经典爬虫实际案例–爬取豆 ...

最新文章

  1. c语言如何不产生僵尸进程,第三章 九析带你处理 zombie(defunct) 进程
  2. Redis M/S + Keepalived 主从备份高可用
  3. access表怎么生成表结构_数据结构——单链表讲解
  4. afudos备份bios不动_bios刷坏后的两种解决方法
  5. JailbreakMe.com-最新浏览器模式破解iPhones,iPads和iPod Touches方法
  6. ubuntu12.04装机后设置
  7. Linux系统安全基本措施及应用(关于账户安全以及sudo权限,安全认证等)
  8. Android Facebook登陆获取 Key Hashes值
  9. ppt动画制作bullets
  10. [置顶] LED办公楼宇照明节能方案及城市夜景照明节能方案
  11. 【论文阅读31】《OptCuts: Joint Optimization of Surface Cuts and Parameterization》
  12. qma7981 源码 驱动_高品质PCB板配单报价,QMA7981-TR
  13. 高考数学知识点:基本不等式(附习题)
  14. 海海软件发布HHMeet MacOS和iOS版 – 加密保护Zoom视频会议,防止屏幕录像
  15. js微信h5页面背景音乐
  16. 思维升级 | 25W运营一年色拉店,你能赚几万?
  17. IOS版伪春菜开发笔记1.0之XCODE快速上手篇
  18. 2015年中国各省级、地市经济财政全景图
  19. Java试题 算法提高 着急的WYF(不同子串个数)
  20. PS美容磨皮插件DR5加强版

热门文章

  1. 学习_Linux_Command_quotacheck
  2. 经营性房产的管理范围
  3. linux恐怖的命令
  4. 深入理解Queue 队列
  5. 深度学习(手写数字识别)
  6. python乘法函数英文缩写_乘积(python乘法函数)
  7. matlab 等高线数值显示_Matlab等高线绘图攻略
  8. 因子分析原理及结果解析
  9. 【微信你妹】中间人攻击截获微信数据
  10. DM368开发 -- 编码并实时播放