Python网络爬虫小白一名,对着罗攀老师的从零开始学python 网络爬虫开始练习,在第10章里的综合案例里,爬取拉勾网招聘信息时,按照案例里提供的源代码进行输入。最终运行结果报错json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)。以下是程序源码及报错详情。

import requests
import json
import time
import pymongoclient = pymongo.MongoClient('localhost', 27017)
mydb = client['mydb']
lagou = mydb['lagou']headers = {'Cookie': 'JSESSIONID=ABAAABAAADEAAFI5940A5A611146E391003985EA75A09BB; Hm_lvt_4233e74dff0ae5bd0a3d81c6ccf756e6=1529892145; _ga=GA1.2.1934100654.1529892145; _gid=GA1.2.1841166947.1529892145; user_trace_token=20180625100226-cf18a75d-781b-11e8-9759-5254005c3644; LGSID=20180625100226-cf18a87b-781b-11e8-9759-5254005c3644; PRE_UTM=; PRE_HOST=; PRE_SITE=; PRE_LAND=https%3A%2F%2Fwww.lagou.com%2F; LGUID=20180625100226-cf18aa9c-781b-11e8-9759-5254005c3644; index_location_city=%E5%85%A8%E5%9B%BD; TG-TRACK-CODE=search_code; _gat=1; SEARCH_ID=f45fb7848ac3406da1afb82a06512a16; Hm_lpvt_4233e74dff0ae5bd0a3d81c6ccf756e6=1529892725; LGRID=20180625101206-288cc5ba-781d-11e8-b048-525400f775ce',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.117 Safari/537.36',
    'Connection': 'keep-alive'
}def get_page(url, params):html = requests.post(url, data=params, headers=headers)json_data = json.loads(html.text)total_Count = json_data['content']['positionResult']['totalCount']page_number = int(total_Count/15) if int(total_Count/15)<30 else 30
    get_info(url, page_number)def get_info(url, page):for pn in range(1, page+1):params = {'first': 'true',
            'pn': str(pn),
            'kd': 'Python'
        }try:html = requests.post(url, data=params, headers=headers)json_data = json.loads(html.text)results = json_data['content']['positionResult']['result']for result in results:infos = {'businessZones': result['businessZones'],
                    'city': result['city'],
                    'companyFullName': result['companyFullName'],
                    'companyLabelList': result['companyLabelList'],
                    'companySize': result['companySize'],
                    'district': result['district'],
                    'education': result['education'],
                    'explain': result['explain'],
                    'financeStage': result['financeStage'],
                    'firstType': result['firstType'],
                    'formatCreateTime': result['formatCreateTime'],
                    'gradeDescription': result['gradeDescription'],
                    'imState': result['imState'],
                    'industryField': result['industryField'],
                    'jobNature': result['jobNature'],
                    'positionAdvantage': result['positionAdvantage'],
                    'salary': result['salary'],
                    'secondType': result['secondType'],
                    'workYear': result['workYear']}lagou.insert_one(infos)time.sleep(2)except requests.exceptions.ConnectionError:pass

if __name__ == '__main__':url = 'https://www.lagou.com/jobs/positionAJax.json?needAddtionalResult=false'
    params = {'first': 'true',
        'pn': '1',
        'kd': 'Python'
    }get_page(url, params)

C:\Users\lenovo-pc\Anaconda3\python.exe C:/Users/lenovo-pc/PycharmProjects/ex10/ex10.3.2.py
Traceback (most recent call last):
  File "C:/Users/lenovo-pc/PycharmProjects/ex10/ex10.3.2.py", line 68, in <module>
    get_page(url, params)
  File "C:/Users/lenovo-pc/PycharmProjects/ex10/ex10.3.2.py", line 18, in get_page
    json_data = json.loads(html.text)
  File "C:\Users\lenovo-pc\Anaconda3\lib\json\__init__.py", line 354, in loads
    return _default_decoder.decode(s)
  File "C:\Users\lenovo-pc\Anaconda3\lib\json\decoder.py", line 339, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "C:\Users\lenovo-pc\Anaconda3\lib\json\decoder.py", line 357, in raw_decode
    raise JSONDecodeError("Expecting value", s, err.value) from None
json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

Process finished with exit code 1

求助!利用pycharm爬取拉勾网Python相关职位招聘信息,报错json.decoder.JSONDecodeError相关推荐

  1. 爬取实习吧与python相关的招聘信息及分析与数据可视化

    大数据时代,计算机行业蓬勃发展,越来越多的人投身计算机事业养家糊口.所以该如何选择工作,现在社会需要怎么样的计算机人才,我们该如何对应的提升自己的本领都是尤为重要的.这篇文章就是对实习吧招聘网站有关p ...

  2. python爬取boss直聘招聘信息_年底啦,利用Python爬取Boss直聘的招聘信息,为明年跳槽做准备...

    原标题:年底啦,利用Python爬取Boss直聘的招聘信息,为明年跳槽做准备 前言 为什么都说程序员的薪资高,但是刚开始入职的你,薪资并不是自己想象中的那样,首先是你的工作经验不足,其次就是需要不断的 ...

  3. Python笔记-爬取Boss直聘的招聘信息

    Python笔记-爬取Boss直聘的招聘信息 最近迷上了爬虫,爬取招聘信息,存在MongoDB上 代码思路和上一篇爬取酷狗TOP500差不多,但是在使用CSS选择器的时候,有两组信息是连在一起,所以使 ...

  4. python爬取前程无忧当日的全部招聘信息

    用了几天时间写成的爬取前程无忧的当日的招聘信息,通过多线程的方式同时爬取多个城市的信息,作为资料保存下来,一下是完整代码,可以直接复制粘贴爬取 这里爬取的数据条件是是24小时内,周末双休的,会在当前文 ...

  5. 【爬虫基础】爬取学校官网分页招聘信息

    **爬取某学校就业网站招聘信息** 用到的包 from urllib.request import urlopen import requests import json 一.获取不同页面的url 在 ...

  6. python提示jsondecodeerror是什么意思_python中报错json.decoder.JSONDecodeError: Expecting value:的解决...

    在学习python语言中用json库解析网络数据时,我遇到了两个编译错误:json.decoder.JSONDecodeError: Expecting property name enclosed ...

  7. python爬取拉勾网给定关键词职位信息存入数据库_Python 爬取拉勾网python职位信息...

    今天的任务是爬取拉勾网的职位信息. 首先,我们进入拉勾网,然后在职位搜索栏搜索Python 的同时,打开控制面板F12,来查看网页构成. 在XHR里,可以清楚的看见Ajax请求,所以需要使用sessi ...

  8. python——利用正则表达式爬取豆瓣读书中的图书信息

    本来可以使用一条正则表达式完成图书信息的爬取,结果发现在CPU性能较差的电脑上进行爬取时耗时非常长,几乎无法将结果获取到.所以,将大的html源码先经过一次简单的匹配以获取到一个中间结果,然后再从中间 ...

  9. 二十七、 爬取Boss直聘的招聘信息

    对于之前学的知识,作一个整合,爬取有点难度的boss招聘.不知不觉,七月份已经过去了,传说中的暑假实习招聘也应该随之结束了,我还是那个屌丝,发了几份,结果屁都没有,可能我是一个屌丝. 目标:爬取bos ...

最新文章

  1. android开机自动运行程序
  2. RAC 实例 迁移到 单实例 -- 使用导出导入
  3. 解决Cannot convert a symbolic Tensor (lstm/strided_slice:0) to a numpy array.
  4. Elasticsearch-Jest 配置ES集群源码解读
  5. 小甲鱼python课后答案40讲_小甲鱼Python第二十讲课后习题---021
  6. 当深度学习遇上量化交易——公开信息篇
  7. 【机器学习】最大熵模型(Maximum Entropy Model)
  8. sqlserver 存储过程 C#调用 实现从数据库Get数据
  9. 五子棋(机器人随机下棋简单版本)
  10. APP社交类源代码分享直接上车
  11. php 按指定长度分割字符串,php实现将字符串按照指定距离进行分割的方法
  12. 电子密码锁设计(附源码和原理图)
  13. LANP 配置文件
  14. 英语语音篇 - 元音自然拼读
  15. Docker常用命令(基础)
  16. re模块day17课堂小结
  17. Win10系统怎么卸载软件
  18. C++贪吃蛇的简单实现版
  19. currentFrame / totalFrames / framesLoaded
  20. 武汉理工大学博士生导师计算机,博士学位论文预答辩公告-武汉理工大学计算机学院.DOC...

热门文章

  1. Z-Stack NV操作
  2. vb+flash 开发常见问题之--保存时出现错误:“系统错误H80004005(-2147467259),未指定的错误”
  3. Fiddler 502问题
  4. Spring源码深度分析一-Spring前世今生以及源码学习路线图
  5. 主页EGE图形库下载教程
  6. Spring下载教程(保姆级)
  7. Mysql 中的日期时间函数汇总
  8. python程序员是怎么给宝宝取名字的
  9. 论文阅读《Vision-Aided RAIM: A New Method for GPS Integrity Monitoring in Approach and Landing Phase》1
  10. 谈谈proxy的安全问题