美赛论文成绩批量爬取

主要使用了requests的包进行了简单的爬取,关键是美赛论文组没有对其进行防爬取处理,不然的话,估计就难了.
代码主要是从2127310号进行爬取的,然后爬取了50组的数据,经查看是完全可行的。

import requests
import time
import re
import random
import urllibpath = r'E:\美赛\ '
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/73.0.3683.103 Safari/537.36'
}
def get_urls():str1=2127310a=1;url_list=[]while(a<50):str2=str(a+str1)a+=1url = "https://www.comap-math.com/mcm/2021Certs/"+str2+".pdf"url_list.append(url)return url_listdef get_text(url):res = requests.get(url, headers=headers)res.encoding = res.apparent_encodingtry:with open(path + f'{name}.pdf', 'wb') as f:f.write(res.content)print(f'{name} 下载完成')except Exception:print("Exception")name = 10
urls = get_urls()
for url in urls:print(url)name+=1get_text(url)time.sleep(random.randint(1, 3))

美赛论文成绩批量爬取相关推荐

  1. 【Python爬虫】2022年数学建模美赛B题数据爬取

    2022年数学建模美赛B题数据爬取 背景 2022年的美赛刚刚落下帷幕,该题的一个主要难点在于数据的获取.很多人无法找到有效的数据,或者是无法获取数据. 比如找到了如下米德湖的水文数据,但是发现并没有 ...

  2. 科研神器-SCI论文批量爬取

    我是目录 项目简介 依赖网站 环境配置 1.关键词导出论文信息 2.依据关键词批量下载SCI论文 总结 References 项目简介 **本期教程以关键词摘要SCI论文为例,稳定自动批量爬取Sci- ...

  3. python实战-HTML形式爬虫-批量爬取电影下载链接

    文章目录 一.前言 二.思路 1.网站返回内容 2.url分页结构 3.子页面访问形式 4.多种下载链接判断 三.具体代码的实现 四.总结 一.前言   喜欢看片的小伙伴,肯定想打造属于自己的私人影院 ...

  4. 【Python爬虫】从零开始爬取Sci-Hub上的论文(串行爬取)

    [Python爬虫]从零开始爬取Sci-Hub上的论文(串行爬取) 维护日志 项目简介 步骤与实践 STEP1 获取目标内容的列表 STEP2 利用开发者工具进行网页调研 2.1 提取文章链接和分页链 ...

  5. 2023年美赛论文写作方法——图表篇:美赛O奖中那些好看的图表是如何制作的?

    思路:永久更新,全网最新最全,持续更新中,查看最下方QQ群获取. 2023年美赛论文写作方法--图表篇:美赛O奖中那些好看的图表是如何制作的? 相信很多关注七七的小伙伴们都知道数模论文最重要的是:简洁 ...

  6. 美图 html模板,httpclient爬取美图

    httpclient批量爬取性感美图,完整源码. 资源下载此资源下载价格为2D币,请先登录 资源文件列表 GetGoodPic/.classpath , 1215 GetGoodPic/.mymeta ...

  7. python3 requets+re 批量爬取千千(原百度)音乐

    以前实验室同学需要文章和音乐,需要用爬虫爬.....要做东西参加比赛,表示好久都没写爬虫了....正如今天的正题,批量爬取千千音乐(原百度音乐)...博主会写下爬取的过程和心得(采坑记录),批量下载的 ...

  8. 从新浪微博搜索站点中超大批量爬取新浪微博内容方法和核心源码(java)

    最近做项目需要从新浪微博中大批量爬取新浪微博数据,当然大家熟知的方法就是使用API来获取数据,但是这样有个限制,只能搜索相应用户的home_timeline,不能按关键字大批量(几十万甚至百万千万级别 ...

  9. python自动搜索爬取下载文件-python批量爬取下载抖音视频

    本文实例为大家分享了python批量爬取下载抖音视频的具体代码,供大家参考,具体内容如下 import os import requests import re import sys import a ...

  10. python爬取抖音用户数据_python批量爬取下载抖音视频

    本文实例为大家分享了python批量爬取下载抖音视频的具体代码,供大家参考,具体内容如下 import os import requests import re import sys import a ...

最新文章

  1. ant扩展应用的安装
  2. 【Lolttery】项目开发日志 (二) 数据库的二三事
  3. 解决element-ui table 表格排列错位问题
  4. java 日期操作工具类_java8操作日期的工具类
  5. java图片资源存放_Java编程中图片文件放哪
  6. jQuery 插件autocomplete 应用
  7. 详细分析 Chrome V8 JIT 漏洞 CVE-2021-21220
  8. android studio 自动引用,Android Studio三方引用报错但是项目可以运行的解决方案
  9. python列表可以放多少个字符串_列表中可以放多少个字符串( )_学小易找答案
  10. ORCAD元件的批量替换与更新
  11. nginx 499状态码
  12. 外包干了三年,废了。
  13. iOS 上的FlexBox布局
  14. 2017年中国软件业务收入报告新鲜出炉,华为以2178亿元连续16年蝉联榜首
  15. OV7725摄像头的彩色图像采集原理与液晶显示《一》
  16. CS品牌SD NAND(贴片式T卡)和儿童摇摇车搭配资料
  17. (吊灯止损和YOYO止损) --- ATR作为入场工具的应用示例
  18. Spark创建空的DataFrame
  19. 【实战佳作】微软的《编程之美》
  20. could not connect to any x display

热门文章

  1. 云队友丨十年寒窗苦读为什么赢不过几代人的努力?
  2. 【解决方案】Collecting package metadata (current_repodata.json): failed
  3. Collecting package metadata (current_repodata.json): fail亲测成功
  4. c++ de-mangle 反编译器命名工具:c++filt
  5. OK6410之uboot移植
  6. 修改网页中的内容与打印网页
  7. A* operator/(A*, A*)‘ must have an argument of class or enumerated type
  8. Unity 科大讯飞离线语音合成
  9. 模电--反馈电路的综合判断
  10. i5和i7哪个适合计算机网络,i5和i7的区别