python 爬取抖音ID 粉丝量,点赞 联系方式 day3
抖音使用的是字体加密, 正常浏览器访问是字体映射的,爬虫不行
成功效果图
正常的抓包是无法查看的
字体
代码
# -*- coding: utf-8 -*-"""
@Time : 2020/5/16
@Author : Administrator
@File : 抖音
@Description :
"""
import requests
from fontTools.ttLib import TTFont
import re#读取字体文件
ttfont = TTFont('11110.woff')best_cmap = ttfont['cmap'].getBestCmap()def get_best_cmap():'''这个函数用来返回映射表:return: 返回映射表'''new_best_cmap={}for key , value in best_cmap.items():# print(hex(key),value)new_best_cmap[hex(key)] = valuereturn new_best_cmapdef get_num_cmap():num_map={"x":"","num_":"1","num_1":"0","num_2":"3","num_3":"2","num_4":"4","num_5":"5","num_6":"6","num_7":"9","num_8":"7","num_9":"8",}return num_mapdef get_html(url):headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36'}response = requests.get(url=url,headers=headers).textreturn responsedef replace_num_and_cmap(result,response):for key, value in result.items():if key in response:response = re.sub(key,value , response)return response#baocun
def save_to_file(response):with open('douyin.html','w',encoding='utf-8')as fp:fp.write(response)def map_cmap_num(get_best_cmap,get_num_cmap):result = {}for key, value in get_best_cmap().items():key = re.sub('0','&#',key,count=1)+ ';'result[key] = get_num_cmap()[value]return resultif __name__== '__main__':result = map_cmap_num(get_best_cmap,get_num_cmap)print(result)url = input('输入URL:')# url = 'https://www.iesdouyin.com/share/user/58716066405?u_code=3c9edf8m8841&sec_uid=MS4wLjABAAAAptNUNdQitdIHL1mPp4cLcr7rTPhhQLAXBQIMjKlKMpQ×tamp=1589354490&utm_source=copy&utm_campaign=client_share&utm_medium=android&share_app_name=douyin'response = get_html(url)response = replace_num_and_cmap(result,response)save_to_file(response)
python 爬取抖音ID 粉丝量,点赞 联系方式 day3相关推荐
- 用Python爬取抖音短视频实战,如此简单
前言 抖音,是一款可以拍短视频的音乐创意短视频社交软件,该软件于2016年9月上线,是一个专注年轻人的15秒音乐短视频社区.用户可以通过这款软件选择歌曲,拍摄15秒的音乐短视频,形成自己的作品.此AP ...
- python爬取抖音用户数据_使用python爬取抖音视频列表信息
如果看到特别感兴趣的抖音vlogger的视频,想全部dump下来,如何操作呢?下面介绍介绍如何使用python导出特定用户所有视频信息 抓包分析 Chrome Deveploer Tools Chro ...
- Python爬取抖音用户相关数据(目前最方便的方法)
import json import urllib.parse import requeststestId = 'J1DaRdD'def getFansNum(strSecUid):'''获取粉丝数: ...
- Python爬取抖音app视频
作者:哈库呐玛塔塔 来源:https://urlify.cn/ANzAre 记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitm ...
- 青灯教育python免费公开课_如何使用Python爬取抖音APP视频
记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 假 ...
- 使用python爬取抖音app视频(appium可以操控手机)
记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...
- python爬取抖音用户评论_python实现模拟器爬取抖音评论数据的示例代码
目标: 由于之前和朋友聊到抖音评论的爬虫,demo做出来之后一直没整理,最近时间充裕后,在这里做个笔记. 提示:大体思路 通过fiddle + app模拟器进行抖音抓包,使用python进行数据整理 ...
- 教你用python爬取抖音app视频
记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...
- 使用python爬取抖音app视频
记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...
最新文章
- Deepmind最新研究:从图表示学习看算法推理
- leetcode-寻找两个正序数组的中位数
- 面试前必看:Redis 和 Memcached 的区别
- 一文搞懂负载均衡中的一致性哈希算法
- 王者荣耀8月15日服务器维护,王者荣耀8月15日更新维护到什么时候 王者荣耀8月15日更新时间分享...
- adb echo shell 覆盖_一次写shell脚本的经历记录
- flash动画制作作品_flash施工动画制作应该展现哪些内容
- python英文词频统计去除定冠词_使用Python进行英文词频统计
- weblogic进程自动关闭_手机总是清理内存?原来是6个设置没关,1秒关闭多用3年...
- 黄聪:360浏览器、chrome开发扩展插件教程(1)开发Chrome Extenstion其实很简单
- 高中计算机会考操作题网页制作,高中信息技术会考网页制作操作知识点Word
- ec6108v9a精简刷机包_华为悦盒无安装限制固件下载|华为悦盒EC6108V9A第三方精简流畅无安装限制固件 下载 - 巴士下载站...
- 等值线图的Python绘制方法
- linux上的WPS不显示图片,在deepin中解决单击wps图标没反应、两个wps图标的问题
- SEO内部优化与SEO外部优化
- torch.view()详解及-1参数是什么意思
- vue自定义数字键盘
- 有关于TableGen的简单介绍
- 前后端交互学习笔记(二):Node.js及npm学习
- Hdu 3929 Big Coefficients (容斥原理 二项式性质)
热门文章
- 计算机单招知识点重点,(完整版)2018年单招考试《数学》必背知识点(一),推荐文档.docx...
- CCD与CMOS的比较
- ORA-01157 cannot identify/lock data file n 故障一例
- 分析了 7 万款 App,全是没想到
- pip安装mediapipe报错
- SimpleDateFormat yyyy-MM-dd HH:mm:ss
- 移动APP界面设计切图指南
- bboosgroups论坛访问地址:http://www.xtzy.com:800
- 有关epass1000nd 应用active控件的java示例_ePass1000ND
- 中国下一代广播电视网(NGB)100问