httplib下载http链接的DOC文档
有时候用urllib库下载http链接的DOC文档时,得到的内容并不是预期想要的,也许是http链接的时候没有加header头伪装浏览器的原因,用httplib库可以避免这一问题:
import httplib def sendhttp2():h = httplib.HTTP("www.nbjdfy.gov.cn" )h.putrequest('GET',"/File/cpws_import09/%E6%89%A7%E8%A1%8C/%EF%BC%882012%EF%BC%89%E7%94%AC" "%E4%B8%9C%E6%89%A7%E6%B0%91%E5%AD%97%E7%AC%AC1206%E5%8F%B7.doc")h.putheader('Content-Type', 'application/x-www-form-urlencoded')h.putheader('User-Agent', 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 ' '(KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36')h.putheader('Accept', 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8')h.putheader('Accept-Language', 'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3')h.putheader('Accept-Encoding', 'gzip, deflate, sdch')h.putheader('Connection', 'keep-alive')h.endheaders(None)errcode, errmsg, headers = h.getreply()content_file = h.getfile()with open("E:\http4.doc",'wb') as fp:fp.write(content_file.read())
httplib下载http链接的DOC文档相关推荐
- Maven依赖下载源码和doc文档
maven可以做jar包管理.项目编译等.jar下载的同时需要下载jar包对应的源码和doc文档.尤其是源码,阅读源代码. (1).maven用命令下载源码和doc文档 mvn dependency: ...
- java实现保存合同模板_Java中常用到的文件操作那些事(一)——替换doc文档模板,生成真实合同案例...
工作中,我们时常会遇到一些操作文件的操作,比如在线生成合同模板,上传/下载/解析Excel,doc文档转为pdf等操作.本文就已工作中遇到的在线生成合同为例,简要地介绍一种文档替换写法. 本文目的:给 ...
- 将doc文档生成html页面
小编在参与某个项目的时候,产品经理要求将产品的操作指南生成html页面的形式直接以链接的形式在管理后台中进行查看,当听到这个要求时小编是相当头疼啊,产品的操作指南将近百来页,不可能手动一页页做成htm ...
- pdf文档转化为doc文档 (转载)
1.1 pdf文档 PDF(Portable Document Format)文件格式是Adobe公司所开发的一种特殊的文本格式,这种文本格式最大的优点是其尺寸较小.阅读方便,非常适合在网络上传播和 ...
- SpringBoot集成OpenOffice实现doc文档转html
场景 OpenOffice OpenOffice.org(通称OpenOffice:简称OOo或OO.o)是一套开放源代码的办公室软件,可以在多种操作系统上运作. 默认的文件交换格式是已经成为ISO标 ...
- 让IE浏览器提示下载或直接打开word文档
核心提示:点击一个指向.doc类型的文件后,怎样不直接在IE里打开,而是弹出一个对话框提示用户想下载还是打开.让IE浏览器提示下载或直接打开word文档 点击一个指向.doc类型的文件后,怎样不直接在 ...
- 下载 Java 学习的权威文档
JVMS 和 JLS 文档的下载 快速直达: https://docs.oracle.com/javase/8/ --> Java Language and Virtual Machine Sp ...
- Kindle Paperwhite 越狱/加字体/支持PDF、EPUB、DjVu、FB2、CHM和DOC文档
0. 升级 官网固件升级:http://www.amazon.com/gp/help/customer/display.html/ref=hp_left_cn?ie=UTF8&nodeId=2 ...
- 完美解决,用Linux打开和编辑doc文档~
写这篇的原因在于我无法在centos下打开wps,打开就会闪退,网上也没有找到解决的办法,索性使用另外一款软件openoffice. 一.软件下载 Openoffice下载地址:https://www ...
最新文章
- oracle 事务故障,处理Oracle的分布式事务故障
- 判断客户浏览器是否支持cookie
- 淘宝网消费者年维权成功金额达1.69亿
- e-mobile帐号状态存在异常_个体工商经营户解除异常名录操作步骤(暂执行)
- JS基础语法(03)-前自增与后自增区别
- MySQL查询count(*)、count(1)、count(field)的区别收集
- java中注解的解析_全面解析Java中的注解与注释
- mysql 备份html数据_MySQL自动化生成HTML页面(导出数据)极限SQL编程-sql文件怎么打开...
- 计算机编程要哪方面天赋,编程要哪门子天赋
- Nginx进程间的通信机制
- Django:保持会话状态cookies和session(1)
- go set up on ubuntu
- python imagedraw line_修复PIL.ImageDraw.Draw.宽线条线条线条
- 解决Ubuntu安装tensorflow报错:tensorflow-0.5.0-cp27-none-linux_x86_64.whl is not a supported wheel on this
- 通过pyproj进行WGS84到UTM坐标的转换
- 六面体单元matlab后处理,《有限元基础教程》_【MATLAB算例】基于节点六面体单元的空间块体分析(HexahedralDNode).doc...
- charles抓取移动端的htpps
- How to covert HEIF to JPG with Java
- 2.16VINETIC需要解决的问题
- “二舅”火了,自媒体短视频“爆火”的基本要素,你知道吗?