抓取html 中文乱码,利用代码抓取网页数据,出现中文乱码问题
嗯,多谢你解答。试验了,出现了另外一种乱码,自己又再次琢磨了http://club.excelhome.net/thread-893760-1-1.html这个帖子的第一帖,问题解决了,原因是'因为XMLHTTP默认是UTF-8(原网页正是 此编码格式),不能识别gb2312,会发现数据乱码,所以不能采用.responsetext对象来得到字符串。
Sub te4t()
Dim strRespText$, tt$, i&, DW$
On Error Resume Next
For i = 3 To 4
a = Cells(i, 1).Value
With CreateObject("Microsoft.XMLHTTP")
.Open "GET", a, False '要抓取的链接,"GET"尽量用大写,以免某些系统不兼容
.Send
tt = .responsetext
With CreateObject("new:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}") 'DataObject对象,数据放入剪贴板,记事本观察数据
.SetText tt '因为XMLHTTP默认是UTF-8,不能识别gb2312,会发现数据乱码
.PutInClipboard '所以不能采用.responsetext对象来得到字符串
End With
Set BytesToBstr = Server.CreateObject("Adodb.Stream")
tt = BytesToBstr(.responsebody, "GB2312") '因此要用Adodb.Stream对象
'tt = StrConv(.ResponseBody, vbUnicode, &H804) '或者StrConv函数,从.ResponseBody得到字符串
'tt = StrConv(.ResponseBody, vbUnicode) '因网页为GB2312,简体版的操作系统也可以不写第三个参数
With CreateObject("new:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}") '得到的字符串放入剪贴板,记事本观察数据
.SetText tt '数据正常显示,可以提取了
.PutInClipboard
End With
Cells(i, 2).Value = WorksheetFunction.Substitute(Split(Split(tt, "
")(1), "")(0), Chr(10), " ")
Cells(i, 3).Value = WorksheetFunction.Substitute(Split(Split(tt, "16.spid"" target=""_blank"">")(1), "
For j = 1 To 100
Cells(i, 3 + j).Value = WorksheetFunction.Substitute(Split(Split(tt, "")(j), "
If Cells(i, 3 + j) = "" Then GoTo xiayige
Next
xiayige:
End With
Next
MsgBox "【完】"
End Sub
换成这个代码问题就解决了。
抓取html 中文乱码,利用代码抓取网页数据,出现中文乱码问题相关推荐
- 计算机网络抓包设计,计算机网络实验利用wireshark抓包工具抓包
计算机网络实验利用wireshark抓包工具抓包 计算机网络实验[利用wireshark抓包工具抓包] 一.实验名称 使用网络协议分析仪 Wireshark 二.实验目的 1.掌握安装和配置网络协议分 ...
- python抓取交易所_Python百行代码抓取美股三大交易所历史数据
最近闲来无事,琢磨着去投资下美股,投资嘛,当然得先分析下市场行情个股行情啦, 分析就需要有数据,那么数据从哪里来呢,当然是从交易所官方网站获取咯.自己动手丰衣足食,于是花了点时间写个Python脚本来 ...
- 【Python爬虫】5行代码破解验证码+网页数据爬取全步骤详细记录
文章目录 前言 一.抓包分析 二.编写模块代码 1.引入库 2.获取验证码图片 3.识别验证码 4.爬取列表页 5.爬取详情页 6.完整代码 总结 1.TIPS 2.如需交流,可在代码头找到我,或者用 ...
- python爬取网易云_利用python爬取网易云音乐,并把数据存入mysql
作者:sergiojune Python爱好者社区--专栏作者 个人公众号:日常学python 专注python爬虫,数据可视化,数据分析,python前端技术 公众号:Python爱好者社区 获取本 ...
- python爬取图解_20行PYTHON代码爬取微博高清大图,小白练手绝佳案例
0. 前戏说明 环境说明 python3版本 所需库:Beautifulsoup .re .requests 知识点:正则表达式.基本网页请求与解析.文件写入 适用人群:小白 最终目标:20行代码爬取 ...
- c语言里取余数的运算的代码,Math——取模运算及取余运算(示例代码)
取模运算及取余运算 取余运算(Complementation)即我们小学时学的数学算术概念,而取模运算(Modulus Operation)常用于程序设计中 公式 a%b = a - (a/b * b ...
- python抓取网站图片_利用python抓取网站图片
看了网上关于python抓取网站图片的例子,所以自己也尝试着写一个,但是发现这个网站的src不是标准的路径,需要自己添加前面的目录地址,尝试了几次也不成功,所以希望有经验的朋友指导下. 本人是初学者, ...
- java抓取并保存图片_利用JAVA抓取网站的所有图片并保存于本地
由于今天我要保存一个网页上的所有图片并做一个ppt,但是这个网页比较蛋疼,是微信上的一个类似于动画的东西,所以没法保存整个网页然后直接取照片, 所以我采用java写了一个程序,采用类似于网络爬虫的思路 ...
- python爬取app图片_利用python爬取斗鱼app中照片方法实例
前言 没想到python是如此强大,令人着迷,以前看见图片总是一张一张复制粘贴,现在好了,学会python就可以用程序将一张张图片,保存下来. 最近看到斗鱼里的照片都不错,决定用最新学习的python ...
最新文章
- GGTalk ——C#开源即时通讯系统
- OD里alt+F9和Ctrl+F9和shift+F9的区别
- List集合与List的子类
- war 发布后页面不更新_一文看懂tomcat8如何配置web页面管理
- mysql decimal型转化为float_5分钟搞懂MySQL数据类型之数值型DECIMAL类型
- c++判断一个字符串里面有特殊符号_简单动态字符串(SDS)
- PHP自定义状态码数组
- Android Property
- 转载《2020年校招面经心得》
- snake与LunarLander源代码分析
- screen 使用命令
- cc++语言参考手册_C ++值类别快速参考:第2部分
- Linux下文件备份和同步的工具软件
- 【SRS】ATC模式和时间抖动矫正
- Yii2-Admin-Theme 基于layui的通用后台模板
- 黑客能追回被骗的钱吗
- matlab 画非线性曲线,MATLAB实例:非线性曲线拟合
- 微信商城开发:公众号平台接口配置及调试
- Python实现商品价格监控,识破双十一的套路
- hex和bin文件格式区别
热门文章
- 用SAP Authority Object 对权限控制
- 从Tronbull引狂欢,看APENFT与波场带来的新可能
- mysql5.6的安装步骤_MySQL5.6安装步骤
- 用java实现八皇后问题_使用java语言实现八皇后问题
- python发送邮件带附件_在python中如何发送带有附件的邮件?
- linux项目运行日志查看,Linux项目部署、后台启动和终止运行及查看日志信息_MQ...
- matlab调用q外部exe文件,Matlab GUI调用外部程序生成exe,DOS窗口输入问题
- fifo java_java linux fifo文件通信
- Jmeter内置函数功能(五)
- python中的reduce() 函数