1. <span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">截取到网页数据是js加载完以后的</span>
[csharp] view plain copy
  1. <span style="white-space:pre">    </span>    HtmlWeb webClient = new HtmlWeb();
  2. string _url = "http://news.baidu.com/";
  3. HtmlAgilityPack.HtmlDocument html1 = webClient.Load(_url);//是你需要解析的url
  4. var end3 = html1.Encoding.BodyName;//获取页面编码格式
  5. string _htmlSource = GetHtmlSource(_url, System.Text.Encoding.GetEncoding(end3));//还是需要设置一次编码格式避免乱码 调用<span style="font-family: Arial, Helvetica, sans-serif;">GetHtmlSource方法</span>
[csharp] view plain copy
  1. public static string GetHtmlSource(string url, Encoding charset)
  2. {
  3. string _html = string.Empty;
  4. try
  5. {
  6. HttpWebRequest _request = (HttpWebRequest)WebRequest.Create(url);
  7. HttpWebResponse _response = (HttpWebResponse)_request.GetResponse();
  8. using (Stream _stream = _response.GetResponseStream())
  9. {
  10. using (StreamReader _reader = new StreamReader(_stream, charset))
  11. {
  12. _html = _reader.ReadToEnd();
  13. }
  14. }
  15. }
  16. catch (WebException ex)
  17. {
  18. using (StreamReader sr = new StreamReader(ex.Response.GetResponseStream()))
  19. {
  20. _html = sr.ReadToEnd();
  21. }
  22. }
  23. catch (Exception ex)
  24. {
  25. _html = ex.Message;
  26. }
  27. return _html;
  28. }

C#网页数据采集(三)HttpWebRequest相关推荐

  1. php获取其他网站的cookie,php获取(curl) 带有cookie的网页数据采集方法

    今天早上呢小编打开我们的php中文网(www.php.cn)看到有网友在问php获取页面数据,需要带cookie,不知道如何写,我们网站的专职工程师第一时间响应并给了解决 方案,在这里呢我分享给大家一 ...

  2. 在HTML中使用CSS美化网页的三种方法

    在HTML中使用CSS美化网页的三种方法 CSS是Cascading Style Sheets(级联样式表)的缩写,CSS是一种样式表语言,用于为HTML文档定义布局.例如,CSS涉及字体.颜色.边距 ...

  3. python网页爬取方法_Python爬取网页的三种方法

    # Python爬取网页的三种方法之一:  使用urllib或者urllib2模块的getparam方法 import urllib fopen1 = urllib.urlopen('http://w ...

  4. java页面要素_Web前端入门技术之网页制作三要素

    原标题:Web前端入门技术之网页制作三要素 Web前端技术开发是由网页制作演变而来的,主要由HTML.CSS.Java三大要素组成.专业的Web前端开发入门常识也必定会包含这些内容,今日千锋教师就给我 ...

  5. java研发网页数据采集

    我觉得网页数据采集是一个不道德的行为,但是我喜欢.下面就说说我为什么喜欢. 某一天,小编看到喜欢的网页,很欣赏这个原创作者的作品,但由于小编穷,没法开通vip去下载资源,所以小编就运用一些网络技术进行 ...

  6. 一款全新的网页数据采集工具:爬山虎采集器

    特性 爬山虎采集器是一款全新的网页数据采集工具.作为一款工具软件,我们: 放弃了花哨的界面,换之以快速流畅的体验. 放弃了复杂的规则配置,开发了智能的自动提取算法. 在基于浏览器的可视化操作上,同时保 ...

  7. [功能发布]Excel催化剂2周年巨献-网页数据采集功能发布,满足90%合理场景使用...

    转眼间,Excel催化剂推出已经两周年,在此之际,献上数据时代最刚需的网页采集功能,无需苦苦寻觅各种工具,借助Excel催化剂过往数据处理.清洗功能,加上此轮的网页采集功能,一点不输于市面上的各种收费 ...

  8. html载入excel数据库,网页数据采集如何导出为Excel、CSV、Html、数据库、API格式_视频教程 - 八爪鱼采集器...

    本视频介绍数据查看与导出. 本地采集数据如有采到重复数据.将在点击"导出数据"后提示是否去除重复,可选将全部数据导出也可选去重后导出. 本地数据在导出后不会自动清除,下次可以再次导 ...

  9. java在网页填写集数据,java网页数据采集(中篇-数据存储)

    上期我们学习了html页面的数据采集,为了方便我们今后来调用收集到的数据,首先我们需要学习下如何将这些采集到的数据存储起来(MySql数据库). 打开MySql数据库,创建数据库 和表 (拷贝如下代码 ...

最新文章

  1. 网络中最常用的网络命令(2)-完整参数
  2. 【雷达对抗】频率测量与频谱分析-概述
  3. boost::fusion::for_each用法的测试程序
  4. 怎么检测计算机硬件好坏,驱动人生怎么看电脑硬件 硬件检测教程介绍
  5. JAVA 排序工具类
  6. Oracle RAC 修改 IP 地址
  7. Windows Phone 7(accelerometer)重力感应编程
  8. idea 代码编译打包不报错,但是代码显示报错
  9. datagrip 查看 blob_AppStore今日限免 不解锁屏幕通知中心查看日历等3款软件标题文章...
  10. 接口压测之Locust
  11. JS控制DIV的显示隐藏 。js中radio的取值 。JS控制select的方法(摘取)。js 控制表单中SELECT
  12. k3刷梅林5g信号不稳定_斐讯k3 5g信号不稳定 k3c路由器,现在还能入手吗?
  13. 机器人操作系统ROS是什么?
  14. C语言编程 - 推箱子小游戏源码分享 (含过关)
  15. 微信小程序的开发之手机号、邮箱验证
  16. 分布式系统生成唯一主键
  17. centos 日志审计_生产环境日志审计
  18. 腾讯云服务器配置code-server
  19. 常见的端口号以及协议
  20. 软件开发项目影响进度因素及控制浅谈

热门文章

  1. 解决mysql-5.5导入数据报错
  2. Apache 访问权限修改
  3. Android开发优化之——对界面UI的优化(经验分享)
  4. 巧用MySQL InnoDB引擎锁机制解决死锁问题
  5. CSS实现元素居中原理解析
  6. 携程供应商接口数据解密AES/CBC/PKCS5Padding
  7. 常见的数据库端口及查询方法
  8. GO语言初识(为go开发android做准备)
  9. 对象的引用和clone
  10. JQuery弹出窗口小插件ColorBox