通过java中的.net包抓取网页上的数据,并且自动生成文件,详细代码如下:

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.nio.charset.Charset;

public class test {

public static void main(String[] args) throws IOException{
String charset = "utf-8";
URL url = new URL("http://www.sina.com.cn/");
BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(),charset));
BufferedWriter write = new BufferedWriter(new FileWriter("data.html"));
String line;
while ((line = reader.readLine()) != null) {
System.out.println(line);
write.write(line);
write.newLine();
}
reader.close();
write.close();
}
}

java爬取任何指定网页得数据相关推荐

  1. java抓取页面数据_通过java抓取任何指定网页的数据

    假设你需要获取51job人才网上java人才的需求数量,首先你需要分析51job网站的搜索这一块是怎么运作的,通过解析网页的源代码,我们发现了以下一些信息: 1. 搜索时页面请求的URL是 http: ...

  2. 利用Java爬取基金网站的基金数据,快速筛选优质热门基金

    爬取数据源为天天基金网的页面基金数据 利用java爬取基金数据并简单筛选后的效果图 创建java maven项目,推荐用spring boot maven需要引入的jar包依赖 <!--lomb ...

  3. java爬取国内飞机航班轨迹数据jsoup的探索

    接到一个爬虫项目,java编写的调用jsoup.来调取国内民航的轨迹.第一步,先进行根据飞机所属于的航空公司,然后根据改航空公司爬出所有的的航班号.第二步,根据查询出的航班号进行飞行轨迹的的数据爬去. ...

  4. python爬取B站网页排行榜数据(进阶版)

    我们已经在基础版本中获取了网站的排行,更新状态,名称,播放量,弹幕量和综合评分. 如下图所示,没看过基础版的建议先去基础版把前面的代码看完,这边不会再讲. 我们这次的目标是获取B站动漫的点赞量,投币数 ...

  5. java爬取网页数据_如何使用爬虫工具采集数据

    网络爬虫是一种按照一定规则,自动抓取万维网数据的脚本.按照一定规则,指的是爬虫程序需要解析网页的dom结构,针对dom结构爬取自己感兴趣的数据. (图1) 这就是一个网页源码的dom结构,我们需要一级 ...

  6. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索

    Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...

  7. 【用Java爬取网页图片——爬虫爬取数据】

    用Java爬取网页图片--爬虫爬取数据 1.在创建项目中导入jsoup 2.创建一个保存下载图片的路径 3.使用URL读取网页路径,jsoup读取网页内容 4.利用属性标签获取图片连接块 5.因为该路 ...

  8. java爬取网页数据_Python网络爬虫实战(二)数据解析

    Python网络爬虫实战 (二)数据解析 本系列从零开始阐述如何编写Python网络爬虫,以及网络爬虫中容易遇到的问题,比如具有反爬,加密的网站,还有爬虫拿不到数据,以及登录验证等问题,会伴随大量网站 ...

  9. 龙岭迷窟真的这么好看?今天我们就用 Java 爬取豆瓣数据好好分析一下!

    每天早上七点三十,准时推送干货 首图来自最近热播的『鬼吹灯之龙岭迷窟』,看过上一部『鬼吹灯之怒晴湘西』同学应该能看懂这个笑点.潘粤明老师上一部还是卸岭魁首陈玉楼,这一部摇身一变成了胡八一. 好了,不扯 ...

最新文章

  1. mybatis入门篇(四):mybatis动态SQL
  2. 【小白的CFD之旅】20 计算区域的构建
  3. 分析java中文乱码的原因
  4. linux的apache2.4限定某个目录禁止解析PHP及user_agent与PHP相关配置
  5. 优化的交换排序(冒泡排序)_C程序实现优化的冒泡排序
  6. C#SQL注入检测——特别是对于旧版.NET代码
  7. 一个OOP的课程设计,不难实现,贴出来请大家指正。
  8. ios 初体验窗口的创建
  9. 关于 Visual Studio 2017 ,或2019 ,Installer 没检测到已安装的程序.以及C++ 创建项目失败...
  10. python中的__init__ 、__new__、__call__等内置函数的剖析
  11. 如何保障科技产品供应链的安全?
  12. 爬取三个acm网站题库(neuqoj pku hdu)
  13. 基于matlab 自适应滤波,基于Matlab的自适应滤波器的设计及仿真
  14. Retina屏图片适配
  15. android通讯录开发二 数据表各字段含义
  16. 第一行代码 第三版 第11章网络技术 11.6.1 Retrofit 应用 报错:android.system.ErrnoException: isConnected failed: ECONNRE
  17. 码云(Gitee)团队如何使用码云完成开发?
  18. 气象ts评分_中国气象局--国家气候中心--气候系统监测·诊断·预测·评估
  19. 计算机毕业设计Java大学生学籍管理系统(源码+系统+mysql数据库+lw文档)
  20. macbook查询本机IP和网卡mac地址

热门文章

  1. 安智汽车完成数千万元 A+轮融资,加速进入量产落地快车道...
  2. CentOS安装Docker详细步骤
  3. NOPI读取Excel
  4. matlab合理分配席位_席位分配问题的Dhondt模型和相对尾数模型 -
  5. C语言循环语句实训项目,C语言程序设计与项目实训
  6. 图像拼接(SIFT与PTGUI)
  7. 阿里云虚拟主机部署TP5项目绑定二级目录解决办法
  8. 贝塞尔矫正2,公式推导
  9. android fake gps,Fake GPS Position
  10. 云就是网络,云计算呢