事实上,如果您想以Java实现网页截图,也就是“输入一段网址,几秒钟过后就能截取一张网页缩略图”的效果。那么,您至少有3种方式可以选择。

1、最直接的方式——使用Robot

方法详解:该方法利用Robat提供的强大桌面操作能力,硬性调用浏览器打开指定网页,并将网页信息保存到本地。

优势:简单易用,不需要任何第三方插件。

缺点:不能同时处理大量数据,技术含量过低,属于应急型技巧。

实现方法:使用如下代码即可。

[java] view plain copy

  1. public static void main(String[] args) throws MalformedURLException,
  2. IOException, URISyntaxException, AWTException {
  3. //此方法仅适用于JdK1.6及以上版本
  4. Desktop.getDesktop().browse(
  5. new URL("http://google.com/intl/en/").toURI());
  6. Robot robot = new Robot();
  7. robot.delay(10000);
  8. Dimension d = new Dimension(Toolkit.getDefaultToolkit().getScreenSize());
  9. int width = (int) d.getWidth();
  10. int height = (int) d.getHeight();
  11. //最大化浏览器
  12. robot.keyRelease(KeyEvent.VK_F11);
  13. robot.delay(2000);
  14. Image image = robot.createScreenCapture(new Rectangle(0, 0, width,
  15. height));
  16. BufferedImage bi = new BufferedImage(width, height,
  17. BufferedImage.TYPE_INT_RGB);
  18. Graphics g = bi.createGraphics();
  19. g.drawImage(image, 0, 0, width, height, null);
  20. //保存图片
  21. ImageIO.write(bi, "jpg", new File("google.jpg"));
  22. }

2、最常规的方式——利用JNI,调用第三方C/C++组件

方法详解:目前来讲,Java领域对于网页截图组件的开发明显不足(商机?),当您需要完成此种操作时,算得上碰到了Java的软肋。但是,众所周知Java也拥有强大的JNI能力,可以轻易将C/C++开发的同类组件引为己用。

优势:实现简单,只需要封装对应的DLL文件,就可以让Java实现同类功能。

劣势:同其他JNI实现一样,在跨平台时存在隐患,而且您的程序将不再属于纯Java应用。

实现方法:可参见此用例,具体封装何种C/C++组件请自行选择。

PS:示例来源于ACA HTML to Image Converter项目(http://www.acasystems.com/en/web-thumb-activex/faq-convert-html-to-image-in-java.htm ),这是一个收费的HTML转Image第三方组件,但封装方式在Java中大同小异。

引用JNI封装:

[java] view plain copy

  1. import sun.awt.*;
  2. import java.awt.*;
  3. import javax.swing.*;
  4. import java.awt.event.*;
  5. import java.awt.*;
  6. import java.awt.peer.*;
  7. public class Snap
  8. {
  9. static
  10. {
  11. System.loadLibrary("Snap");
  12. }
  13. public static void main( String[] argv )
  14. {
  15. Snap t_xSnap = new Snap();
  16. t_xSnap.Start("http://www.google.com", "snapshot-google.png");
  17. }
  18. public native void Start(String pi_strURL, String pi_strImageName);
  19. }

CPP部分的实现:

[java] view plain copy

  1. #include <windows.h>
  2. #include <atlbase.h>
  3. #include "snap.h"
  4. #pragma comment(lib,"atl.lib")
  5. #import "./../../acawebthumb.dll" no_namespace
  6. JNIEXPORT void JNICALL Java_Snap_Start(JNIEnv *pEnv, jobject, jstring pi_strUrl, jstring pi_strFileName)
  7. {
  8. CoInitialize(0);
  9. _bstr_t t_strUrl = pEnv->GetStringUTFChars(pi_strUrl, 0);
  10. _bstr_t t_strFileName = pEnv->GetStringUTFChars(pi_strFileName, 0);
  11. IThumbMakerPtr HTML_Converter = NULL;
  12. HRESULT hr = HTML_Converter.CreateInstance(L"ACAWebThumb.ThumbMaker");
  13. if (SUCCEEDED(hr))
  14. {
  15. HTML_Converter->SetURL(t_strUrl);
  16. if ( 0 == HTML_Converter->StartSnap() )
  17. HTML_Converter->SaveImage(t_strFileName);
  18. }
  19. if (HTML_Converter)
  20. HTML_Converter.Release();
  21. CoUninitialize();
  22. }

以该组件图像化yahoo界面的效果图:

转存失败重新上传取消

3、最扎实的方法——自行解析HTML标记,并将其图像化

方法详解:众所周知,HTML之所以在浏览器中以具体的网页格式出现,并非服务器端传了一整个应用到客户端,而是源自于浏览器对于客户端自行解析的结果。因此,只要我们将对应的解析一一实现,那么将网页图形化,就将不是什么难事。

优势:纯Java实现,一劳永逸,一旦开发完成则永远通用,而且有一定的商用价值。

劣势:开发费时,且需要针对不同语法做精确分析,才能保证输出的基本正确。尤其在涉及到JavaScript解析时,难度将尤其增大。

实现方法:目前尚无具体案例可供参考。但是,由于Java有jdic之类的浏览器项目存在(https://jdic.dev.java.net/),而Java图形界面又属绘制生成。从理论上说,我们可以将所有具备Graphics的组件图形化保存。

而如果自行解析,那么您需要建立HTML解析器(或使用第三方的,万幸Java在这方面的组件很多),了解Java2D机制,了解何时该使用drawString绘制文字,何时又该使用drawImage插入图片等等。

补充:

这是一个利用内置浏览器截图的示例,使用了DJNativeSwing组件。

示例工程下载地址(Eclipse工程,含lib):http://greenvm.googlecode.com/files/Screenshot.7z

[java] view plain copy

  1. import java.awt.BorderLayout;
  2. import java.awt.Dimension;
  3. import java.awt.FlowLayout;
  4. import java.awt.image.BufferedImage;
  5. import java.io.File;
  6. import java.io.IOException;
  7. import javax.imageio.ImageIO;
  8. import javax.swing.JFrame;
  9. import javax.swing.JPanel;
  10. import javax.swing.SwingUtilities;
  11. import chrriis.dj.nativeswing.swtimpl.NativeComponent;
  12. import chrriis.dj.nativeswing.swtimpl.NativeInterface;
  13. import chrriis.dj.nativeswing.swtimpl.components.JWebBrowser;
  14. import chrriis.dj.nativeswing.swtimpl.components.WebBrowserAdapter;
  15. import chrriis.dj.nativeswing.swtimpl.components.WebBrowserEvent;
  16. public class Main extends JPanel {
  17. /**
  18. *
  19. */
  20. private static final long serialVersionUID = 1L;
  21. // 行分隔符
  22. final static public String LS = System.getProperty("line.separator", "/n");
  23. // 文件分割符
  24. final static public String FS = System.getProperty("file.separator", "//");
  25. //以javascript脚本获得网页全屏后大小
  26. final static StringBuffer jsDimension;
  27. static {
  28. jsDimension = new StringBuffer();
  29. jsDimension.append("var width = 0;").append(LS);
  30. jsDimension.append("var height = 0;").append(LS);
  31. jsDimension.append("if(document.documentElement) {").append(LS);
  32. jsDimension.append(
  33. "  width = Math.max(width, document.documentElement.scrollWidth);")
  34. .append(LS);
  35. jsDimension.append(
  36. "  height = Math.max(height, document.documentElement.scrollHeight);")
  37. .append(LS);
  38. jsDimension.append("}").append(LS);
  39. jsDimension.append("if(self.innerWidth) {").append(LS);
  40. jsDimension.append("  width = Math.max(width, self.innerWidth);")
  41. .append(LS);
  42. jsDimension.append("  height = Math.max(height, self.innerHeight);")
  43. .append(LS);
  44. jsDimension.append("}").append(LS);
  45. jsDimension.append("if(document.body.scrollWidth) {").append(LS);
  46. jsDimension.append(
  47. "  width = Math.max(width, document.body.scrollWidth);")
  48. .append(LS);
  49. jsDimension.append(
  50. "  height = Math.max(height, document.body.scrollHeight);")
  51. .append(LS);
  52. jsDimension.append("}").append(LS);
  53. jsDimension.append("return width + ':' + height;");
  54. }
  55. //DJNativeSwing组件请于http://djproject.sourceforge.net/main/index.html下载
  56. public Main(final String url, final int maxWidth, final int maxHeight) {
  57. super(new BorderLayout());
  58. JPanel webBrowserPanel = new JPanel(new BorderLayout());
  59. final String fileName = System.currentTimeMillis() + ".jpg";
  60. final JWebBrowser webBrowser = new JWebBrowser(null);
  61. webBrowser.setBarsVisible(false);
  62. webBrowser.navigate(url);
  63. webBrowserPanel.add(webBrowser, BorderLayout.CENTER);
  64. add(webBrowserPanel, BorderLayout.CENTER);
  65. JPanel panel = new JPanel(new FlowLayout(FlowLayout.CENTER, 4, 4));
  66. webBrowser.addWebBrowserListener(new WebBrowserAdapter() {
  67. // 监听加载进度
  68. public void loadingProgressChanged(WebBrowserEvent e) {
  69. // 当加载完毕时
  70. if (e.getWebBrowser().getLoadingProgress() == 100) {
  71. String result = (String) webBrowser
  72. .executeJavascriptWithResult(jsDimension.toString());
  73. int index = result == null ? -1 : result.indexOf(":");
  74. NativeComponent nativeComponent = webBrowser
  75. .getNativeComponent();
  76. Dimension originalSize = nativeComponent.getSize();
  77. Dimension imageSize = new Dimension(Integer.parseInt(result
  78. .substring(0, index)), Integer.parseInt(result
  79. .substring(index + 1)));
  80. imageSize.width = Math.max(originalSize.width,
  81. imageSize.width + 50);
  82. imageSize.height = Math.max(originalSize.height,
  83. imageSize.height + 50);
  84. nativeComponent.setSize(imageSize);
  85. BufferedImage image = new BufferedImage(imageSize.width,
  86. imageSize.height, BufferedImage.TYPE_INT_RGB);
  87. nativeComponent.paintComponent(image);
  88. nativeComponent.setSize(originalSize);
  89. // 当网页超出目标大小时
  90. if (imageSize.width > maxWidth
  91. || imageSize.height > maxHeight) {
  92. //截图部分图形
  93. image = image.getSubimage(0, 0, maxWidth, maxHeight);
  94. /*此部分为使用缩略图
  95. int width = image.getWidth(), height = image
  96. .getHeight();
  97. AffineTransform tx = new AffineTransform();
  98. tx.scale((double) maxWidth / width, (double) maxHeight
  99. / height);
  100. AffineTransformOp op = new AffineTransformOp(tx,
  101. AffineTransformOp.TYPE_NEAREST_NEIGHBOR);
  102. //缩小
  103. image = op.filter(image, null);*/
  104. }
  105. try {
  106. // 输出图像
  107. ImageIO.write(image, "jpg", new File(fileName));
  108. } catch (IOException ex) {
  109. ex.printStackTrace();
  110. }
  111. // 退出操作
  112. System.exit(0);
  113. }
  114. }
  115. }
  116. );
  117. add(panel, BorderLayout.SOUTH);
  118. }
  119. public static void main(String[] args) {
  120. NativeInterface.open();
  121. SwingUtilities.invokeLater(new Runnable() {
  122. public void run() {
  123. // SWT组件转Swing组件,不初始化父窗体将无法启动webBrowser
  124. JFrame frame = new JFrame("以DJ组件保存指定网页截图");
  125. // 加载指定页面,最大保存为640x480的截图
  126. frame.getContentPane().add(
  127. new Main("http://blog.csdn.net/cping1982", 640, 480),
  128. BorderLayout.CENTER);
  129. frame.setSize(800, 600);
  130. // 仅初始化,但不显示
  131. frame.invalidate();
  132. frame.pack();
  133. frame.setVisible(false);
  134. }
  135. });
  136. NativeInterface.runEventPump();
  137. }
  138. }

java实现的截取网页图片的方式相关推荐

  1. android截取网页图片,安卓版谷歌浏览器很快将获得滚动截图功能 可以用来截取整个网页...

    截图功能对用户来说应该是非常常用的功能,然而有时候截取网页时可能需要我们进行多次截图再拼接截图图片. 为解决这种问题现在已经有些软件提供滚动截图功能,滚动截图可帮助用户一次性将整个网页内容截图无需拼接 ...

  2. 7种网页图片切换方式代码

    jQuery图片鼠标滑动展开切换特效代码 jQuery图片书架取书特效代码 网页图片点击前后切换特效代码 jQuery图片选项卡展示 html5图片切换jquery动画展开特效 html5图片3d切换 ...

  3. 前端优化-网页图片优化

    前端在工作中,一定会经常涉及到图片,甚至很多人认为前端就是切图的,还有人说前端是用div+css布局的,如果从事了这项工作,你一定不这么认为,相信大家都知道前端绝对不是用PS切片工具把网页切成小图片这 ...

  4. Java 爬取网页图片并下载

    Java 爬取网页图片并下载 源码; package a; import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup. ...

  5. java实现专门爬取网页图片的软件

    发现我的不足: 1.对awt和swing的使用十分的差劲,时不时就要查一下博客... 可以做一个专门爬取网页图片的软件,功能已经实现了,就UI对应的设计一下就好了. 做完了..虽然有很大的局限,但是功 ...

  6. java 多线程数据异步加载图片_JAVA多线程超时加载当网页图片

    先上图: 这一次没有采取正则匹配,而采取了最简单的java分割和替代方法进行筛选图片 它能够筛选如下的图片并保存到指定的文件夹 如: "http://xxxx/xxxx/xxx.jpg&qu ...

  7. js实现截取网页上特定位置的图片打印或保存

    js实现截取网页上特定位置的图片打印或保存 一.实现思路   具体思路是创建一个宽和高都是100%的canvas,使其能够覆盖整个页面,然后根据所要截取的图片起始位置相对于canvas的位置(因为是1 ...

  8. jquery实现截取pc图片_如何优雅的对网页截取长图

    苏生不惑第115 篇原创文章,将本公众号设为星标,第一时间看最新文章. 最近写文章想截个长图,才发现一直使用的QQ早有这个功能了,这里就整理几个pc上网页长截图的方案. qq滚动截图 qq截图应该很多 ...

  9. java爬虫-简单爬取网页图片

    刚刚接触到"爬虫"这个词的时候是在大一,那时候什么都不明白,但知道了百度.谷歌他们的搜索引擎就是个爬虫. 现在大二.再次燃起对爬虫的热爱,查阅资料,知道常用java.python语 ...

最新文章

  1. 凤凰网广告包装的js
  2. 简单的3个SQL视图搞定所有SqlServer数据库字典
  3. python opencv ImportError: libGL.so.1: cannot open shared object file: No such file or directory
  4. Revit Family API 添加参数与尺寸标注
  5. linux生成公钥实现ssh,linux下生成 SSH 公钥,用于GitHub
  6. Jscript中window.setInterval和window.setTimeout的区别
  7. 面试题系列-redis连环11问
  8. c++ vscode 第三方库_请教下,vscode中怎么编译带第三方库的文件呢?谢谢! - C++程序设计语言 - CPlusPlus - 水木社区...
  9. Harmonic Number (II) LightOJ - 1245 (找规律?。。。)
  10. oracle r11,Oracle XML Publisher在Oracle R11i中的实际运用
  11. jave 逻辑运算 vs 位运算 + Python 逻辑运算 vs 位运算
  12. H264格式 详细介绍
  13. 输血和输血反应题库【1】
  14. 月夜无声,谁与我醉今宵
  15. 【火炉炼AI】机器学习044-创建隐马尔科夫模型
  16. 成都绿源电动车店寻“新欢”,只这一试,我就认定了
  17. 机房动环监控系统方案组成及应用
  18. 软件工程是不是教会不怎么会写程序的人开发软件?你的观点?
  19. 【NLP】keras Transformer 唐诗生成器
  20. Git、GitHub、Gitee、GitLab的学习

热门文章

  1. RocketMQ消息刷盘
  2. python之 模拟简单图书馆
  3. 千亿独角兽亏损31亿,装下链家的贝壳上市后如何装下利润?
  4. 贪心算法——Dijkstra
  5. 判断一个数是质数还是合数
  6. 参考二:双缝干涉进(变)化(态)史
  7. ArcGIS Pro导入Revit数据(rvt->slpk)
  8. 双足式机器人是如何实现的?
  9. PSCAD中的单位系统
  10. 腾讯大数据第四代数智融合计算平台正式发布!引领大数据计算进入下一时代