1.最近在做java爬虫,使用的是webmagic框架,为了使用xpath2.0的语法引入了webmagic-saxon的依赖,导致出现报错:

java.lang.RuntimeException: XPathFactory#newInstance() failed to.....Illegal config

2.找到报错的代码是webmagic-saxon引入的saxon-he中的配置文件报错

<dependency>
  <groupId>net.sf.saxon</groupId>
  <artifactId>Saxon-HE</artifactId>
  <version>9.5.1-1</version>
  </dependency>

3.原因:

google了很长时间终于找到答案

由于这个版本的saxon-he (9.5.1)中配置文件的格式不被jdk8接收。

JDK 6和JDK 7接受了非法复合格式;;JDK 8不再接受这种格式。

而我使用的正式jdk1.8

4.解决方案

使用saxon-he的最新版本

就我使用webmagic-saxon而言,首先在webmagic-saxon中去除Saxon-HE,然后再添加Saxon-HE最新版本的依赖

<!-- 支持xpath2.0语法 -->
<dependency>
 <groupId>us.codecraft</groupId>
 <artifactId>webmagic-saxon</artifactId>
 <version>0.6.1</version>
 <exclusions>
  <exclusion>
   <groupId>net.sf.saxon</groupId>
   <artifactId>Saxon-HE</artifactId>
  </exclusion>
 </exclusions>

</dependency>

<!-- https://mvnrepository.com/artifact/net.sf.saxon/Saxon-HE -->
<dependency>
 <groupId>net.sf.saxon</groupId>
 <artifactId>Saxon-HE</artifactId>
 <version>9.7.0-15</version>
</dependency>

这个网站可以搜dependency: http://mvnrepository.com/artifact/org.apache.httpcomponents

saxon-he报错相关推荐

  1. 继承WebMvcConfigurer 和 WebMvcConfigurerAdapter类依然CORS报错? springboot 两种方式稳定解决跨域问题

    继承WebMvcConfigurer 和 WebMvcConfigurerAdapter类依然CORS报错???springboot 两种方式稳定解决跨域问题! 之前我写了一篇文章,来解决CORS报错 ...

  2. Access to XMLHttpRequest at file from origin ‘null‘ has been blocked by CORS policy谷歌浏览器本地打开项目js文件报错

    Access to XMLHttpRequest at 'file:///xxxxx/PQ.BaseInfo.proto' from origin 'null' has been blocked by ...

  3. go build 编译报错 missing go.sum entry for module providing package

    go build 编译报错 missing go.sum entry for module providing package 解决方法 // 移除未使用的依赖 go mod tidy 再次编译,就可 ...

  4. docker报错:driver failed programming external connectivity on endpoint, iptables:No chain by that name

    docker 报错: Error response from daemon: Cannot restart container hello: driver failed programming ext ...

  5. mybatis查询报错:com.mysql.cj.exceptions.DataConversionException: Cannot determine value type from string

    mybatis查询报错: com.mysql.cj.exceptions.DataConversionException: Cannot determine value type from strin ...

  6. mongo报错:not authorized on bb to execute command { create: \“xxx\“...}

    mongo报错: {"ok" : 0,"errmsg" : "not authorized on bb to execute command { cr ...

  7. restTemplate http请求报错:no suitable HttpMessageConverter found for response type and content type

    报错信息: org.springframework.web.client.UnknownContentTypeException: Could not extract response: no sui ...

  8. 解决gitte提交报错 error: GE007: Your push would publish a private email address.

    错误情况: gitte提交报错,无法提交上去,报错如下: remote: Powered by GITEE.COM [GNK-6.0] remote: error: GE007: Your push ...

  9. JS Uncaught SyntaxError:Unexpected identifier异常报错原因及其解决方法

    最近在写ajax的时候,调用js方法,遇到了Uncaught SyntaxError:Unexpected identifier异常报错,开始搞不清原因,很苦恼. 以为是js方法参数个数和长度的问题, ...

最新文章

  1. Code Hunt SECTOR2(Loops) SECTOR3(Loops2)
  2. 听说,京沪津的人都爱直接“看牌”买买买
  3. Unity扩展编辑器二
  4. python项目开发案例集锦 豆瓣-Python第三个项目:爬取豆瓣《哪吒之魔童降世》 短评...
  5. python完全背包最优_python 完全背包问题_遗传算法Python实战 009.背包问题
  6. python遍历目录_Python遍历目录的4种方法
  7. java内存泄露问题
  8. 航空订票系统界面java_Java命令行界面(第21部分):航空公司2
  9. github上的python爬虫_python爬虫入门(2):让你的github项目火起来
  10. Vue插件_自己封装插件_以及使用自定义插件---vue工作笔记0017
  11. 读jQuery源码释疑笔记3
  12. python爬取二手房信息_使用Scrapy爬取链家二手房信息
  13. SRP Batcher:提升您的渲染性能
  14. 数字后端基本概念介绍Size Blockage
  15. Sketch插件开发入门
  16. _exit(0) exit(0) exit(1) return区别
  17. 江苏无锡14岁女孩被推荐上北大(图)
  18. C 语言编程 6.17 用100元人民币兑换10元,5元和1元的纸币(每一种都要有)共五十张。请用穷举法编程。共有多少种情况
  19. RedHat6.2服务器配置方案大全--第一章:DNS
  20. 蓝牙BLE之CC2541 OAD升级[带看门狗OAD]

热门文章

  1. 小程序获取用户手机号
  2. 阿里3年被裁,赔偿30多万!让我人生开挂,有车有房有老婆
  3. Simulink Counter增/减计数器模块使用方法
  4. Postman的替代品来了
  5. 陀螺仪GY25Z使用
  6. 在html语言中段落标签是,HTML的基本结构、段落标签、空格标签、标题标签、图片标签详解...
  7. Java excel大批量图片数据导出解决内存溢出问题
  8. Unity-3DRPG游戏 学习笔记(1)--使用URP渲染管线
  9. hiai和鸿蒙的关系,DevEco Studio使用指导专题( HiAI 第一期)-- 表格识别
  10. 计算机应用基础上机ppt,PowerPoint操作题