tess字库版本3.05 系统 win10 64位
问题1:
根据网上一些批处理代码进行的合并字库这一步一直出现奇怪的错误,如下:

Error: Unable to open ECHO!
"Fatal error encountered!" == NULL:Error:Assert failed:in file ../../../../ccutil/globaloc.cpp, line 75

导致字库合并不完整,出现如下情况:

TessdataManager combined tesseract data files.
Offset for type  0 (xx\my.config                ) is -1
Offset for type  1 (xx\my.unicharset            ) is 140
Offset for type  2 (xx\my.unicharambigs         ) is -1
Offset for type  3 (xx\my.inttemp               ) is -1
Offset for type  4 (xx\my.pffmtable             ) is -1
Offset for type  5 (xx\my.normproto             ) is -1
Offset for type  6 (xx\my.punc-dawg             ) is -1
Offset for type  7 (xx\my.word-dawg             ) is -1
Offset for type  8 (xx\my.number-dawg           ) is -1
Offset for type  9 (xx\my.freq-dawg             ) is -1
Offset for type 10 (xx\my.fixed-length-dawgs    ) is -1
Offset for type 11 (xx\my.cube-unicharset       ) is -1
Offset for type 12 (xxk\my.cube-word-dawg        ) is -1
Offset for type 13 (xx\my.shapetable            ) is -1
Offset for type 14 (xx\my.bigram-dawg           ) is -1
Offset for type 15 (xx\my.unambig-dawg          ) is -1
Offset for type 16 (xx\my.params-model          ) is -1

正确情况应该是 1,3,4,5,13 行不是-1,那么库训练成功。

解决方案:
根据https://bbs.csdn.net/topics/390910241这篇文章中 yblchinastar的回答

tesseract [lang].[fontname].exp[number].tif   [lang].[fontname].exp[number] nobatchbox.train

将该代码中的nobatch删除后,字库合并成功。

现在还不知道nobatch删除后对什么造成影响和它的作用是什么,如果有小伙伴知道,请留言告诉我,感激不尽


根据测试,3.05.02版本不存在nobath问题,并且识别更准确,适配现有批量代码使用。
请使用tesseract 3.5.02 最后稳定版本

===============================================================

Tesseract训练字库研究过程中的一些问题和解决方案相关推荐

  1. 【无标题】研究过程中的一些经验感悟

    基础研究过程中的一些经验感悟-- 关于"金字塔结构逻辑运用二值脉冲对简单图形处理"相关知识和方法的介绍 首先作者写这篇介绍还是感觉底气有点不足,毕竟知识储备有限.但是对于作者自己的 ...

  2. 拿来主义往往束缚人们对新事物的研究与发现 - 记于 OpenGLES 模型移动研究过程中的感悟

    拿来主义往往束缚人们对新事物的研究与发现 - 记于 OpenGLES 模型移动研究过程中的感悟 太阳火神的美丽人生 (http://blog.csdn.net/opengl_es) 本文遵循" ...

  3. latex_3_中文会议论文模板以及修改过程中遇到的问题的解决方案

    latex中文会议论文模板以及修改过程中遇到的问题的解决方案 latex中文会议论文模板 1 报出错误: LaTex Error: File "picins.sty" not Fo ...

  4. python使用ddt找不到方法_python使用ddt过程中遇到的问题及解决方案【推荐】

    前言: 在使用DDT数据驱动+HTMLTestRunner输出测试报告时遇到过2个问题: 1.生成的测试报告中,用例名称后有dict() -> new empty dictionary 2.使用 ...

  5. 使用遇到的问题_水性漆在使用过程中遇到的问题以及解决方案

    水性漆在使用过程中遇到的问题以及解决方案 随着大众环保意识的增强,以及国家环保政策的不断推出,环境保护受到了前所未有的关注.作为排放大量有毒有害物质的涂装企业,正面临着巨大的压力和挑战,然而,由于水性 ...

  6. 对于HTTP过程中POST内容加密的解决方案

    对于HTTP过程中POST内容加密的解决方案 参考文章: (1)对于HTTP过程中POST内容加密的解决方案 (2)https://www.cnblogs.com/Wh7Ro/p/11297501.h ...

  7. 用自己的数据集训练Mask-RCNN实现过程中的坑

    本文仅仅是自己实现过程的笔记记录,仅仅用来交流的. 在网上大量搜集资料后,实现Mask-RCNN,但是过程中还是出现了很多很多的问题,所以将过程记录如下,方便日后学习. 一.实验前准备 1. COCO ...

  8. 食品油炸过程中的真空压力精密控制解决方案

    摘要:针对食品油炸过程中涉及到的真空.正压和高压三种压力场控制需求,本文提出了相应的解决方案.解决方案基于动态平衡法控制原理,采用真空压力控制器.电动针阀.电动球阀.电气比例阀.背压阀和真空泵的搭配组 ...

  9. tracker_benchmark_v1.0配置过程中出现的问题及解决方案

    毕业设计是CV方向的,一直在调试tracker_benchmark_v1.0的代码,遇到了很多的问题,本篇博客记录我遇到的问题和解决的办法,也许还有错误的地方,欢迎大家一起讨论研究~ 一.介绍和注意事 ...

最新文章

  1. R语言可视化散点图(scatter plot)图、为图中的部分数据点添加标签、ggrepel包来帮忙
  2. ubuntu mysql登陆_ubuntu mysql 配置 远程登陆
  3. Oracle INTERVAL DAY TO SECOND数据类型
  4. 第三期CSIG图像图形学科前沿讲习班-详细日程
  5. jq获取同级元素_jq获取上级、同级、下级元素
  6. sklearn自学指南(part61)--调整估计器的超参数
  7. 实体类和数据表的映射异常(XXX is not mapping[ ])
  8. HTML和CSS面试问题总结,html和css面试总结
  9. 为什么坐飞机时会耳痛?
  10. Java Eclipse部分图标汇总
  11. Cesium地图不加载或者加载有问题怎么办
  12. 数字图像处理实验03——图像几何变换
  13. 学习云计算怎么样?云服务和云计算有什么区别?
  14. Java 水果排序
  15. python股票数据简单分析
  16. 打印万年历的c语言程序,C语言打印万年历
  17. oracle rman crosscheck 命令
  18. 张俊林:当前炼制“大语言模型”的两个现象
  19. 对冲基金到底是什么:细数对冲基金的七种武器
  20. 删库了,除了跑路还能怎么办?在线等!

热门文章

  1. 设计模式-鸭子模拟器
  2. 洛谷试炼场被虐记录——新手村
  3. seo软文广告文章怎么写(如何写高质量软文广告文章)
  4. pt工具的使用(1) pt工具的安装
  5. 将本地代码上传gitlab操作
  6. STM32F4+ESP8266拟辉光钟设计(一)简介及时间获取
  7. C/C++编程学习 - 第20周 ⑥ 直角三角形
  8. 设置元素高度跟浏览器高度一致
  9. 在阿里巴巴的那些日子
  10. Linux系统调用详解(实现机制分析)