业务背景

目前,华为公司在海外设有4大供应中心,海关报关单全球一年有35w份左右(其中中国进口5w份,出口15w份,及香港进出口10w份,其它子公司5w份左右)。现在的单据处理方式还停留在通过人工方式将单据内容手动录入到系统中,人工录入的方式除了效率低以外,还存在员工疏忽或者疲劳导致的误操作。如何快速、准确的处理如此数量庞大的单据成为了供应链的一大诉求。

问题描述

海关报关单据是单据中较为常见的一种,它是指在进出口海关时,需要对商品进行描述的报关单,一般各国海关部门会提供图像扫描件,各公司拿到扫描件后需要入库保存。

随着近几年深度学习的发展,文字识别算法的性能也得到很大的提升。海关单据识别是文字识别重要应用场景,它是指通过机器学习和图像识别技术实现单据内容的自动采集,代替人工手动输入的处理方式。然而,相对于普通的文字识别,海关单据识别主要存在以下几个难点问题:
l 单据图像质量差:海关报关扫描件单据的图像质量往往很差,包括很多干扰虚线、倾斜、暗光、曝光、扭曲以及很多噪声点等。
2 识别精度要求高:由于涉及公司产品的出口,因此业务部门对单据关键数字部分如税率、金额等部分要求识别准确度100%。
3 单据内容复杂:单据中存在大量不清晰中文、小数点、近似英文数字、特殊符号、连接词等内容,其识别难度很大,容易被漏识别或误识别。
4 单据模板多样:不同国家单据模板不一致,如巴西海关完全是文本格式,不是一般的表格单据,在文字检测定位阶段造成困难。

业务目标
针对上述业务背景和业务难题,华为供应链引入了华为海关单据识别服务,实现海关单据自动识别能力,替代人工输入。完成如下业务目标:
对于Top 10国,如:英法西等拉美语系国家,一年单据量约为5万份。通过单据识别服务实现:

  1.   采集历史进口报关单数据,新建数据资产。
    
  2.   采集业务报关单数据,自动在系统赋值,替代人工输入。
    

对于深供中国区POD,一年单据量约50万份,深供国际段POD一年约13万份。通过单据识别服务实现:
3. 识别出与审核相关的要素并结构化。
4. 可根据合同类型的不同,进行审核要素设定及审核结果自动判定。
接下来,我们将使用华为海关单据识别服务Demo,演示华为供应链内部海关报关单据自动识别的解决方案。

解决方案
本章节将演示如何使用华为海关单据识别服务Demo,实现海关报关单据的自动识别方案。
操作步骤
步骤 1 获取海关单据识别服务Demo。链接是这个:(自己去官网找,哈哈哈哈哈哈)
步骤 2 将Demo工程导入Eclipse中。
5. 下载,并打开Eclipse软件。确保“Windows>Preferences>Java>InstalledJREs”配置正确的JRE路径。
6. 在左侧“package Explorer”页面右键,单击“Import”,选择选择“General>Exiting Projectinto Workspace”,单击“Next”,单击“Browse”,选择ais-sdk-demo所在的本地位置。
7. 单击Finish,导入demo,导入后打开工程,工程目录如下:

步骤 3 获取AK/SK认证。
登录华为云挂你控制台,在“用户中心”页面,“单击账号管理->基本信息->管理我的凭证”,在“我的凭证”页面,单击“管理访问秘钥”页签,新增访问秘钥,下载认证账号的AK/SK。

步骤 4 修改代码文件中的AK/SK。
修改ClientContextUtils.java文件,将替换成已获取的AK/SK值,如图2-2所示。

图2-2 修改AK/SK代码
步骤 5 修改代码中待识别的海关单据图片的路径。
根据本地图片或者使用Demo默认图片存放路径,参考图2-3修改OcrFormDemo.java文件中图片的存放路径。

图2-3 修改待识别图片路径
步骤 6 运行并查看结果。
运行OcrFormDemo.java文件(Run As Java Application ),控制台输出200即表示程序执行成功。识别结果如图2-4所示。

图2-4 识别结果

其中,运行结果为JSON字符串。index为文字块的序号,排序分别为从左到右,从上到下的固定模板顺序。对应的words为每块的value值(这里不识别表头,只识别value值,方便直接的引用)。识别结果也可保存为JSON格式的文件,如图2-5所示。

图2-5 识别结果文件
----结束

业务价值分析
目前华为海关单据识别服务已在华为供应链内部得到应用。引入该服务后,有效节省了人力和控制风险敞口,业务流程自动化比例得到提升。
通过单据识别替代人工输入的方式,可实现收益:
建立数据资产,保证报关信息完整归档,满足海关遵从要求。
清关业务自动化比例大大提升。
建立数据资产,保证运输签收信息准确归档,满足财务管理要求。
POD审核业务秒级实时完成,及时触发客户开票。

华为海关单据识别服务--基于文字识别技术相关推荐

  1. 票据识别android代码,Android 百度AI开放平台-文字识别-财务票据文字识别

    简单记录一下今天关于百度AI开放平台-文字识别-财务票据文字识别的实现过程 文字识别有对应的Android SDK集成及相关Demo,文档地址如下图: SDK目录图.png 但是SDK中的返回数据字段 ...

  2. 二维码/条码识别、身份证识别、银行卡识别、车牌识别、图片文字识别、黄图识别、驾驶证(驾照)识别

    Scanner 项目地址:shouzhong/Scanner 简介: 二维码/条码识别.身份证识别.银行卡识别.车牌识别.图片文字识别.黄图识别.驾驶证(驾照)识别 更多:作者   提 Bug 标签: ...

  3. 【2】Python 视频文字识别提取 - Mp3 文字识别

    网络上没有很好的库用来文字识别,并且文字识别效率很低,这里我用了剪映接口 jianying.py from datetime import dateimport requests import jso ...

  4. 身份证识别,银行卡识别,驾驶证识别,行驶证识别,根据百度文字识别 api 封装,能快速识别身份证信息,银行卡信息,驾驶证信息,行驶证信息,使用非常方便

    OCR_identify 项目地址:wenchaosong/OCR_identify  简介:身份证识别,银行卡识别,驾驶证识别,行驶证识别,根据百度文字识别 api 封装,能快速识别身份证信息,银行 ...

  5. delphi百度文字识别(支持通用文字识别、身份证识别、银行卡识别、驾驶证识别、行驶证识别、车牌识别等功能)

    下载链接:https://download.csdn.net/download/liushenglin123/12363729 delphi百度文字识别 支持 通用文字识别.通用文字识别(高精度版). ...

  6. python实现文字识别软件_文字识别(OCR)CRNN(基于pytorch、python3) 实现不定长中文字符识别...

    文字识别(OCR)CRNN(基于pytorch.python3) 实现不定长中文字符识别 发布时间:2018-09-26 19:40, 浏览次数:1265 , 标签: OCR CRNN pytorch ...

  7. android百度识别,百度OCR文字识别-Android安全校验

    效果图: 如下为文章正文: 百度OCR接口使用总结: 之前总结一下关于百度OCR文字识别接口的使用步骤(Android版本 不带包名配置 安全性弱).这边博客主要介绍,百度OCR文字识别接口,官方推荐 ...

  8. 神经网络文字识别系统,神经网络文字识别插件

    关于BP神经网络的文字识别应用 谷歌人工智能写作项目:神经网络伪原创 为什么神经网络识别数字用10个输出而不是4个 单个网络就能识别所有数字,不是每个数字训练一个网络,而是所有数字的训练样本来训练一个 ...

  9. 互联网图片文字识别 互联网图片识别 彩信识别 彩信图片文字识别

    "源于清华 服务全球"的国内顶尖OCR图文识别技术,针对视频文件里面的文字字符以及复杂背景图片的文字字符进行计算识别!   摘要:通过对视频文件里的字幕提取,达到视频文件的分类归档 ...

最新文章

  1. 结合使用 Draft 与 Tencent Kubernetes Engine (TKE)
  2. leetcode279. 完全平方数
  3. java9 堆外内存_java堆外内存泄漏排查
  4. 解剖SQLSERVER 第六篇 对OrcaMDF的系统测试里避免regressions(译)
  5. android代码删除sd卡文件在哪里,android - 如何从SD卡中删除文件?
  6. “那不勒斯”服务器芯片,32核/64超线程:AMD 公开 Naples “那不勒斯” 部分规格和性能...
  7. (三) UART 串口通讯
  8. nodejs+express 初学(一)
  9. 解决终端SSH连接服务器一段时间不操作之后卡死的问题
  10. 如何准备 Java 初级和高级的技术面试
  11. 汽车电子零部件可靠性测试
  12. θ - γ耦合作为脑机接口调节慢性脑卒中运动恢复的皮质生物标志物
  13. 通俗易懂的欧拉回路——哥尼斯堡七桥问题
  14. 计算机音乐算法冯,计算机辅助算法作曲方法研究与软件设计
  15. 用迭代算法实现扭蛋机例子
  16. 国内新锐买手品牌BSiEE 本涩启动第三届品牌代言人招募活动
  17. [18调剂]华中师范大学伍伦贡联合研究院接收硕士研究生调剂的通知
  18. 基于JAVA网上图书销售系统计算机毕业设计源码+系统+mysql数据库+lw文档+部署
  19. 怎么去掉微博图片中的水印,照片水印怎么去掉
  20. Python实现带GUI和连接数据库的图书管理系统

热门文章

  1. 乔布斯的10个与众不同:践行另类思考
  2. 护理等级分级标准及巡视时间_18项护理核心制度,都在这了
  3. 从分解新零售看中小商户的出路!
  4. 天然水晶挑选全攻略 真假水晶鉴别方法 保养净化
  5. Python基础学习笔记——用海龟绘图实现两两相连
  6. Linux征途——总结与扩展
  7. 社交媒体充满谎言,搜索引擎撕开真相
  8. 推导为什么笛卡尔坐标与极坐标转换时,积分变量转换为 dxdy=ρdρdθ
  9. 发票识别+发票真伪查验接口
  10. 每天学点SpringCloud(五):如何使用高可用的Eureka