论文学习:CAC模型
摘要
提出新的辅助矫正模型:CAC,
其收集与HMS(手写数学符号)关联的学习上下文数据,并将其转化为上下文信息。通过人工智能识别上下文信息,以调整HMS的识别输出。
简介
HMS上下文数据主要包含两种:
1.表达式内的上下文数据
2.表达式外的上下文数据
分别对应识别错误的举例:
引用表达式内部的数据,将v纠正为a
引用表达式外部的数据,将u修改成a
LC——Learning context(学习环境)::从学习内容中提取数学表达式的符号以及他们的输入位置的数据用作LC数据。
Related work
1.手写数学表达式识别
手写数学表达式的识别分类:
离线手写数学表达式:仅包含像素数据,一般是照片图像
在线手写数据表达式:包括通过手写笔或者手指触摸获得的壁画数据(点的坐标和时间序列数据)
手写数学表达式的识别过程:1.符号分割 2.符号识别 3.结构分析。三个过程依次进行,缺点是前一个过程的错误的输出会影响后续过程。
2.已有的手写数学表达式识别模型
介绍相关的竞赛——CROHME
三种任务:1. 在线手写数学表达式识别 2.离线手写数学表达式识别 3. 文档页面中的表达式检测
本文具体介绍了2019年CROHME竞赛的具体结果(针对识别任务1)
主要考虑两个方面的准确性:1.同时识别结构和符号标签 2.只识别结构
符号识别的准确率几乎没有超过80%,即每输入5个符号,符号就会被错误识别一次
对结果分析:多数情况下,结构识别输出的信息没有被利用或不足以识别模棱两可的符号。
LC Data
1.数据内容的构成
电子学习系统中存储的学习内容由以下的部分组成:学习主题、问题、解决过程以及正确答案四个部分组成。后文中分别用p1(x),p2(x),p3(x),p4(x)表示。
2.提取符号和输入位置
每个学习部分当中的学习内容都包含符号,从中提取出相应的符号作为LC的数据用于矫正HMS识别算法当中表达不明确的符号的输出。
提取符号的例子:
在学习过程中输入表达式的地方有两种:Solving Process 和 Correct answer。输入表达式的位置用i(x)表示。
在每个位置主要使用的符号是不同的。此外,即使每个位置使用相同的符号,其含义也可能有不同的解释。
表达式的输入位置:
CAC模块组成
CAC模型主要有三个部分组成:LC数据采集模块、LC信息生成模块、HMS输出校正模块
工作过程
1. LC数据采集模块从e-learning系统采集与HMS相关的LC数据(学习内容中包含的符号、表达的输入位置等)(生成提取符号矩阵E以及符号频率矩阵R0)
2. LC信息生成模块将收集到的LC数据转换为LC信息,供神经网络使用。(使用1当中两个矩阵生成期望符号矩阵R)
3. HMS输出校正模块通过基于LSTM的人工神经网络识别LC信息以及识别结果,不正确的HMS输出进行校正,提高识别准确率
实验
使用2019 CROHME在线识别任务数据集中50个符号的89477个数据。其中训练集数据81265份,测试集数据8212份。
实验使用的符号
数据集的组成
由于所选择的数据集不包含LC的数据,所以采用了一定的方案进行调整。
针对输入位置的信息,抽取部分的训练集和测试集的数据按统计比例分配,将输入位置分别设定为Solving process过程中以及Answer过程中
针对符号提取方面,指定一定的提取方法。
主要是和前文当中提到的CROHME 2019识别率最好的TAP模型进行比较
针对模型的调整:在神经网络当中添加了dropout、全连接层以及softmax层,每层输出的维度设置为50(使用的符号总数)。dropout ratio设置为0.5
训练和测试
第二组CAC的训练集是第一组TAP训练集的输出数据用来构成LC数据,其中70%用于训练,30%用于验证
实验结果
最后的识别结果而言,TAP准确率93.22%,而经过CAC模型调整之后的准确率为97.15%,提高了3.93%.
不足和展望
1.无法测试在系统中实际的LC数据
2.无法获得与HMS配对的足够多的LC数据
3.需要进一步细化LC数据
4.若使用与前面规定的不一致的符号,LC的数据可能会降低CAC模型的识别性能
论文学习:CAC模型相关推荐
- 谷歌、阿里们的杀手锏:3大领域,10大深度学习CTR模型演化图谱(附论文)
来源:知乎 作者:王喆 本文约4000字,建议阅读8分钟. 本文为你介绍近3年来的所有主流深度学习CTR模型. 今天我们一起回顾一下近3年来的所有主流深度学习CTR模型,也是我工作之余的知识总结,希望 ...
- RS笔记:深度推荐模型之多任务学习PLE模型 [RecSys 2020 最佳论文 腾讯]
RS笔记:深度推荐模型之多任务学习ESMM模型(多目标优化模型,同时优化CTR和CVR) [SIGIR 2018 阿里妈妈] RS笔记:深度推荐模型之多任务学习MMoE模型 [KDD 2018 谷歌] ...
- 谷歌、阿里们的杀手锏:三大领域,十大深度学习CTR模型演化图谱
作者 | 王喆 来源 | 转载自知乎专栏王喆的机器学习笔记 今天我们一起回顾一下近3年来的所有主流深度学习CTR模型,也是我工作之余的知识总结,希望能帮大家梳理推荐系统.计算广告领域在深度学习方面的前 ...
- 深度学习CTR模型最全演化图谱 [王喆观点]
毕业于清华大学计算机系的王喆学长回顾了近3年来的所有主流深度学习CTR (click through rate) 模型,并梳理推荐系统.计算广告领域在深度学习方面的前沿进展.内容来源:https:// ...
- 图灵计算机模型意义,图灵机有什么意义_学习图灵机模型中遇到的问题
图灵机意义 图灵提出图灵机的模型并不是为了同时给出计算机的设计,它的意义我认为有如下几点: 1.它证明了通用计算理论,肯定了计算机实现的可能性,同时它给出了计算机应有的主要架构: 2.图灵机模型引入了 ...
- 深度学习与TensorFlow:FCN论文学习笔记
七月 上海 | 高性能计算之GPU CUDA培训 7月27-29日三天密集式学习 快速带你入门阅读全文> 正文共1708个字,5张图,预计阅读时间8分钟. 这篇文章陆陆续续看了快两周,其中也遇 ...
- 微信看一看强化学习推荐模型的知识蒸馏探索之路丨CIKM 2021
猜你喜欢 0.[免费下载]2021年11月热门报告盘点&下载1.如何搭建一套个性化推荐系统?2.从零开始搭建创业公司后台技术栈3.全民K歌推荐系统算法.架构及后台实现4.微博推荐算法实践与机器 ...
- 主流深度学习CTR模型
随着微软的Deep Crossing,Google的Wide&Deep,以及FNN,PNN等一大批优秀的深度学习CTR预估模型在2016年被提出,计算广告和推荐系统领域全面进入了深度学习时代, ...
- High Performance Visual Tracking with Siamese Region Proposal Network 论文学习
文章目录 论文阅读总结 Translation Abstract 1 Introduction 2 Related Works 2.1 Trackers based on Siamese networ ...
最新文章
- Python 编程语言的核心是什么?
- cisco中的igrp笔记
- C++常见面试题之数据结构和算法
- openresty获取nginx请求url中的所有参数
- [转]Joomla! 1.5中form表单的实现方式
- Java08-java语法基础(七)构造方法
- windows10 安装mqtt服务器和client客户端进行本地调试
- Docker安装Oracle教程
- GitHub 被微软收购后的 52 天,改版并放弃了 jQuery !
- 【算法笔记+HDU2222】AC自动机(统计一个长字符串由多少个不同的短字符串组成)
- linux 安装 navicat
- 淘宝6.18叠猫猫赚猫币自动生成
- 工控行业学什么编程语言比较好_中国工控|想学PLC编程?先弄清5种PLC专用语言 !...
- 基于darknet的voc数据集训练和mAP测试
- 获取 Panabit Linux 版 root 密码
- python坐标轴的粗细设置
- 是面试官放水,还是公司太缺人?这都能过,字节跳动原来这么容易进...
- Python --- ctypes库的使用
- Unity的C#编程教程_61_委托和事件 Delegates and Events 详解及应用练习
- 数据库设计中String类型的数据库类型选择