残疾人手语交流辅助系统手语识别与翻译&&基于数据手套的虚拟手的实现

1、 特征提取

原始数据含有背景等大量无用成分,通过骨架技术,直接获得手的运动信息,减小问题复杂度。硬件和软件使用的是:Kinect和OpenNI。Kinect可以获得深度图像,OpenNI不太了解,查了下,【百度百科】例如,一个中间件可以接收一副有人的图像,计算并返回人手掌在图像中的位置。OpenNI提供了一组基于传感器设备的API,以及一组由中间件组件实现的API。通过打破传感器和中间件之间的依赖,使用OpenNI的API编写应用程序就不需要额外的努力去处理由不同的中间件共存带来的问题(跨平台)。在本论文的后边描述,可以知道调用了《骨骼提取》算法,这是个不开源的【知乎】OpenNi类似Kinect的SDK,但是里面的很多算法不是开源的,比如实时的human

poseestimation, hand tracking。这些算法来自一个叫primesense的公司的middleware,估计也是微软持资,openni只有接口。后期,骨骼提取技术因为处理速度慢,是整个系统的瓶颈,因为不开源的原因无法处理,因此添加了FPGA,【百度百科】系统设计师可以根据需要通过可编辑的连接把FPGA内部的逻辑块连接起来,就好像一个电路试验板被放在了一个芯片里。一个出厂后的成品FPGA的逻辑块和连接可以按照设计者而改变,所以FPGA可以完成所需要的逻辑功能。简而言之,就是一个有专门用途的芯片。

选择左右手、肘关节、肩关节6个骨架节点,在获得骨架节点后,通过常态化处理,使得每个动作延续121帧,原因是,标准化便于后期处理,方式是,均匀分配和插值处理。

2、 数据处理

从骨架6个节点计算出14个特征点,每个动作总共121帧,总计1694个特征。通过SVM(支持向量机)对获取的向量处理。

通过LIBSVM训练分类器,而不用自己从头开始做。

【参与竞赛与做产品一样,总会使用最成熟、最简单的技术,不一定最先进,但最起码是次优的。这篇论文中,6、14、121这些数字的来源很令人好奇,估计也是从某个地方看过来的吧,另外,图像识别的关键环节:图像获取与预处理、SVM训练都利用成熟的技术和产品】

《基于数据手套的虚拟手的实现》

1、流程图,通过流程图可以对整个系统或者整篇论文有个基本的认识,之后可以对号入座,提高学习效率。

OSG不了解,【百度】OpenSceneGraph(简称OSG)使用OpenGL技术开发,是一套基于C++平台的应用程序接口(API),它让程序员能够更加快速、便捷地创建高性能、跨平台的交互式图形程序。它作为中间件(middleware)为应用软件提供了各种高级渲染特性,IO,以及空间结构组织函数;而更低层次的OpenGL 硬件抽象层(HAL)实现了底层硬件显示的驱动。OpenGL不懂,【百度】OpenGL(全写Open

Graphics Library)是指定义了一个跨编程语言、跨平台的编程接口规格的专业的图形程序接口。它用于三维图像(二维的亦可),是一个功能强大,调用方便的底层图形库。【百度链接】OpenGL学习总结

一.OpenGL是做什么的

一种图形硬件的接口。而不是像C和C++一样的编程语言,更像是一个运行库,提供一些预先封装的函数。

二.OpenGL的主要功能是什么

建模,变换,颜色模式设置,光照和材质设置,纹理映射,位图显示和图像。

三.OpenGL的体系结构是什么

最底层为图形硬件,第二层为操作系统,第三层为窗口系统,第四层为OpenGL,第五层为应用软件。

四.怎么样利用OpenGL来实现我们想要做的事情

首先要明白一点,OpenGL是一个与平台无关的三维图形接口,操作系统必须提供像素格式管理和渲染环境管理。因此要使用OpenGL来做我们想做的事情的时候,一定要先为OpenGL搭建一个窗口环境。在这个窗口环境中,我们才能够使用OpenGL来实现我们自己的目的。

另外要注意的是OpenGL应用的不是保留模式,而是直接模式。即我们去操作的并非是已经封装好的一些建好的图形信息,而仅是相当于操作一个图形界面。也就是说如果我们要画一个复杂的形体,我们要把这个形体的几何信息,包括点、线和面的一些信息包括进去,然后使用一定的方法,把这些基本的信息合起来,构成我们要创建的那个物体。中间件不懂,【知乎】其实从广义来说
操作系统上,业务系统下与业务无关的

,都是中间件,包括数据库,离线等。当然
实际上不会这么分。 不过利用这个讲法应该能够更容易的去理解中间件是什么。对比与这个说明,库函数是位于代码与程序之间的中间件。

2、使用3D MAX和Creator建立手的3D模型,不研究这个,所以不细看,但作者的一个观点很令人耳目一新,通过树状结构建立数据库结构,原因有二:1、按照几何特征进行有效组织,并将模型转化为方便进行编辑和移动的节点;2、这种树状结构非常适合实时系统进行各种便利操作。【这样的思路跟之前读的结构模式识别很相似,利用模式(模型)本身的结构约束构建系统,减小不确定性】

3、数据手套的数据获取与处理

使用DG5 Vhand2.0数据手套,由5个嵌入玩去传感器测量手指的平均屈伸度,通过三轴加速计获得手的运动和方向。在软件层面,调用配套的函数库即可获得手的运动数据。

4、数据手套与虚拟手的交互控制

不是特别感兴趣,实现手套获取数据与虚拟手控制数据的某种映射。OSG可能采用MVC模式,Controller为数据手套,View为OSG提供的界面,Model为OSG映射函数。

残疾人手语交流辅助系统手语识别与翻译基于数据手套的虚拟手的实现相关推荐

  1. 【图像识别】【论文】残疾人手语交流辅助系统手语识别与翻译基于数据手套的虚拟手的实现

    <残疾人手语交流辅助系统手语识别与翻译> [本来以为这是一篇学位论文,没想到是比赛的"感言",不过比赛有一个地方很好,什么最好用.最简单用什么,而是一大堆为写论文而进行 ...

  2. java教学辅助系统的源码_基于jsp的教学辅助系统-JavaEE实现教学辅助系统 - java项目源码...

    基于jsp+servlet+pojo+mysql实现一个javaee/javaweb的教学辅助系统, 该项目可用各类java课程设计大作业中, 教学辅助系统的系统架构分为前后台两部分, 最终实现在线上 ...

  3. 计算机考试系统的相关外文翻译,基于SSH的计算机在线测评考试系统设计与实现毕业论文+任务书+开题报告+外文翻译及原文+开题PPT+中期PPT+毕业答辩PPT+项目源码及数据库文件...

    目  录 摘  要 本系统基于B/S结构的模式开发,通过网络给广大用户提供了比较可靠.方便.快捷的在线测评平台,系统主要实现了自动抽取试题.人工出题.套题选择.自动阅卷计分.在线测试.用户信息管理.成 ...

  4. 先进驾驶辅助系统ADAS一些技术应用小结

    手上有些有关ADAS的文档,有的时候翻过一遍,ms都知道,但印象不深,所以,自己总结下相关技术应用特性,常见缩写及全称,便于经常回顾. ADAS全称Advanced Driver Assistance ...

  5. 停车辅助系统的技术和变化

    各种各样的停车辅助系统已经存在了很长时间,但用户经常在不知道什么技术以及它是如何工作的情况下使用它们. 今天我们依次来谈谈停车辅助系统是什么,怎么发展以及如何应用的. ​ 1.手信号 您可能会想,&q ...

  6. ADAS高级驾驶辅助系统浅解答

    手上有些有关ADAS的文档,有的时候翻过一遍,ms都知道,但印象不深,所以,自己总结下相关技术应用特性,常见缩写及全称,便于经常回顾. ADAS全称Advanced Driver Assistance ...

  7. ADAS高级驾驶辅助系统

    手上有些有关ADAS的文档,有的时候翻过一遍,ms都知道,但印象不深,所以,自己总结下相关技术应用特性,常见缩写及全称,便于经常回顾. ADAS全称Advanced Driver Assistance ...

  8. 听障人士亲述:我们在VRChat用手语交流,成员规模5000人

    如果你在B站上搜索VRChat,排在前面的热门视频几乎都是与老外聊天的内容.除了练习语言.交文化流外,你还能在VRChat上遇到不少哇哇乱叫的小孩.作为一款VR社交应用,除了有趣的小游戏外,说话聊天也 ...

  9. Cell:视觉错觉运动刺激的探索:基于EEG的实用辅助系统的脑机接口

    本文提出了一种基于视觉错觉运动刺激(illusory visual motion stimuli)的脑机接口(BCI),旨在使用提出的系统来增强运动想象(MI)的范式.由于运动想象需要较长时间的训练, ...

最新文章

  1. JS中同步与异步的理解
  2. python 画蜘蛛_如何学习 R 绘图?
  3. python中 的用法_详解python中@的用法
  4. mysql 存储过程 on_MySQL存储过程的权限问题小结
  5. IBM T410 打开AHCI模式
  6. iPhone 诈骗又出新招,别看见弹窗就输密码
  7. mongodb数据合并设计_MongoDB:将来自多个集合的数据合并成一个
  8. 求职招聘系统中的观察者模式的应用和分析
  9. oracle数据库基础知识总结,oracle知识点总结(一)
  10. 连接两个std :: vector
  11. 洛谷——P1146 硬币翻转
  12. [转载] Python利用pandas处理Excel数据的应用
  13. 重庆北大青鸟【学员心声】任何一次的考试,都是一次珍贵的蜕变机会
  14. PMP扫盲篇2 | PMP报名、缴费、考试那些事儿~~
  15. 宏碁暗影骑士擎2022-重装系统-检测不到硬盘
  16. 交换机用户模式、特权模式、全局模式、端口模式
  17. 用Wireshark看见TLS握手过程
  18. QT-ico图片的生成
  19. 苹果xr截屏怎么截_原来苹果手机自带长截屏功能!以前一直不知道,真让人相见恨晚...
  20. P1926 小书童——刷题大军 题解

热门文章

  1. 「思考」为什么现在面试总是面试造火箭?
  2. 各种编程语言学习网站汇总【精品】
  3. seo专题之五:title,keywords,description标签
  4. PPT怎么转换成PDF文件,分享两个方法给大家!
  5. Camera之Dng文件解析
  6. 【悲恸】深切追悼可牛君——致可牛杀毒用户的一封信
  7. 蓝桥杯题目练习(能量项链)
  8. 猪八戒网创始人朱明跃:蛰伏9年明白三件事
  9. 网络工程师怎么系统性学习?这份网工资料包帮你解决
  10. 吐槽memoQ | 实时预览能不能更强大?