语音编程平台简介

语音编程工具有哪些:Talon是一款声音编程平台,它追求的意义在于完全取代键盘和鼠标。。当前,全球有两个领先的语音编程平台(Programming-By-Speech Platforms)。一是Serenade,它的作用有点像数字助手,可以让你描述正在编程的命令,而不要求你必须逐字逐句地口述每条指令。另一个就是Talon,它提供了对每一行代码更精细的控制,这也意味着你需要对每一个被编入机器的任务有更细致的把握。具体的差别可以参考文章末尾的Serenade 和 Talon编程的例子。
除了这两个外,还有免费的Aenea和Caster等开源语音编程平台,但两者都依赖于Dragon语音识别引擎,用户必须自行购买。

硬件要求:Serenade的模型是在笔记本电脑麦克风产生的音频上进行训练的,但考虑到消除背景噪音的要求,你在进行语音编程时可能需要一个像样的麦克风。而如果你想用眼球追踪运行Talon,你还需要眼球追踪硬件。

Talon
Talon有几个组成部分:语音识别、眼球追踪和噪音识别。Talon的语音识别引擎基于Facebook的Wav2letter自动语音识别系统,Hileman对该系统进行了扩展,以适应语音编码的命令。同时,Talon的眼球追踪和噪音识别功能可以模拟用鼠标导航,根据眼球运动在屏幕上移动光标,并根据嘴部弹出的声音进行点击,这种声音易发出(缓解声音疲劳),识别延迟低。

Talon

1. 下载后直接安装并运行talon.exe或talon_console.exe

官方下载: https://talonvoice.com/
官方文档: https://talonvoice.com/docs/

Talon有免费版,也有收费版。

以windows为例,右下角的网络显示旁会有一个小图标

2. 下载自带的语音识别模型(也可以使用Dragon)

打开talon_console.exe (可以看到log),选择【speech Recognition】-> 【install: Gen2】

在console中可以看到下载的信息

3. 下载配置

右键talon的小图标,选择【script】->【open ~/talon】,会打开目录%AppData%\Talon\user 或者 ~/.talon/user

切换到该目录下

cd %AppData%\Talon\user  # windows
cd ~/.talon/user         # linux or Mac
git clone https://github.com/knausj85/knausj_talon

重启talon.exe使配置生效。

4. 基本使用

参考readme
help activate 打开所有的可用命令帮助窗口

help one one or help eleven: 选择help列表的第11项
help search tab 搜索所有和tab相关的命令
help symbols or help visual studio 打开自定义的.talon相关命令
help alphabet 打开字母表
help format 打开定义的格式
help close 关闭窗口

Serenade 和 Talon编程的例子

参考工作

[1] Hands-Free Coding
[2] 键盘敲代码out了!编程用“说”的,人人都是程序员
[3] 语音编程可能成为软件开发的下一个前沿领域
[4] 双手无法敲代码的程序员,该如何编程?
[5] What Does a Coder Do If They Can’t Type?
[6] https://talon.wiki/getting_started/#install-a-talon-user-file-set
[4]是[5]的一个译文。

声音编程(Voice Coding) Talon(一) 基本介绍与安装使用相关推荐

  1. alsa声音编程介绍

    http://blog.csdn.net/q553716434/article/details/7881552 period(周期):硬件中中断间的间隔时间.它表示输入延时. 声卡接口中有一个指针来指 ...

  2. Android的声音编程--使用OpenSL ES Audio

    OpenSL ES? 是无授权费.跨平台.针对嵌入式系统精心优化的硬件音频加速API.Android NDK 给出了使用OpenSL ES来实现native-audio的例子.本文介绍了如何使用Ope ...

  3. shell编程入门 linux解释器原理,Shell编程入门Linux解释器原理详细介绍 使用Shell进行工作的人们对.doc...

    Shell编程入门Linux解释器原理详细介绍 使用Shell进行工作的人们对 Shell编程入门:Linux解释器原理详细介绍使用Shell进行工作的人们对Unix/Linux下的Shell编程都很 ...

  4. 增量式编码器c语言,关于增量式编码器编程指导及使用方法的介绍

    关于增量式编码器编程指导及使用方法的介绍 文章来源:http://www.kindele.com/  发布时间:2016/05/13    点击数: 在目前的编码器市场,增量式编码器主要被分为三种类型 ...

  5. UNIX网络编程-listen函数及其包裹函数介绍

    UNIX网络编程-listen函数及其包裹函数介绍 函数简介 #include<sys/socket.h>int listen(int sockfd,int backlog);返回:若成功 ...

  6. Python 、 PyCharm 、 Anaconda 介绍及安装

    Python . PyCharm . Anaconda介绍及安装 1. Python介绍及安装 1.1 Python介绍 1.2 python安装 1.3 pip工具 2 PyCharm介绍及安装 2 ...

  7. Scrapy-Splash的介绍、安装以及实例

    scrapy-splash的介绍   在前面的博客中,我们已经见识到了Scrapy的强大之处.但是,Scrapy也有其不足之处,即Scrapy没有JS engine, 因此它无法爬取JavaScrip ...

  8. linux nginx 重启_Nginx 的介绍及安装

    阅读本文约需要8分钟  大家好,我是你们的导师,经常看我朋友圈的同学应该知道,我每天会在微信上给大家免费提供以下服务! 1.长期为你提供最优质的学习资源! 2.给你解决技术问题! 3.每天在朋友圈里分 ...

  9. jupyter notebook介绍、安装以及使用教程

    一.jupyter notebook介绍 1. 简介 Jupyter Notebook是基于网页的用于交互计算的应用程序.其可被应用于全过程计算:开发.文档编写.运行代码和展示结果.简而言之,Jupy ...

最新文章

  1. ubuntu16.04系统下创建python隔离环境
  2. maya中英文切换插件_老司机都在用的30款maya常用插件
  3. 控制台启动jar包关闭控制台怎么关java程序_Jpom一款简而轻的低侵入式Java运维、监控软件...
  4. 微信支持环信_环信客户互动云v5.39已发布:支持微信小程序接入
  5. 野心勃勃的NoSQL新贵 MongoDB应用实战(5)
  6. 【houdini vex】边界点提取与扩展
  7. jt808终端鉴权_北斗终端设备通信协议(JT/T808)
  8. 孙陶然:聪明工作就是要先问目的
  9. 半导体精密划片机行业介绍及市场分析
  10. iphone修改app名称_iPhone6 plus怎么修改图标名字?苹果6 plus设置修改图标名字教程...
  11. 两个集合相等的例题_集合的相等答案
  12. 年内涨幅超500%,现代牙科蹭了谁的“热度”?
  13. 动态生成的dom为什么绑定事件会失效,以及如何解决
  14. mysql怎么给数据加序号_MySQL数据库之在mysql中给查询的结果添加序号列
  15. lineage-14.1-20190402-UNOFFICIAL-le_x620.zip
  16. 使用pandas把某一列的字符值转换为数字
  17. Python序列解包
  18. 制作SCORM课件离线播放器(C#)
  19. 宝塔面板windows建站教程_宝塔Windows面板IIS环境如何建立博客网站
  20. Interventional Few-Shot Learning

热门文章

  1. mpu6050姿态解算与卡尔曼滤波(2)卡尔曼滤波
  2. Excel日常应用个人总结,针对Excel2013
  3. python 图像压缩 jpeg_python中原始图像的jpeg解压缩
  4. 360声明 腾讯要挟用户卸载360 360将保证和QQ同时正常使用
  5. 股权激励-互联网科技及新经济企业的招聘利器
  6. 2022云南昆明市农村信用合作社联合社招聘精选题及答案
  7. 支付宝直连商户开通步骤
  8. ubuntu16.04+gtx1080ti+cuda10.0+cudnn7.4.2/cudnn7.6.4 环境配置
  9. vscode自动补全文件路径时不加文件扩展名
  10. Django 跨域问题解决