声音编程(Voice Coding) Talon(一) 基本介绍与安装使用
语音编程平台简介
语音编程工具有哪些:Talon是一款声音编程平台,它追求的意义在于完全取代键盘和鼠标。。当前,全球有两个领先的语音编程平台(Programming-By-Speech Platforms)。一是Serenade,它的作用有点像数字助手,可以让你描述正在编程的命令,而不要求你必须逐字逐句地口述每条指令。另一个就是Talon,它提供了对每一行代码更精细的控制,这也意味着你需要对每一个被编入机器的任务有更细致的把握。具体的差别可以参考文章末尾的Serenade 和 Talon编程的例子。
除了这两个外,还有免费的Aenea和Caster等开源语音编程平台,但两者都依赖于Dragon语音识别引擎,用户必须自行购买。
硬件要求:Serenade的模型是在笔记本电脑麦克风产生的音频上进行训练的,但考虑到消除背景噪音的要求,你在进行语音编程时可能需要一个像样的麦克风。而如果你想用眼球追踪运行Talon,你还需要眼球追踪硬件。
Talon
Talon有几个组成部分:语音识别、眼球追踪和噪音识别。Talon的语音识别引擎基于Facebook的Wav2letter自动语音识别系统,Hileman对该系统进行了扩展,以适应语音编码的命令。同时,Talon的眼球追踪和噪音识别功能可以模拟用鼠标导航,根据眼球运动在屏幕上移动光标,并根据嘴部弹出的声音进行点击,这种声音易发出(缓解声音疲劳),识别延迟低。
Talon
1. 下载后直接安装并运行talon.exe或talon_console.exe
官方下载: https://talonvoice.com/
官方文档: https://talonvoice.com/docs/
Talon有免费版,也有收费版。
以windows为例,右下角的网络显示旁会有一个小图标
2. 下载自带的语音识别模型(也可以使用Dragon)
打开talon_console.exe (可以看到log),选择【speech Recognition】-> 【install: Gen2】
在console中可以看到下载的信息
3. 下载配置
右键talon的小图标,选择【script】->【open ~/talon】,会打开目录%AppData%\Talon\user 或者 ~/.talon/user
切换到该目录下
cd %AppData%\Talon\user # windows
cd ~/.talon/user # linux or Mac
git clone https://github.com/knausj85/knausj_talon
重启talon.exe使配置生效。
4. 基本使用
参考readme
help activate
打开所有的可用命令帮助窗口
help one one
or help eleven
: 选择help列表的第11项
help search tab
搜索所有和tab相关的命令
help symbols
or help visual studio
打开自定义的.talon相关命令
help alphabet
打开字母表
help format
打开定义的格式
help close
关闭窗口
Serenade 和 Talon编程的例子
参考工作
[1] Hands-Free Coding
[2] 键盘敲代码out了!编程用“说”的,人人都是程序员
[3] 语音编程可能成为软件开发的下一个前沿领域
[4] 双手无法敲代码的程序员,该如何编程?
[5] What Does a Coder Do If They Can’t Type?
[6] https://talon.wiki/getting_started/#install-a-talon-user-file-set
[4]是[5]的一个译文。
声音编程(Voice Coding) Talon(一) 基本介绍与安装使用相关推荐
- alsa声音编程介绍
http://blog.csdn.net/q553716434/article/details/7881552 period(周期):硬件中中断间的间隔时间.它表示输入延时. 声卡接口中有一个指针来指 ...
- Android的声音编程--使用OpenSL ES Audio
OpenSL ES? 是无授权费.跨平台.针对嵌入式系统精心优化的硬件音频加速API.Android NDK 给出了使用OpenSL ES来实现native-audio的例子.本文介绍了如何使用Ope ...
- shell编程入门 linux解释器原理,Shell编程入门Linux解释器原理详细介绍 使用Shell进行工作的人们对.doc...
Shell编程入门Linux解释器原理详细介绍 使用Shell进行工作的人们对 Shell编程入门:Linux解释器原理详细介绍使用Shell进行工作的人们对Unix/Linux下的Shell编程都很 ...
- 增量式编码器c语言,关于增量式编码器编程指导及使用方法的介绍
关于增量式编码器编程指导及使用方法的介绍 文章来源:http://www.kindele.com/ 发布时间:2016/05/13 点击数: 在目前的编码器市场,增量式编码器主要被分为三种类型 ...
- UNIX网络编程-listen函数及其包裹函数介绍
UNIX网络编程-listen函数及其包裹函数介绍 函数简介 #include<sys/socket.h>int listen(int sockfd,int backlog);返回:若成功 ...
- Python 、 PyCharm 、 Anaconda 介绍及安装
Python . PyCharm . Anaconda介绍及安装 1. Python介绍及安装 1.1 Python介绍 1.2 python安装 1.3 pip工具 2 PyCharm介绍及安装 2 ...
- Scrapy-Splash的介绍、安装以及实例
scrapy-splash的介绍 在前面的博客中,我们已经见识到了Scrapy的强大之处.但是,Scrapy也有其不足之处,即Scrapy没有JS engine, 因此它无法爬取JavaScrip ...
- linux nginx 重启_Nginx 的介绍及安装
阅读本文约需要8分钟 大家好,我是你们的导师,经常看我朋友圈的同学应该知道,我每天会在微信上给大家免费提供以下服务! 1.长期为你提供最优质的学习资源! 2.给你解决技术问题! 3.每天在朋友圈里分 ...
- jupyter notebook介绍、安装以及使用教程
一.jupyter notebook介绍 1. 简介 Jupyter Notebook是基于网页的用于交互计算的应用程序.其可被应用于全过程计算:开发.文档编写.运行代码和展示结果.简而言之,Jupy ...
最新文章
- ubuntu16.04系统下创建python隔离环境
- maya中英文切换插件_老司机都在用的30款maya常用插件
- 控制台启动jar包关闭控制台怎么关java程序_Jpom一款简而轻的低侵入式Java运维、监控软件...
- 微信支持环信_环信客户互动云v5.39已发布:支持微信小程序接入
- 野心勃勃的NoSQL新贵 MongoDB应用实战(5)
- 【houdini vex】边界点提取与扩展
- jt808终端鉴权_北斗终端设备通信协议(JT/T808)
- 孙陶然:聪明工作就是要先问目的
- 半导体精密划片机行业介绍及市场分析
- iphone修改app名称_iPhone6 plus怎么修改图标名字?苹果6 plus设置修改图标名字教程...
- 两个集合相等的例题_集合的相等答案
- 年内涨幅超500%,现代牙科蹭了谁的“热度”?
- 动态生成的dom为什么绑定事件会失效,以及如何解决
- mysql怎么给数据加序号_MySQL数据库之在mysql中给查询的结果添加序号列
- lineage-14.1-20190402-UNOFFICIAL-le_x620.zip
- 使用pandas把某一列的字符值转换为数字
- Python序列解包
- 制作SCORM课件离线播放器(C#)
- 宝塔面板windows建站教程_宝塔Windows面板IIS环境如何建立博客网站
- Interventional Few-Shot Learning
热门文章
- mpu6050姿态解算与卡尔曼滤波(2)卡尔曼滤波
- Excel日常应用个人总结,针对Excel2013
- python 图像压缩 jpeg_python中原始图像的jpeg解压缩
- 360声明 腾讯要挟用户卸载360 360将保证和QQ同时正常使用
- 股权激励-互联网科技及新经济企业的招聘利器
- 2022云南昆明市农村信用合作社联合社招聘精选题及答案
- 支付宝直连商户开通步骤
- ubuntu16.04+gtx1080ti+cuda10.0+cudnn7.4.2/cudnn7.6.4 环境配置
- vscode自动补全文件路径时不加文件扩展名
- Django 跨域问题解决