云输入法与传统输入法的整合之道

2009年11月搜狗高调发布了搜狗云输入法概念产品,一时间很多人都进行试用,有说好的,有说是垃圾,也有说是在炒作云的概念。官方网址:http://pinyin.sogou.com/cloud。

什么是搜狗云输入法,官网是这样定义的:

搜狗云输入法是基于搜狗拼音输入法,依托云计算技术的一个概念性输入法产品。与一般输入法最明显的区别在于,完全靠服务器运算,具有更强大语言模型和词库,能大幅提升输入准确率,特别是长句输入准确率。作为演示性的概念产品,目前搜狗云输入法只能在网页上使用。

我试用了之后,颇有感受,以下是我列举的搜狗云输入法概念产品的优缺点。

优点

1、无需安装,直接在浏览器中就可以使用;

2、识别短语及句子准确度相当高,基本上可以识别日常中的主要语法;

3、没有操作系统平台的限制,只和浏览器有关,经过大家测试,主流的浏览器都支持;

4、不存在传统输入法词库升级的问题,词库永远是最新的。

缺点

1、只能在浏览器的网页中使用,浏览器的地址栏也不能使用,其它客户端软件也不支持,如QQ,MSN,WORD等等,而且每次网页刷新后都要重新从收藏栏中打开;

2、需要连接互联网才能使用;

3、输入有一些延迟,和接入互联网网络速率有比较大的关系;

4、每次输入都需要与服务器端交互,非常耗网络带宽;

5、缺少本地自定义词库功能。

总的来说,如官方网站上描述一样,这还只是一个概念级的产品,可以方便地得到用户反馈和建议,了解用户习惯,承担搜狗输入法“创新实验室”的角色,所以不能因为有明显的缺点就认为产品没有价值。

缺点分析

从缺点来分析,云输入法有以下3个致命的地方:

1、完全依赖互联网

2、不能离开浏览器

3、运营成本高

缺点1和2都很好理解,试用过了一看就知道。关天运营成本我们来分析一下,云输入法的运营成本主要包括:

1、人员成本(研发、运维、服务、管理)

关于人员成本和普通输入法一样,有研发、服务及管理,但还需要增加运维人员。

2、云服务器硬件采购成本

云输入法需要增加服务器硬件采购成本,包括应用服务器、数据库服务器、存储等等。就算采用PC服务器集群体系,这个成本也是相当高的,总体成本和软件的架构及设计算法密切相关,要满足1亿用户纯云输入法的硬件首期投入成本估计不下300万。

3、IDC网络带宽租用成本

要满足1亿用户纯云输入法网络带宽估算需要10GB/秒,关于IDC网络带宽流量报价不太好确定,沿海城市比内地有可能高10倍,估计价格在10-150万/每月,但是沿海的用户数多,估计10GB带宽的月租费要达到50万元,也就是1年运营云输入法仅带宽成本约600万。

注:纯云输入法使用网络流量带宽的估算数据:

有1亿客户使用云输入法

平均每人每天要输入1000个汉字

平均每个汉字平均输入3个英文字母

平均每个按键输入需要使用1KB的网络流量来返回候选字(采用Ajax方式)

根据以上数据可以得出每天总网络流量为100000000*1000*3=300000000000KB=300TB

假设每天文字输入的主要工作时间为上午9:00到晚上22:00,约12小时=12*3600秒=43200秒

如果每个时间段的文字输入量比较平均,则可估算云输入法要求网络带宽为300TB/43200秒=6.9GB/秒

为了保证文字输入高峰时间网络带宽也能满足要求,估计要求整体网络带宽达到10GB/秒。

云输入法与传统输入法的整合之道

如何整合

1、保留现有的浏览器收藏夹启动的使用方法,同时提供和传统输入法一样客户端输入法的安装软件;

2、正常输入时首先从本地客户端计算候选词,如果没有本地候选词则自动从云输入法服务器返回候选词;

3、设计一个匹配度算法,如果本地计算的候选词匹配度低于一个值时也自动从云输入法服务器返回候选词;

4、客户端云输入法中与服务器的通讯方式不采用Ajax,采用普通Socket的方式,这样可以更灵活,需要的网络流量可以更小;

5、输入时提供快捷键从云输入法服务器返回候选词。

整合后的效果分析

1、提供普通输入法一样的使用体验,解决了只能在浏览器中使用的问题;

2、没有接入互联网时可以和普通输入法一样使用;

3、大部分输入都会从本地词库中找到候选词,不需要与服务器端交互,因此响应速度很快;

4、本地词库没有候选词或匹配度很低会自动从云输入服务器返回候选词,提高输入速度;

5、仍然提供浏览器收藏夹启动的使用方法,或者开发各种主流浏览器的插件,可以在没有安装客户端输入法的情况下使用云输入法,非常适合在刚装好操作系统或者是Linux桌面操作系统上使用;

6、大部分输入都会从本地词库中找到候选词,不需要与服务器端交互,因此服务端配置要求可以比较低,减少硬件成本;

7、大部分输入都会从本地词库中找到候选词,不需要与服务器端交互,因此可以大大减少使用的网络带宽,算法设计好的话服务端1GB/秒的带宽就可以了,减少运营成本;

8、有了本地词库,客户端仍然可以自定义词库;

9、客户端的本地词库可以不需要经常更新,现在的大部分输入法默认每天都更新词库,且老是弹出一个框说更新成功,感觉为我做了很多事的样子,其实我不需要它天天自动更新,就算他天天更新也不需要弹出框来提示,因为这个信息对我来说不仅没有任何用处,而且会打扰我的工作。现在系统中自动更新的软件太多了,比如杀毒软件、360安全卫士、金山词霸、QQ、迅雷、输入法等等。

10、采用整合后的输入法不用担心词库不全了,从云输入法服务器返回的候选词也可以自动存为本地词库,本地词库1个星期或者一个月更新一次就可以了。

搜狗云输入法名字取得吸引眼球,似云非云,因为现在大家对云的概念都不是很清晰,但是当许多云概念产品推出并且产品得到大家认可时,我想也没人会在乎是不是云了。这和2005年时形成的Web2.0概念非常相似。Web2.0强调的是互动,云计算强调的是无限扩展。

云输入法与传统输入法的整合之道相关推荐

  1. 学习笔记 | 传统企业互联网改革之道

    [学习笔记]| 作者 / Edison Zhou 这是EdisonTalk的第306篇学习分享 最近在看刘润老师的<互联网+战略版:传统企业,互联网在踢门>,学习了传统企业互联网改革的价值 ...

  2. 电子商务的整合之道--思践

    网易科技专栏作者 思践 10年前,电子商务刚刚在中国产生萌芽的时候,便有了鼠标加水泥的说法,电子商务在中国发展10多年,一直以来电子是手段商务是根本,鼠标在很长时间内被认为是水泥的助力.在10年后的今 ...

  3. 敏捷与DevOps整合之道

    \ 本文要点 \ 作为最流行的敏捷框架,Scrum的发展早于DevOps:正因如此,Scrum(及其他敏捷框架)实践过度专注于广义上被定义为软件交付的开发方面,而忽视了运维方面. \ 混合了DevOp ...

  4. 润米咨询创始人刘润:传统企业数字化转型之道

    11月25日-27日,帆软第四届智数大会成功举办.在主论坛上,润米咨询创始人刘润指出世界的进步由能量和信息两股力量在驱动,在迈入第四次工业革命后,数据变成了比石油更加宽广的巨大能源,驾驭数据的过程就叫 ...

  5. [CTO札记]平台化,多资源整合之道

    如何整合多个同类资源(Resouce),从而提供给更多通道/接触点(Touch Point),增加更多的用户?如下图所示.   一个思路就是,做成平台(如下图所示): 将Resource标准化为Web ...

  6. 搜狗云输入法For Linux桌面,不局限于浏览器内使用! #输入法 #iBus #搜狗

    当前 搜狗云输入法只是一款概念产品,适用于特点场合临时适用,不具备普遍适用性和可用性(只能在浏览器中适用,只支持纯文本框). 通过搜狗云输入法的理念和原理,在Linux系统桌面已经有基于搜狗云输入法接 ...

  7. 我使用过的拼音输入法

    我使用过的拼音输入法 一.引言 笔者以一个普通的计算机使用者的视角,通过近10年以来他所使用的拼音输入法变迁,反映拼音输入法的技术革新和普及情况.笔者写这篇文章以表达对所有为中文输入的进步做出历史贡献 ...

  8. 传统企业:转型互联网,机遇大,挑战也大

    传统企业在互联网产业冲击下,红利消褪.不少传统企业家对于互联网电商既渴望又害怕,风风火火的互联网行业已经是巨头林立,作为传统企业,虽说已经在商场上摸爬滚打很多年,但是对于互联网领域,是一片空白.无论是 ...

  9. web中使用QQ云输入法

    最近云技术非常的火,在输入法方面先后有搜狗,腾讯,百度推出了云输入法,云输入法的推出可以依托服务器的无限量的存储和计算能力,大幅提升输入准确率,同时也免除了安装等繁琐的操作,可以在Linux.mac等 ...

最新文章

  1. 计蒜客 Reversion Count
  2. HALCON示例程序measure_circles.hdev测量圆的半径
  3. 【转】js老生常谈之this,constructor ,prototype
  4. Android之ActionBar常用设计和使用总结
  5. 2018-2019-2 20165221 【网络对抗技术】-- Exp9 Web安全基础
  6. ubuntu安装常用软件(比如python、搜狗拼音、cudnn等)
  7. 关于建立 Carbon Forum 后 设置访问链接的问题
  8. MapReduce过程卡在reduce处的67%
  9. UFLDL教程笔记及练习答案五(自编码线性解码器与处理大型图像**卷积与池化)...
  10. 一文搞定java面试相近词的辨析
  11. 计算机重启命令编码,电脑倒计时重启代码是什么
  12. 彩色二维码可识别性比较
  13. MacOS安装brew安装git安装sdkman安装sbt
  14. 网络基础 select模型
  15. 113道C语言题目,超经典的~~~
  16. matlab使用教训
  17. 【PyQt】pyqt加载调用ui界面文件的两种方法
  18. linux常用工具awk,linux中awk工具
  19. 华为手机——解锁步骤
  20. 阿里前端开发规范(转)

热门文章

  1. 【GNN】图解GNN: A gentle introduction(含视频)
  2. 正在读王小波的《沉默的大多数》感觉不错的话就贴出来
  3. 黑猫带你学eMMC协议第21篇:全网最全emmc写保护详解(write protect)
  4. 与AI合作穿越剧 编剧徐婷:AI脑洞大,但无法替代人类的情感表达
  5. 2020最新kali安装无线网卡【COMFAST CF-812AC】Realtek RTL8812BU或88X2BU版本驱动(超详细!!!)
  6. 计算机网络残值率,电脑固定资产折旧年限是多少
  7. 安卓便签中的图片怎么一键转发到朋友圈?
  8. QinQ与Vlan Mapping讲解与实验配置
  9. Redis(3)常用维护操作
  10. jplayer插件的api_如何使用jPlayer插件(jQuery)在您的网站上添加音频和视频