你听说过一种叫做“Sheng”的语言吗?这是一种斯瓦希里语-英语俚语,主要使用者为肯尼亚内罗毕等城市地区的青年。近年来,随着“Sheng”的使用量不断增加,一家非盈利组织正在帮助更新该地区的社区信息资源,随时根据词汇中的新变化做出调整,以便及时为当地的人们提供尽可能准确可靠的信息。

CLEAR Global,前身为无国界译者(Translators Without Borders),是一个非营利组织,致力于帮助人们突破语言的边界,获取重要信息并积极传达自身观点。

CLEAR Global与澳鹏Appen作为公益合作伙伴,长期在一些文化发展较为不足的地区积极开发语音聊天机器人等人工智能应用,以促进当地的文化交流和人们的心理健康。

CHALLENGE

挑 / 战

CHALLENGE

由于“Sheng”是澳鹏Appen和CLEAR Global从未处理过的一种新语言,澳鹏Appen语言学家团队需要围绕语言研究、最佳实践和方法论开发一个项目模型。澳鹏Appen团队需要提供针对该语言特性的咨询服务,并形成定制文档,在未来的应用中实现类似的输出。

“Sheng”的使用发展迅速,目前已经被应用于广告和各类社会活动中。然而,由于社区之间的语言差异很大,词汇转换率很高,为形成规范文档带来了一定挑战。

SOLUTION

解 / 决

SOLUTION

在处理一种对澳鹏Appen而言复杂或陌生的语言时,我们的团队会进行结构化研究,其输出是一份语言特性(LSP)文档。LSP是一份简明的研究文档,它概述一种语言的语音、语法和缀字法,以及该语言的应用环境,例如语音聊天机器人等。

“Sheng”LSP需要强调这些变化模式,以帮助开发人员在他们的模型中妥善处理可变性。在两个多月的时间里,项目团队提供了5种咨询模板、一份Sheng LSP文档和一份LSP模板,其中包含了创建未来LSP文档的说明。

“作为一名母语为Sheng和斯瓦希里语的人,澳鹏Appen提供的LSP文档的精准度让我印象深刻。这是个强大的工具,展现出诸多未开发语言的无限可能,相信我们可以在这些语言领域大有所为。”

——Paul Waramabo

CLEAR Global 斯瓦希里语负责人

RESULT

成 / 果

RESULT

该项目的咨询模板和LSP模板专为CLEAR Global开发,供人们进行可持续的进一步研究,特别是研究不太为人所知的小语种。通过澳鹏Appen提供的材料,CLEAR Global能够开发自己的LSP研究文档,用于未来开发一系列非洲语言的ASR模型。

与此同时,澳鹏Appen也通过参与此项目深受启发,为不同项目开发和编写的LSP文档的专业知识和流程得到进一步优化,这对于未来研究资源较少的语言和方言将大有裨益。

案例分享 | AI助力肯尼亚“Sheng”语研究相关推荐

  1. 牛逼!百度大佬深度分享AI助力RNA二级结构预测!

    在生物学研究领域,传统基于分子.细胞.生理学等传统实验方法很依赖于不断的试错和积累,不仅耗资巨大,周期往往也很长. 随着人工智能时代的到来,深度学习.大数据等创新手段,为生物学研究打开了另一扇窗. 早 ...

  2. WICC 2021召开在即 清华大学教授将分享AI+网络音视频服务研究

    走进7月,由全球互联网通信云领先厂商融云主办的第三届全球互联网通信云大会(WICC 2021)也进入了倒计时.WICC一向以预见通信云领域的前沿科技,引领行业发展为己任.本届大会以"新视界· ...

  3. 客户案例|AI助力财税行业低成本精准获客

    财税服务行业发展趋势 根据<天眼查>相关数据展示,十三五规划期间,企业年度注册增速达14% 中小微企业占比近60%,仅小微企业注册数量已接近5200万户.十四五计划中明确提出,将完善促进中 ...

  4. 极案例 | 用AI助力家装隐蔽工程,极视角为艾佳生活打造水路走线识别

    [导读]为防止工人将水路装修到地面,避免施工隐患,并让水管漏水问题得到及时解决,极视角为艾佳生活打造了「水路走线识别」算法. 家,是我们 精神与身体的港湾 也是我们享受美好生活的居所 因此,融于人性的 ...

  5. 近期活动盘点:AI Time:论道AI安全与伦理、大数据、AI在中国金融保险业的应用案例分享讲座...

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: AI Time"science debate 论道AI安全与伦理 2019年5月31日 如今,人工智能的社会角色不断更新迭代,越 ...

  6. 组蛋白ChIP-seq研究思路及应用案例分享

    往期推文中我们分享了不少ChIP-seq的项目文章,今天和大家聊聊ChIP-seq的研究思路和应用案例. ChIP-seq技术将染色质免疫共沉淀与二代测序结合,高效地在全基因组范围内检测与组蛋白.转录 ...

  7. 案例分享 | 某券商利用AI技术进行告警关联分析(上)

    本内容来自公众号"布博士"------(擎创科技资深产品专家) 背景: 作为大型券商企业之一,某券商对深入数字化转型,以及对应用.网络.主机.操作系统.中间件.用户使用体验等的全面 ...

  8. 星河案例 | 冲量在线助力中国电信打造数据要素融通与AI能力开放外拓新范式

    2022 年大数据"星河"案例征集活动由中国信息通信研究院.中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)共同组织,旨在促进大数据技术产品及相关产业发展,加快培 ...

  9. 数据挖掘r语言和python知乎_Hellobi Live |R语言爬虫实战案例分享:网易云课堂、知乎live、今日头条、B站视频...

    课程名称 R语言爬虫实战案例分享:网易云课堂.知乎live.今日头条.B站视频 网络数据抓取是数据科学中获取数据中的重要途径,但是一直以来受制于高门槛,都是专业程序员的专属技能.直到R语言和Pytho ...

最新文章

  1. Windows 下连接mysql工具NavicatForMysql
  2. python字符串应用
  3. cass读取dat文件_CASS里DTM法土方计算
  4. 数据分析职场路上有困惑?不妨花几分钟来看看...
  5. 网站上传服务器视频不能播放器,FLV格式文件上传服务器后不能播放的问题
  6. qt写的在ok6410上的密码锁
  7. ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any()
  8. sql server中 设置与查看锁的超时时间(ZT) @@LOCK_TIMEOUT
  9. 删除之后页码显示的bug
  10. linux dkms,DKMS简介
  11. 关于maven仓库的配置步骤
  12. 通信LOGO隐秘史(设备商篇)
  13. 通过函数seaborn.cubehelix_palette生成顺序调色板
  14. python 树莓派实验一:跑马灯
  15. ffmpeg给视频添加时间水印
  16. Spring当中循环依赖很少有人讲,今天让我们来看看吧
  17. L1-011~L1-015
  18. keystone变换
  19. JavaScript获取屏幕高度和宽度等信息
  20. Python 读取 支付宝账单并存储到 Access 中

热门文章

  1. android下配置偏好信息的管理
  2. Flutter中实现视图、功能和样式代码的分离(使用mixin与扩展函数)
  3. WFH的完整形式是什么?
  4. 我看《千万别学英语》的五个阶段[转]
  5. Centos定时自动清buff/cache缓存
  6. SAP FI 系列 (011) - 会计年度和过账期间
  7. 表格如何存入mysql_Luckysheet如何把表格里的数据保存到数据库
  8. 前端游戏之原生js-猴子吃水果
  9. 算法笔记四 排队买票
  10. ibm websphere7.0的补丁下载地址