VQA的起源

图灵测试:如果强AI,使你分辨不出是人还是计算机,完成了图灵测试。

Eugene Goostman算法:模仿了乌克兰13岁小男孩,无法判断对方是人还是机器人,完成了首个可以pass 图灵测试。

1、13岁

2、乌克兰人

3、英语可能也不好

是不是有更好的测试,所以就有了新图灵测试的探讨:

既然说图灵测试可以用作弊的方式解决,在这种情形下,产生了VQA:

http://www.visualqa.org/

加入计算机视觉和思考,使得测试变得更加复杂,解决问题本身的,做测试的时候,所有种族等,所有输入都是相等的,有不equal的情况下,

不光光指出图片中有什么?还有相应的思考?整个过程逻辑思考非常复杂的。

如果黑盒的AI系统可以实现,就认为这个测试更加科学严谨

主要涉及:1、NLP;2、computer Vision ;(可使用CNN等) 3、“common-sense” reasoning(常识:逻辑推导的过程)open dommen

三大块每一块都非常深的领域,VQA每几年都会更新。

VQA模型:

第一步 生成答案:weak AI:下围棋等;

strong AI:当你女朋友,把一系列weak AI合成强AI。

取出前1000个最容易被回答的答案,作为y label,X 就是VQA每年发布的数据库。

类似于用no回答所有的问题,有60%的准确率。

第二步 图片处理:

形成最好的filter,最好的特征值表达形式,深度学习领域如果有一套牛逼的参数,例如VGG-16,这个模型,在图片识别,图片分类这个领域上,会使用VGG-16这套算法

第二步 处理输入源数据

1、Rule-Based问题分为100种

2、Word Vector 算出特征表达式,表达这句话即可。

第三步 选取VQA模型-MLP

把文字和图片的feature (数组)首尾相接拼接作为新的输入,只要有能独特表达图片和文字,更能表达这个问题,MLP,得到1000维的结果,选出概率最大的那个结果,就出第几个问题回答。

第三步 选取VQA模型-LSTM

语境上下文关联

图灵机器人——VQA模型的介绍相关推荐

  1. 【财富空间】将门CEO高欣欣、顺丰首席科学家刘志欣、图灵机器人联合创始人杨钊、中国人民大学向松祚等——AI应用落地:用产品说话

    主持人:将门CEO.将门创投创始合伙人高欣欣: 中国人民大学国际货币研究所副所长向松祚: 顺丰人工智能首席科学家刘志欣先生: 英语流利说联合创始人兼CTO胡哲人先生: 图灵机器人联合创始人杨钊先生. ...

  2. 图灵机器人api接入c语言,apikey创建接入图灵机器人

    图灵机器人很多人都听说过,这个开放平台有很多功能,今天来介绍如何用apikey接入图灵机器人.以下是python代码 http://www.turingapi.com import requests ...

  3. 专属个人的聊天机器人的实现——图灵机器人

    先体验一下:图灵机器人智能聊天体验:http://www.tuling123.com/openapi/cloud/proexp.jsp 1.简单介绍 本篇为大家介绍使用图灵机器人api实现聊天机器人的 ...

  4. 图灵机器人调用数据恢复_python:用itchat打造属于自己的微信聊天机器人,24小时运行...

    前几天逛GitHub看见python上的一个开源项目itchat,可以用来丰富个人微信号或者微信公众号,于是乎点进去看了看, 这是成功的示意图: 下面来具体介绍一下. 一.对itchat的调用 (源码 ...

  5. 图灵机器人:到基层去,做人工智能的开放平台

    你有多久没和小冰聊天了? 这个由微软在今年端午节时所推出的"16岁萌妹子"曾在刚开始受到了相当多的关注,无论是迅速入驻各微信聊天群,还是后来在新浪微博等平台的复活,这个背着&quo ...

  6. 微信公众号图灵机器人开发php,使用图灵机器人api搭建微信聊天机器人php实现,图灵微信聊天机器人...

    使用图灵机器人api搭建微信聊天机器人php实现,图灵微信聊天机器人之前通过hook技术实现了微信pc端发送消息功能,如果在结合图灵机器人就能实现微信聊天机器人. 代码下载:http://blog.y ...

  7. 【图灵机器人】图灵机器人API V2版使用采坑指南

    做一个小东西的时候需要用python和这个接口,使用的时候遇到了一些坑,于是记录一下.本文只记录接入API时候的一些简单坑,更多使用技巧没有说到. 介绍 图灵机器人是以语义技术为核心驱动力的人工智能公 ...

  8. 机器人开发--Apollo ROS介绍

    机器人开发--Apollo ROS介绍 1 介绍 1.1 概述 1.2 历程 2 ROS的不足 大数据传输性能瓶颈 单中心的网络存在单点风险(ROS2为分布式避免该问题) 数据格式缺乏向后兼容 3 A ...

  9. flask 智能图灵机器人

    语音文字相互转换 汉字转化为语音 from aip import AipSpeech""" 你的 APPID AK SK """ APP_I ...

最新文章

  1. java中List深拷贝的简单实例
  2. 零基础入门学习Python(26)-文件1
  3. Spring Cloud构建微服务架构:分布式服务跟踪(收集原理)【Dalston版】
  4. 【IOC 控制反转】Android 事件依赖注入 ( 事件三要素 | 修饰注解的注解 | 事件依赖注入步骤 )
  5. 团队角色测试(结果分析已公布)
  6. 面试系列-SpringMVC那些事(一)
  7. layui tab选项卡外部html页面,layui的Tab选项卡知识
  8. 轻松学MVC4.0–2 创建用户列表页面
  9. JavaScript实现radianToDegree弧度到度算法(附完整源码)
  10. 学校运动会广播稿计算机,学校运动会广播稿【五篇】
  11. 谷歌浏览器保存网页为PDF
  12. Android NFC 应用程序记录ARR
  13. 劣质VGA线导致不支持非标准分辨率显示
  14. multimap 的使用例子
  15. ECDSA算法JAVA实现加解密
  16. _stdcall _cdec区别
  17. 德国金融监管机构:ICO急需国际监管
  18. Python 爬虫下一代网络请求库 httpx 和 parsel 解析库测评
  19. 移动硬盘格式化后怎么恢复?
  20. php实现文件管理系统,基于php的文件管理系统程序设计与实现

热门文章

  1. RPG黑暗之光学习笔记 摄像头设置
  2. mysql数据库连接报2059,navicat连接MySQL报2059错误的解决方法
  3. Python教你用微信每天给女朋友说晚安
  4. 全面认识海思SDK及嵌入式层开发(2)
  5. 2019年第五届 美亚杯电子取证 团体赛 wp
  6. 有没有佩戴舒适的蓝牙耳机?高端蓝牙耳机推荐
  7. 据说胎记是受前世受重伤的伤痕
  8. 【计算机科学】mini-AORCNN:一种基于Bottleneck Transformer的轻量级微表情识别架构——CCF T2
  9. 在线合并Excel文档的HTML网页工具
  10. 事件驱动编程、消息驱动编程、数据驱动编程