https://www.toutiao.com/a6718196560888332812/

全文共4049字,预计学习时长8分钟

图片来源:pexels.com/@pixabay

当下,人工智能已逐渐成为影响全球经济的主流因素,而在人工智能的众多细分领域中,计算机视觉发展尤为迅猛。

工业4.0时代

人工智能和机器人技术的进步正在减少机器与人类的差距,但制造出完全类人的机器仍需经历较长的发展历程。工业4.0时代,自动驾驶汽车和无人机正加快发展,同时如相机和图像传感器等先进设备也有革新态势。

先进技术使机器人或自动程序代替人类,将人类从枯燥的简单工作中解放出来,而人类因此获得时间和空间去追求更有价值的工作。

数据是关键

从技术的角度来看,数据是成功组织正运行的数字化转型项目的基石。数据可被认为是人与机器之间的最佳纽带。无论是数字、文本或更加复杂的数据如音频、视频和图像,数字信息使人们可以与机器交流——反之亦然——同时也使机器能“理解”周围的世界。

图片来源:pexels.com/@naveen-annam-734127

什么是计算机视觉

正如术语本身所示,计算机视觉是指一项帮助计算机、软件、机器人或其它任何设备获取、分析及处理图片的技术。图片的可能来源不一而足,可能是照片、视频、3D设备、医疗或工业扫描器等等。计算机视觉旨在帮助这些设备——包括无人机、交通机器或仅仅是一台计算机——根据所获信息进行“可视”和回应。由于计算机视觉的复杂性并考虑到其终端使用案例,其难度常被拿来与语音识别作比较。

你可能对计算机视觉这个概念及其背后的技术不太了解。但是,其中的一项技术光学字符识别OCR应用十分广泛,因为其常用于识别照片中的文字信息或有一定年份的扫描文件。几十年来,银行业为读取支票内容一直使用笔迹识别技术。物品识别长期应用于许多行业,以自动控制质量或为找出一些样品分类工厂产品。

某种意义上,计算机视觉与人工智能联系紧密,因为设备不仅需要识别信息,还要在识别后立即分析和解释所见内容。这是为了采取合适的措施,与周边环境互动。

上世纪60年代早期开始的研究推动了今天人工智能和物联网技术的发展,而计算机视觉也是如此。据夏季视觉项目报告,“构建一个先进的足够复杂的图案识别系统”在1966年得以实现。

计算机视觉 vs 图像处理

注意不要混淆计算机视觉和图像处理。实际上,图像处理一般是指分析数字图像和运行算法,包括分类、提取、编辑和过滤等。图像处理主要通过技术和方法来增加图片信息,而计算机视觉旨在发挥图片的实际用途。

虽然计算机视觉显然与图片管理更为有关,但其可应用于各种操作,包括物品识别和活动监测。

分析师观点

弗雷斯特:“由于有庞大的训练数据集、深度神经网络和图形处理器,计算机如今可以准确识别图像和视频中的物体和特点。首席信息官和技术领袖们需要知道如何将计算机视觉应用于安全保障、社交媒体监测、市场资产管理、生产制造以及对散乱图像数据进行分类等诸多领域。”

德勤:“许多技术公司仍未意识到认知技术正在改变着行业,也并不了解他们自身——或其竞争者可如何在公司策略及运营中应用技术…/…计算机视觉是指计算机能够识别非限制性(即自然性)视觉环境中的物体、场景及活动。”

Arcognizance.com网站:“人工智能与人类智识有关,具有类人特征,如语言理解能力、分析能力、学习能力、问题解决能力等。人工智能是市场上新一代软件技术的核心。前沿技术公司正积极地将人工智能作为其技术发展的必要部分。计算机视觉技术将以最高速度增长,而这得益于其在制造业和汽车业等领域的大量自动化和半自动化应用。”

国际数据公司:“计算机视觉软件技术正在改变传统行业,如汽车业、零售业、保险业和医疗保健等。通过将此技术应用于产品或服务,传统行业可降低成本、提高效率。”

麦肯锡:“人工智能将在未来引起新一轮的数字革命,各大公司应做好准备。技术先行者们已经获得技术红利,其它公司更需要加快数字化转型。[受影响最大的行业中]五大最具创新性的人工智能技术——机器人和自动驾驶、计算机视觉、语言、虚拟代理及机器学习——都包括了深度学习,并为其它人工智能技术夯实基础。

实际案例说明

机器人和自动驾驶汽车等自动化机器曾经是计算机视觉最常应用的领域。然而现在这项技术在越来越多的领域得以应用,如:

医疗业

图案识别和综合图像处理领域技术不断革新。同时,对医疗保健领域人士来说,毋庸置疑的是,在他们获得更好的诊疗工具或提高诊断和治疗水平的所有途径中,医疗图像已成为一重要方式。

医疗图像分析十分有助于预诊和治疗。比方说,结肠镜检查应用计算机视觉技术后,可获得更为有效和可靠的数据,以降低结肠癌死亡率。

再比如,计算机视觉可为外科手术提供技术援助。对脑瘤病人进行3D头骨建模,十分有助于后续神经外科治疗。同时,人工智能正越来越多地应用深度学习,利用其对肺瘤进行分类极其有益于及时诊断出肺癌。

图片来源:pexels.com/@fancycrave

零售业

计算机视觉在实体店铺中也得到越来越多的应用,尤其在提升顾客体验方面。品趣志的Lens是一个搜索工具,利用计算机视觉识别物品,而Shazam也应用此技术识别音乐。在实体商店中使用此手机应用程序,产品会得到视觉化呈现,而你也可以看到其它相关产品。

面部识别是大众十分熟悉的一项计算机视觉的应用,在商场或商铺中均有应用。Lolli & Pops是一家美国糖果商店,运用面部识别技术对忠实顾客进行回馈。“试想一下:你走进最爱的商店,导购对你的身份和需求了如指掌,为你介绍你最感兴趣的产品。”这就是这家商店成功应用新技术后的场景,每一位顾客都能享受到定制化服务。

计算机视觉应用似乎不胜枚举。其还可应用于分析书店读者、商店顾客,甚至消费者情绪。情绪识别基于这样一项算法,该算法抓取视频中的人像对其析微表情进行分析和处理,最终解读出顾客的总体情绪。

商店技术革新的最大目的可能是减少排队结账的顾客。计算机视觉与人工智能结合,最终可消除排长队的噩梦。

亚马逊推出了一项新服务亚马逊无人超市(Amazon Go),应用计算机视觉、物联网、人工智能等技术以识别、跟踪和分析顾客消费行为,并提供自助结账服务和电子收据。

银行业

说到人工智能在银行业的应用,最先想到欺诈监测。虽然这的确是这一领域的重点关注,但计算机视觉的应用不只如此。使用机器学习应用图像识别来分类和提取数据、监管文件授权(如身份证和驾驶证),可提升远程用户体验并保障安全。

无人机火灾监测

计算机视觉同样在安全领域市场上获得了广泛多样的应用。无人机可利用计算机视觉、使用红外线图像增强人类的森林火灾监测能力。先进算法对视频图像特点进行分析,如动作和亮度,从而监测火灾。该监测系统提取和分析特定图像,有助于识别模型和分辨林火与动态的区别。后者很容易被识别为火灾。同时,无人机代替消防队员在危险区域进行监测和研究,有助于保障其安全和提升效率。无人机借助先进算法对浓烟和火势进行分析,以评估灾情蔓延的风险。

前沿技术生态系统

ResearchAndMarkets网站研究报告显示,“计算机视觉市场中人工智能应用2018年估值达到36.2亿美元,2023年将达到253.2亿美元。”

计算机视觉涵盖的技术十分广泛,其中包括图像识别。图像识别应用于识别物体、人物、动作等,之后再交由机器学习和云计算在CPU、内存和边缘计算等方面进行处理。这正如自动化无人机一样,其需要在创建初始阶段进行处理。机器学习和深度学习技术尤其推动了计算机视觉的发展。

机器学习

机器学习是一种提高应用精确度的算法。有趣的是,这些算法并不需要十分清楚的执行计划。基于数据引入流、重复出现数据以及先进的分析,机器学习能不断改善输出结果。

机器学习十分依赖于数据集。简单来说,数据集即一组相关数据,其结合可增加价值,引入新数据也更为简单。

计算机视觉生态系统正在为技术人员提供大量免费图像数据集。比方说,哥伦比亚大学图片库共享一组数据集,其包含对100个物体360度全方位的图像记录(COIL-100)。

深度学习

深度学习是人工智能下的一个分支,基于人类通过学习达到对事物更深理解的能力和原则。因此,深度学习提供了改善过程的可能,包括提升计算机视觉输出结果的精确度。

深度学习算法依赖于神经网络,以此来描绘分支过程,并形成概念等级。这些复杂概念再次被分类为更为简单的概念组。

图片来源:pexels.com/@ivandrei-pretorius-457987

面部识别

面部识别是指通过深度学习算法描绘和储存电子身份。此种生物识别可与虹膜、指纹识别等技术相媲美。

据称,2011年谷歌公司证明可以仅依靠未标记图像创建面部识别装置。谷歌设计了一套系统,该系统可自主学习识别猫的图像,而且并不需要知道猫的外形。

当时,神经网络包括1000台电脑,由16000个内核组成。1000万随机Youtube视频得到输入…J.迪恩博士(Dr. J. Dean)是项目参与者之一,他在接受《纽约时代》杂志采访时说,团队从未向系统说明“这是一只猫”,因此系统“自主创造出猫的概念”。

日常生活中的计算机视觉

今天,智能手机可使用高像素相机进行识别。比方说,iPhone X应用面部识别技术解锁屏幕。用户的面部ID数据被加密和储存到云端,而当其进行购买操作时可使用面部ID进行授权。

中国的技术专家们正在进行一项计算机视觉技术研究,并将其应用到日常生活中。不仅中国的消费者更愿意使用智能手机及其面部识别技术进行购买,这项技术也有助于识别和抓捕罪犯。

计算机视觉对人类意味着什么?

计算机视觉应用于安全领域,有助于搜索罪犯。其还可预测人群拥挤等紧急情况,以保障城市安全。

通过研发更多更为复杂和先进的计算机视觉算法,语言识别的发展势必会得到推动,因为二者都是基于相似的原则。这些都将增强人工智能和机器人的情景意识。

加强深度学习和机器学习算法的能力总会引致相关担忧,至少是某一主题会受到特别关注。实际上,这与隐私和道德问题有关。

然而,这并不意味着所有研究应该作罢。相反,就像其它技术发展进程,计算机视觉的发展须受到全球各方的集体监管,而非由某一行业、军事力量或强国垄断。

计算机视觉到底有多热?它的前景是这样的……相关推荐

  1. 大数据最清楚王宝强离婚事件到底有多热!

    2019独角兽企业重金招聘Python工程师标准>>> 8月14日凌晨的微博被王宝强离婚的事件给爆了,那天晚上整个娱乐圈记者和广大夜猫子网友肯定都没睡好觉.这件事经过持续发酵9个小时 ...

  2. 学平面设计到底有没有发展前途?就业前景好不好?

    本文由:"学设计上兔课网"原创,图片素材来自网络,仅供学习分享 学平面设计到底有没有发展前途?就业前景好不好?首先需要知道平面设计是什么?平面设计又名广告传媒设计,视觉艺术设计,那 ...

  3. 计算机视觉到底需要学什么?怎么快速入门?

    从这篇文章中我们快速理解计算机视觉入门指南,从概念.原理.用例等角度介绍了计算机视觉. 「机器能够模拟人类视觉系统」的幻想已经过时了.自 1960 年代第一批学术论文出现以来,计算机视觉已经走了很远, ...

  4. 砸了140亿的计算机视觉,未来到底如何?

    指纹解锁.刷脸识别.语音转换文字.机器人看病.Alphago······我们已经深刻的感受到,人工智能在改变我们的工作方式和认知. 通过 SAS 针对企业人工自能就绪调研的报告可以看到,大部分企业认为 ...

  5. @程序员 腾讯云计算机视觉应用干货,不容错过!

    2019年4月13日,由腾讯云云+社区主办的"计算机视觉的原理及最佳实践"技术沙龙活动成功举办,来自各行各业的数百位开发者到场与多位腾讯云人工智能技术专家进行了深入交流与探讨,同时 ...

  6. web前端目前的就业形势_2020年Web前端的前景及就业形势

    原标题: 2020年Web前端的前景及就业形势 近十年以来,IT行业发展火热,衍生了很多新职业,例如UI设计师.开发工程师.软件测试工程师等等,在众多备受瞩目的新生职业中,Web前端工程师是其中的一员 ...

  7. 世纪之战:Python和Java,到底学哪个更好?

    有人曾经将编程比作做菜,那编程语言就是首先要准备的食材或厨具. 尽管在刚开始开发AI时,有很多编程语言都可以满足你的需求,但没有一种编程语言是可以一站式解决AI编程的问题,因为在每一个项目中,不同的目 ...

  8. web前端开发工作描述_2019年前端开发前景如何?前端开发会被淘汰吗?

    近十年以来,IT行业发展火热,衍生了很多新职业,例如UI设计师.开发工程师.软件测试工程师等等,在众多备受瞩目的新生职业中,Web前端工程师是其中的一员. Web前端在IT行业真正受到重视大概也就六七 ...

  9. 区块链为什么这么热?有这么大热度的原因是什么

    链客,专为开发者而生,有问必答! 此文章来自区块链技术社区,未经允许拒绝转载. 区块链的热度是超乎想象的. 在上地和西二旗密集的写字楼办公空间里,年轻人三五成群聚在一起,在午饭后或散步或聚在茶水间,话 ...

最新文章

  1. webpack简易入门
  2. 游戏中应用强化学习技术,目的就是要打败人类玩家?
  3. 在苏州当老师大概博士毕业,工作稳定后就准备要孩子了
  4. Java 8过滤器,地图,收集和流示例
  5. 具有Spring Boot和Yeoman的单页Angularjs应用程序
  6. 胡斌、张礼礤会摧毁我们的信任
  7. 记录一次可能的order by注入
  8. python土味情话_有哪些比较新的土味情话?
  9. 技术驱动创新,阿里云开启云网络3.0时代
  10. 哪种蓝牙耳机适合运动、最适合运动的蓝牙耳机推荐
  11. 一张图让你了解五险一金
  12. 手机行业影像突破,谁能成为下一个“苹果”?
  13. python 声音强度检测_python检测音频中的静音
  14. python实时监控文件目录_教你三种方法,用 Python实时监控文件
  15. 使用VQGAN+CLIP从图鉴文本描述中生成神奇宝贝
  16. 仿支付宝蚂蚁森林效果
  17. 电子书PDF裁减、合并工具及脚本
  18. OpenFalcon线上初步部署
  19. iOS14桌面伪透明
  20. matlab连接板,怎样用Matlab连接控制Arduino开发板

热门文章

  1. 概率论与数理统计第一章 随机事件与概率 学习总结
  2. (课程笔记)Learn How to Learn: Powerful mental tools to help you master tough subjects
  3. RocketMQ—Producer(三)发送方式和消息类型
  4. VR和摄影测量怎么结合?游戏引擎绝配
  5. 顶级人才的逻辑思维是什么
  6. 10月第3周业务风控关注|网络安全威胁信息格式规范正式发布
  7. 各类开发、设计、动画使用软件语言
  8. RSD处理高分5号高光谱(GF5 AHSI)数据(二)——波段编辑复制和删除
  9. 数字电子钟——期末数电大作业Multisim版
  10. Python matplotlib常见问题