计算机视觉处理高分辨率的图像需要非常多的计算量,因此很多数据集的图像分辨率都非常小。而近日,工程师们用一块玻璃、一个光电探测器和一些软件,开发了一种「透视」相机,这种不带镜头的相机能拍摄分辨率非常小的图像,并抽象出物体的主要轮廓。因此使用这种相机拍摄的图像能大量降低计算机视觉所需要的计算力。同时,他们也在开发用机器学习算法处理更复杂图像的技术。

以前的相机配备自己的专门设备,如镜头和胶卷,而且照相得去照相馆。后来,手机、平板电脑、笔记本电脑和视频游戏机都有了自己的照相功能。现在,相机似乎会在某天变得和玻璃一样不显眼,甚至它都不再需要镜头。

根据新的研究,压在窗户边缘的光电探测器可以检测玻璃内部的反射光,就像光信号穿过光缆一样。对检测到的微小光线进行一些巧妙的处理,可以让玻璃面板成为一个巨大的照相机镜头。

由这种相机产生的粒状图像(想象一下像素化、失真和分辨率较低的图像)虽然暂时还没法和传统相机的效果相比。但是对于很多计算机视觉任务来说,窗玻璃或一块汽车挡风玻璃拍摄的分辨率足以满足图像处理算法或神经网络所需的信息。

这是他们对 LED 阵列图像的拍摄效果:

其中左列是原始图像,中间列是图像传感器接收到的输入,右列是计算机重构后的图像。

犹他大学电气和计算机工程副教授 Rajesh Menon 说,现代照相机拍摄的图像中,其实有很多是我们用肉眼无法看到的。它们只能被用来处理安全的照相机算法或自动车辆图像传感器看到,而这些我们肉眼无法看到的图像正变得越来越多。

所以,Menon 问道,「如果机器相比人类能够看到的图像和视频更多,那我们为什么不考虑为机器重新设计相机呢?这样能让我们脱离之前的窘境,以非人类的角度来看待相机。」

换而言之,计算机视觉算法并不如人眼那样总需要高分辨率和高图像保真率。它们能从 Menon 和 Ganghun Kim 的「透明无镜头相机」中获得大量信息,即使它拍摄的图像质量并不高,这样成本和占用面积都会大量减小。他们的技术已经申请了专利,该技术对视觉媒介本身并没有要求,可以是玻璃、塑料或有机玻璃等。

他们将一个现成的光电探测器(8 分辨率、640×480 像素)连接到有机玻璃的边缘,平滑连接的边缘且准备与成像设备连接。他们随后在有机玻璃其余周边放置反光带。Menon 说他们可以在没有反光带的情况下成像,只不过反光带提高了信噪比。

对于这种概念验证,实验只需要保持简单的视野。他们在窗格前放置了一排尺寸为 32X32 的 LED 灯。然后,当 1024 束光各自被照亮时,他们观察到达光电探测器的信号。因此,来自 LED 阵列的任何图像,至少在一级近似中,将仅仅是每个点亮的单独 LED 灯信号的线性组合。

如果机器相比人类能够看到的图像和视频,那我们为什么不考虑为机器重新设计相机呢?——犹他大学,Rajesh Menon

Menon 表示,在这个项目中,他们开发了一种传统信号处理算法,它能够借助光电探测器接收的信号重构图像。他们把这一步称为「反转问题」,因为他们的算法利用复杂、混乱的信号作为输入,并利用探测器检测到的光子来生成可能的目标。

「我们正在检测「光子」在与特定目标对应的空间中的分布,」他表示,「我们喜欢看一对一的图。相机的原理正是如此。此处用到的是一对多的图,因此我们要解决反转问题。」

这也是这些玻璃面板「相机」与计算机视觉相关的项目完美契合的原因。图像质量和可分解的信息对于计算机视觉来说可能已经足够好了,但还不能(也许永远都不能)取代基于镜头、拍给人看的传统相机。

Menon 提到,他的团队目前正在开发一种机器学习算法用于学习更复杂的图像,如可以被检测并识别为数值的手写数字。他指出,该技术可能首先被应用在 VR 或 AR 眼镜中。这些眼镜的图像生成和图像展示硬件已然非常笨重,眼球追踪摄像头可能是个累赘。因此,如果能够用这款不带摄像头的透视相机就能追踪用户的眼动并获取足够优质的信息该有多好。

用一项品质远远低于当前最佳水平的技术作为突破听起来非常讽刺。但 Menon 表示,或许转变思维方式,重新设计在 AI 及图像处理系统中「足够优质」的技术可以让我们前进一大步。就像苍蝇的眼睛一样,AI 世界里最重要的不是单个数据的品质,而是数据源的增殖能力。

这也是为什么相机和玻璃板在未来数年会越来越接近的原因,至少对于计算机视觉算法来说是这样。

论文:Computational imaging enables a「see-through」lens-less camera

论文地址:https://www.osapublishing.org/oe/abstract.cfm?uri=oe-26-18-22826

摘要:传统相机会遮挡需要记录的场景,而这里我们将一个图像传感器(没有镜头)放在透明窗口的边缘,并通过该窗口观察物体图像。这一过程首先可以通过图像传感器收集散射光,然后通过解光散射的逆问题来实现图像的重构。因此,我们能形成简单的图像,并且在物距 150mm、焦距 10mm 的情况下有 0.1 line-pairs/mm 的空间分辨率。我们进一步展示了两种物体的成像:LED 阵列和传统的 LCD 屏幕。最终,我们演示了彩色和视频成像。

原文链接:https://spectrum.ieee.org/tech-talk/computing/software/a-lensless-camera-built-specially-for-ai-and-computer-vision-programs-sorry-humans

转载于:https://www.cnblogs.com/alan-blog-TsingHua/p/9823699.html

新型无镜头相机助力计算机视觉相关推荐

  1. 3d镜头 适配_您是否应该将镜头适配器与无反光镜相机一起使用?

    3d镜头 适配 Canon佳能 Mirrorless cameras aren't the future, they're the present. If you're switching from ...

  2. 像素位移_徕卡首款4700万像素、内置光学防抖L卡口全画幅无反相机实拍体验

    徕卡SL2是一款L卡口全画幅无反相机,是徕卡在原有的SL系统上,根据用户反馈意见重新设计的新产品.其最大特点是采用了L卡口兼容M卡口镜头的设计,并采用了全新的4700万像素CMOS影像传感器,并内置了 ...

  3. Github大热论文 | U-GAT-IT:基于GAN的新型无监督图像转换

    作者丨武广 学校丨合肥工业大学硕士生 研究方向丨图像生成 生成对抗网络(GAN)在这几年的发展下已经渐渐沉淀下来,在网络的架构.训练的稳定性控制.模型参数设计上都有了指导性的研究成果.我们可以看出 1 ...

  4. nrf connect 安卓_永诺YN450安卓系统无反相机

    作者 | 马修.阿拉德 (Matthew Allard ACS) 在CP+展会现场,我们意外撞见一个新奇的小玩意--永诺YN450,一台安卓系统无反相机.其实去年11月永诺就放出过消息,正式发布前一直 ...

  5. iso图像测试卡_4700万像素 五轴防抖 徕卡正式发布SL2无反相机

    出自蜂鸟网-器材频道,原文链接:https://m.fengniao.com/document/5358989.html 徕卡于今日正式发布SL2相机,搭载4700万像素CMOS感光元件.通过感光元件 ...

  6. android otg读取索尼相机usb_索尼新概念!即将上市全画幅无反相机α7C先睹为快

    索尼将于2020年10月23日发布全画幅无反光相机"α7C".两种颜色供消费者选择(银色和黑色).同时发布的镜头套装包括标准变焦镜头" FE 28-60mm F4-5.6 ...

  7. 富士相机设置传原图_更稳更快更小巧 富士轻旗舰X-S10无反相机评测

    富士在10月15日正式发布了X-S10无反相机,这台相机是一台体积小巧紧凑,但是性能相当强大的无反相机,这台相机可以看作是mini版的富士X-T4,众多性能直接像旗舰机看齐,不仅适合作为主力相机使用, ...

  8. android sony 镜像,Xperia 1 II将索尼的无镜像相机技术引入智能手机

    Xperia 1 II将索尼的无镜像相机技术引入智能手机 2020-05-25 13:17:28 1点赞 0收藏 2评论 索尼的Alpha系列无反光镜相机以一流的自动对焦和快速连拍而闻名,而这些功能现 ...

  9. 关于无反相机(欢迎大家补充和提出异议)

    (声明:写这篇文章是为了自己整理资料学习使用,如有侵权请联系删除,资料来源于网络整理) 大家还记得自己拍摄运动尤其快速极限运动时候,总会拖影的问题吗?我自己觉得无反相机,其半透明反光镜的设置,就是为了 ...

最新文章

  1. 《用Python进行自然语言处理》第6章 学习分类文本
  2. [APUE]文件和目录(中)
  3. BEC攻击危害惊人 3年造成23亿美元损失
  4. 剑指offer-栈的压入、弹出序列
  5. python写游戏棋牌游戏_使用python实现简单五子棋游戏
  6. 当快递员也学会了“跑路”,消费者如何捍卫自己的权益?
  7. 直播丨抢鲜体验-openGauss入门
  8. sql server分布式_如何安装,配置和使用SQL Server分布式重播
  9. 《计算复杂性:现代方法》——第0章 记 号 约 定 0.1 对象的字符串表示
  10. Open VSwitch简介
  11. 【总结】大端、小端存储模式的那点事
  12. iocomp控件的应用
  13. 树莓派GPIO引脚介绍
  14. mysql获取当前时间+1天_mysql获取当前时间,前一天,后一天
  15. Go Grpc Jwt身份认证和Gateway集成以及HTTPS双向认证
  16. 市场营销方式详尽客户调查报告:Inbound vs. Outbound
  17. 聚集索引与非聚集索引
  18. 程序员的浪漫之——情侣日常小程序
  19. c语言如何框出视频或图像中的车辆,[转载]视频图像中的车辆检测跟踪和分类
  20. js实现颜色从蓝色渐变到红色

热门文章

  1. hackerone资产获取,并接入扫描器做自动化监控
  2. C++ 堆结构(数组实现)
  3. siri中文语音助理_懒是第一生产力!萌新小白DIY智能语音(Siriamp;小爱)远程控制家庭影院方案...
  4. flex 4.0 滤镜效果.
  5. 服务器安全狗 网站安全狗,全新升级!服务器安全狗和网站安全狗杞版重磅发布...
  6. 【温故知新】CSS学习笔记(并集和交集选择器)
  7. Gerrit 使用手册
  8. 唤醒淘宝app并跳转对应的商品详情页面
  9. 微信支付签名错误 php
  10. 为什么电感用L表示?