网络上已经有很多的文章来描述,FPGA在实现深度学习的优势和劣势。当然描述有对有错。如果你说是完全的劣势。那么旷视,商汤等公司还在使用FPGA完成深度学习,而没有转向GPU呢?

我在这里就简明扼要的去描述FPGA在深度学习上的优势和劣势。

优势:(终端部署)

1,FPGA和CPU没有啥好比较的,在深度学习终端部署,CPU完全不能考虑,tensorflow lite 虽然能压缩模型到一个很小的范围。但是依旧是实时性不够好。FPGA相对于GPU来说,相同算力情况下,有成本优势。在很多的网络上标示FPGA的成本不比GPU的低。这个答案是正确的。那么问题点在哪里呢??因为FPGA不擅长浮点运算。如果能够有效的压缩的话,成本会迅速降低。

计算,可不是FPGA的长项。如果是这种计算,FPGA的人工成本就太高了。 还好,卷积神经网络没那么复杂。

2,另外一个就是FPGA的灵活性。在深度学习高速迭代的情况下,FPGA比NPU强一些,可以灵活的选择器件功能。基础结构完成后,可以迅速修改。

3,FPGA国产化以及覆盖而且使用良好。GPU尚未国产化。

4,FPGA完成方便流片。(流片贵,还是国产FPGA便宜。)

劣势:

1,编程难度大。相对于GPU和CPU来说,FPGA要是想实现深度学习算法难度很大。开发周期长。

2,通用情况下,FPGA的算力赶不上NPU。

3,需要来回定制,需要经常修改。

我的选择

嵌入式ARM, 即使tensorflow lite方式部署,时效性依然不够。如果增加算力,也就是增加成本。总不能买个麒麟9000芯片吧。成本优势就没了。

GPU,传统意义上的GPU,都比较贵。而且我个人也没有能力C ++完成提高程序效率。所以,没办法提高效率的情况下,成本高。

FPGA,已经6-7年的经验了。编程上很熟悉。而且深度学习卷积神经网络,很适合并行乘加结构。只要合理量化,能做到算力和成本的优势。

参考网址:

https://www.zhihu.com/question/324628088/answer/934549697

https://zhuanlan.zhihu.com/p/55710100

备注

在我认为的未来深度学习行业里, 只剩下FPGA  和NPU。姑且认为但凡内置了卷积神经网络计算单元的ARM都是NPU。  NPU为通用计算单元,每家都会有比如说:寒武纪,会像现在的ARM,或者说海思芯片一样。而FPGA呢?卷积神经网络经过多FPGA工程师的努力,已经变成了一款IP,可以根据内部情况随时调整。说实在的,个人感觉深度神经网络的发展已经严重内卷,随着芯片行业的推移,FPGA的地位会先上升3-5年,而后会被NPU取代而边缘化。

你好:我是毛华望,看我是如何用FPGA来完成深度学习,控制成本的。

控制成本。

有兴趣相关技术的人可以看个人介绍和我毛华望联系。

FPGA实现深度学习系列之FPGA的优势和劣势相关推荐

  1. FPGA实现深度学习系列之卷积神经网络算法描述

    这里全部内容都是由这个网址转载过来的. https://tech.youmi.net/2016/07/163347168.html 解说: 关于算法的完成.需要看很多的文章和视频才能有更好的理解和领悟 ...

  2. 基于FPGA的深度学习算法加速

    学习总结--基于FPGA的深度学习算法加速 1.深度学习算法加速的方法 2.为什么用FPGA来加速YOLOV2 3.FPGA简介 4.PYNQ框架与HLS加速理论 5.实验结果 1.深度学习算法加速的 ...

  3. FPGA在深度学习应用中或将取代GPU

    FPGA在深度学习应用中或将取代GPU 本文来源:AI前线 作者 | Ben Dickson 译者 | 大小非 人工智能的兴起触发了市场对 GPU 的大量需求,但 GPU 在 AI 场景中的应用面临使 ...

  4. FPGA零基础学习:基于FPGA的多路选择器设计(附代码)

    FPGA零基础学习:基于FPGA的多路选择器设计(附代码) 大侠好,欢迎来到FPGA技术江湖.本系列将带来FPGA的系统性学习,从最基本的数字电路基础开始,最详细操作步骤,最直白的言语描述,手把手的& ...

  5. FPGA零基础学习:基于FPGA的二进制转BCD设计(附代码)

    FPGA零基础学习:基于FPGA的二进制转BCD设计(附代码) 本系列将带来FPGA的系统性学习,从最基本的数字电路基础开始,最详细操作步骤,最直白的言语描述,手把手的"傻瓜式"讲 ...

  6. FPGA零基础学习:在FPGA中,同步信号、异步信号和亚稳态的理解

    FPGA零基础学习:在FPGA中,同步信号.异步信号和亚稳态的理解 叁芯智能科技-郝旭帅团队打造"FPGA 设计与研发"学习系列, 可以让设计者从"小白"到&q ...

  7. 深度学习系列:深度学习在腾讯的平台化和应用实践

    深度学习系列:深度学习在腾讯的平台化和应用实践(一) 莫扎特 2015-01-04 6:05:13 大数据技术 评论(0) 深度学习是近年机器学习领域的重大突破,有着广泛的应用前景.随着Google公 ...

  8. 【深度学习系列】——神经网络的可视化解释

    这是深度学习系列的第三篇文章,欢迎关注原创公众号 [计算机视觉联盟],第一时间阅读我的原创!回复 [西瓜书手推笔记] 还可获取我的机器学习纯手推笔记! 深度学习系列 [深度学习系列]--深度学习简介 ...

  9. 【深度学习系列】——深度学习简介

    这是深度学习系列的第一篇文章,欢迎关注原创公众号 [计算机视觉联盟],第一时间阅读我的原创!回复 [西瓜书手推笔记] 还可获取我的机器学习纯手推笔记! 直达笔记地址:机器学习手推笔记(GitHub地址 ...

最新文章

  1. net start mysql 提示:服务名无效 请键入NET HELPING 2185以获得更多的帮助的问题
  2. 【OpenCV 4开发详解】点集拟合
  3. JGG | 肠道细菌加重小分子量卡拉胶诱发的直肠炎症
  4. oracle基础之工具系列(持续更新中,,)
  5. 浅谈ICMP Flood***原理
  6. java=====Striing date 转化
  7. 硬盘分区表和文件分配表格式
  8. linux下的mongodb数据库原生操作
  9. 合并table中某一列相邻的相同的行
  10. 淘宝双十一火爆下的暗礁?
  11. 高等代数期末考试题库及答案_复旦大学2019--2020学年第一学期19级高等代数I期末考试第六大题...
  12. 菜鸟学运筹学----引
  13. MySQL设计一个图书馆数据库_设计一个图书馆数据库
  14. 一个查英语缩写的网站
  15. 编写一个图片去水印的小工具
  16. 计算机创新创业1000字,大学生创新创业论文1000字
  17. Centos7 系统登录密码忘记解决方法
  18. 黑马程序员rocketmq第一章
  19. windows11+wsl+clion调试srs
  20. Spark Streaming控制每秒消费数据的速度

热门文章

  1. 利用ArcGIS评估人工鱼礁投放量
  2. 剪花布条(HDU 2087)
  3. 多线程实现方式---实现Runnable接口
  4. 根据头像生成卡通头像要用什么技术
  5. linux YUM 源 —— 网络源的配置 包教包会~ 详解
  6. Android 两种制作圆形/圆角图片的方法
  7. java map遍历_Java 循环遍历 Map
  8. Android 透明状态栏及设置状态栏字体颜色
  9. python上计算2的100次方_用VBS精确计算2的100次方的代码
  10. solidity修饰符、节省gas技巧