小米开源框架MACE 源码阅读笔记
转载自 https://www.jianshu.com/p/7061fd67d419
前扯
另外,Github
上的代码会一直处于更新中,后续会尽量紧跟更新。
开篇
![](https://upload-images.jianshu.io/upload_images/9389734-8fd9c42759b9215d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/406)
下边的几个文件是一些版本发布与介绍性文件,与代码的相关性不大,简单看下 README_zh.md
里边说的:
“Mobile AI Compute Engine (MACE) 是一个专为移动端异构计算平台优化的神经网络计算框架。主要从以下的角度做了专门的优化:
性能
代码经过NEON指令,OpenCL以及Hexagon HVX专门优化,并且采用 Winograd算法 来进行卷积操作的加速。此外,还对启动速度进行了专门的优化。功耗
支持芯片的功耗管理,例如ARM的big.LITTLE调度,以及高通Adreno GPU功耗选项。系统响应
支持自动拆解长时间的OpenCL计算任务,来保证UI渲染任务能够做到较好的抢占调度,从而保证系统UI的相应和用户体验。内存占用
通过运用内存依赖分析技术,以及内存复用,减少内存的占用。另外,保持尽量少的外部依赖,保证代码尺寸精简。模型加密与保护
模型保护是重要设计目标之一。支持将模型转换成C++代码,以及关键常量字符混淆,增加逆向的难度。硬件支持范围
支持高通,联发科,以及松果等系列芯片的CPU,GPU与DSP(目前仅支持Hexagon)计算加速。同时支持在具有POSIX接口的系统的CPU上运行。
”
看其介绍,MACE
团队应该是倾注了不少心血,希望能够不断完善下去。
回到代码目录上来。docker
文件夹是几个与docker
安装相关的文件,不用过多关注。docs
文件夹是一些文档,与代码关系不大。third_party
和tools
文件夹是需要用到的一些第三方模块和代码构建、测试所用到的相关脚本。其中tools/converter.py
是构建代码的顶层脚本,有兴趣的可以详细看一下,之前的文章里也有提到 <小米开源框架MACE> 如何构建和使用。
核心的代码在mace
文件夹下。同样的,先看一下mace
文件夹下的结构:
![](https://upload-images.jianshu.io/upload_images/9389734-0b649061bcdc21b1.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/406)
仍然是聚焦一些与框架代码相关的文件夹。此处默认读者已事先学习过mace\examples\cli\examples.cc
,如没有建议先过一遍,对如何在项目里使用 mace
有个了解。也可以参考 <小米开源框架MACE> 如何构建和使用 一文的最后内容。按照 examples.cc
里的引用,先来看 public
文件夹里的两个头文件:mace.h
和mace_runtime.h
。
mace\public\mace.h 剖析
mace.h
头文件定义了mace框架的几个核心API,包括 CallStats
、ConvPoolArgs
、OperatorStats
三个结构体以及 DeviceType
和 MaceStatus
两个枚举类型。
enum DeviceType { CPU = 0, GPU = 2, HEXAGON = 3 }; //框架支持的设备类型及其对应ID.
enum MaceStatus {
MACE_SUCCESS = 0,
MACE_INVALID_ARGS = 1,
MACE_OUT_OF_RESOURCES = 2
}; // 函数的返回类型
mace.h
头文件中还定义了三个类:RunMetadata
、MaceTensor
和 MaceEngine
RunMetadata
:定义了一个public
类型的变量op_stats
,类型为vector <OperatorStats>
MaceTensor
:定义了MACE
输入输出tensor
,有几个不同形式的构造函数
MaceEngine
:作为MACE
框架引擎,根据构造函数传入的DeviceType
执行相应的功能代码
MaceTensor
和 MaceEngine
两个类中都分别定义了一个嵌套类Impl
,这个嵌套类才是真正实现具体功能的类。
mace\core\mace.cc剖析
对应于mace\public\mace.h
头文件的实现文件为mace\core\mace.cc
作为深入源码的第一步,下面我们一起看一下这个文件。
首先是LoadModelData
和 UnloadModelData
两个与模型数据导入和清空的函数。
接下来是MaceTensor
中的嵌套类Impl
的定义:
class MaceTensor::Impl {
public:
std::vector<int64_t> shape;
std::shared_ptr<float> data;
};
然后是MaceTensor
的构造函数实现。MaceTensor
的构造函数主要实现Impl
类中shape
和data
两个变量的初始化工作,以下贴出其中一种形式的构造函数,更多代码请查阅mace\core\mace.cc
MaceTensor::MaceTensor(const std::vector<int64_t> &shape,
std::shared_ptr<float> data) {
MACE_CHECK_NOTNULL(data.get());
impl_ = std::unique_ptr<MaceTensor::Impl>(new MaceTensor::Impl());
impl_->shape = shape;
impl_->data = data;
}
MaceTensor
类中还有三个成员函数,用于获取impl
的变量值。
const std::vector<int64_t> &MaceTensor::shape() const { return impl_->shape; }
const std::shared_ptr<float> MaceTensor::data() const { return impl_->data; }
std::shared_ptr<float> MaceTensor::data() { return impl_->data; }
接下来是MaceEngine
中的嵌套类Impl
的定义,其中涉及到的Workspace
、NetBase
等类,暂时不需要过多关注,只需要知道这个内嵌类实现了MACE引擎的创建、初始化和运行。下边是Impl
类的主体代码:
class MaceEngine::Impl {
public:
explicit Impl(DeviceType device_type);
~Impl();
MaceStatus Init(const NetDef *net_def,
const std::vector<std::string> &input_nodes,
const std::vector<std::string> &output_nodes,
const unsigned char *model_data);
MaceStatus Init(const NetDef *net_def,
const std::vector<std::string> &input_nodes,
const std::vector<std::string> &output_nodes,
const std::string &model_data_file);
MaceStatus Run(const std::map<std::string, MaceTensor> &inputs,
std::map<std::string, MaceTensor> *outputs,
RunMetadata *run_metadata);
private:
const unsigned char *model_data_;
size_t model_data_size_;
std::shared_ptr<OperatorRegistry> op_registry_;
DeviceType device_type_;
std::unique_ptr<Workspace> ws_;
std::unique_ptr<NetBase> net_;
std::map<std::string, mace::InputInfo> input_info_map_;
std::map<std::string, mace::OutputInfo> output_info_map_;
#ifdef MACE_ENABLE_HEXAGON
std::unique_ptr<HexagonControlWrapper> hexagon_controller_;
#endif
MACE_DISABLE_COPY_AND_ASSIGN(Impl);
};
Impl
类中有Impl
、Init
、Run
三个函数(Init
有一个重载函数)。
Impl函数
Impl
函数是构造函数,完成一些变量的初始化工作。与Tensor
相关的一些操作会在Workspace
下,因而此处创建了一个Workspace
对象。Init函数
Init
函数完成MaceEngine
的初始化工作。包括根据网络定义创建输入输出的存储map
,根据输入输出节点和deviceType
创建Tensor
,初始化整个网络模型。Init
还有一个重载函数,区别只是const unsigned char *model_data
和const std::string &model_data_file
这两个参数。后者通过LoadModelData
载入模型数据后调用前者完成初始化。Run函数
Run
函数根据输入输出文件信息,初始化的模型信息和模型数据,以及device_type_
类型调用相应的执行代码。完成模型的前向运算。输出运算结果并保存。
MaceEngine
类本身还有Init
、Run
函数,都是通过调用 Impl
类的相应函数实现的。
mace\core\mace.cc
中还有一个 CreateMaceEngineFromProto
函数。这个函数和 mace/codegen/engine/mace_engine_factory.h
中 CreateMaceEngineFromCode
函数是对应的。两者都是通过调用MaceEngine
的 Init
函数(也即调用 Impl
的Init
函数) 实现初始化过程。 区别在于,前者是通过模型proto
定义文件进行初始化,后者是将模型编为代码(在模型部署文件 .yaml
中设置CODE_TYPE
为 code
)。mace/codegen/engine/mace_engine_factory.h
这个文件是代码构建之后产生的。
以上,对 mace\public\mace.h
和 mace\core\mace.cc
进行了分解,并分析了 mace
框架顶层的几个API,也是框架的基础。
后续将陆续扩展到框架中核心代码的实现。
敬请拍砖(轻拍o( ̄▽ ̄)d )。
版权所有,欢迎转载,转载请注明出处
小米开源框架MACE 源码阅读笔记相关推荐
- 小米开源框架MACE 源码阅读笔记 1
转载自 https://www.jianshu.com/p/7061fd67d419 前扯 在前不久的某高峰论坛上,小米开源了其移动端的深度学习框架Mobile AI Compute Engine(M ...
- 小米开源框架MACE - 源码阅读笔记一
首先先一目了然看一下其目录结构(这些个源码可以在github上下载到,只要在GitHub搜索mace即可): 介绍 MACE(Mobile AI Compute Engine)是一个针对移动异构计算平 ...
- 大众点评分布式系统监控开源框架cat源码阅读(个人笔记)
cat 数据接收 TcpSocketReceiver 该类中startServer(port)方法用于启动netty,设置消息解码器MessageDecoder和消息编码器ClientMessageE ...
- 【Flink】Flink 源码阅读笔记(15)- Flink SQL 整体执行框架
1.概述 转载:Flink 源码阅读笔记(15)- Flink SQL 整体执行框架 在数据处理领域,无论是实时数据处理还是离线数据处理,使用 SQL 简化开发将会是未来的整体发展趋势.尽管 SQL ...
- CI框架源码阅读笔记4 引导文件CodeIgniter.php
到了这里,终于进入CI框架的核心了.既然是"引导"文件,那么就是对用户的请求.参数等做相应的导向,让用户请求和数据流按照正确的线路各就各位.例如,用户的请求url: http:// ...
- 小米开源框架mace android案例调试
小米开源框架mace android案例调试 1. 准备工作 编译环境准备:请参照小米官方的文档: https://mace.readthedocs.io/en/latest/installation ...
- Yii源码阅读笔记 - 日志组件
2015-03-09 一 By youngsterxyf 使用 Yii框架为开发者提供两个静态方法进行日志记录: Yii::log($message, $level, $category); Yii: ...
- libreCAD源码阅读笔记1
libreCAD源码阅读笔记1 一 前言: 正如官网(https://www.librecad.org)所说,libreCAD是一个开源的CAD制图软件,可以运行在Windows.Apple.Linu ...
- HashMap源码阅读笔记
HashMap是Java编程中常用的集合框架之一. 利用idea得到的类的继承关系图可以发现,HashMap继承了抽象类AbstractMap,并实现了Map接口(对于Serializable和Clo ...
最新文章
- linux 邮件发送时间,Linux-No.04 Linux 设置定时任务发送邮件功能
- 老web换新枝----Sails.js移动设备的全新生产力(五)
- 漫步最优化三十六——基本共轭方向法
- python桌面程序打开慢_转 : 终于搞清楚了为什么Java桌面程序总是感觉慢的原因...
- Linux命令篇之tree命令和touch命令
- android 层叠轮播,vue手写一个卡片化层叠轮播(支持滑动,移动端连续滚动,点击)...
- Embeded linux之地址映射
- Activity管理笔记
- linux下目录与文件的权限及特殊权限
- 2019最新 Java商城秒杀系统的设计与实战视频教程(SpringBoot版)_1-4系统的整体演示...
- TJUSCSST第三次作业
- 1.三层交换,ACL,PPP,OSPF,热备
- win10如何局部截图
- 软件测试基础知识【纯知识分享】
- 中国研修网计算机培训心得,网络研修培训心得体会(精选7篇)
- 如何体面的解决浏览器首页被hao123绑架
- 密码疑云 (2)——RSA加密机制需要的数学知识
- 【Comet OJ - 2019国庆欢乐赛 F】 高速公路
- ergonomic计算机专业英语,[听单词] 计算机专业英语词汇音频52,计算机英语单词MP3...
- background-image属性
热门文章
- PHP上传rar获取不到文件,WordPress不让上传.rar格式附件的原因及解决办法
- ftok函数 php,php坑:ftok
- 注册之获取短信验证码
- pulsar版本升级
- 简述什么是蜜罐?如何分辨一个系统是不是蜜罐.
- 如何实现BiLSTM实现中文分词?与jieba、LSTM进行对比如何?【文档型详解】
- 中大SICILY分类
- 【转】sprintf函数用法
- matlab2c使用c++实现matlab函数系列教程-normrnd函数
- java script和java有什么区别,java script和java的区别