1. 数据集

dataset_train = gluon.data.ArrayDataset(X_train, y_train)
data_iter = gluon.data.DataLoader(dataset_train, batch_size, shuffle=True)for data, label in data_iter:...

2. 模型

  • gluon.nn:神经网络

    • gluon.nn.Sequential(),可添加:

      • gluon.nn.Flatten() ⇒ Flattens the input to two dimensional,将输入平坦为 2 维矩阵,是一种操作,而非添加进新的层

        net = gluon.nn.Sequencial()
        with net.name_scope():net.add(gluon.nn.Flatten())
      • gluon.nn.Dense:全连接

      • gluon.nn.Dropout(drop_prob1)
    
    # 序列化神经网络模型net = gluon.nn.Sequential()with net.name_scope():net.add(gluon.nn.Dense(1))# Dense(1):表示输出值的维度,# 一层的神经网络相当于线性回归# 参数初始化net.collect_params().initialize(mxnet.init.Normal(sigma=1))

3. 训练器(Trainer)

仅保存参数及超参,以及根据 batch size 进行参数更新:

trainer = gluon.Trainer(net.collect_params(), optimizer='sgd',optimizer_params={'learning_rate': learning_rate, 'weight_decay': weight_decay})
....
for data, label in data_iter:...trainer.step(batch_size)

4. 自动求导:autograd

  • autograd.is_training() ⇒ 训练过程还是测试预测过程:

    对于 dropout 型网络,训练过程因为 dropout 随机性的存在,模型是变化的,测试过程中节点全部参与,没有dropout;

mxnet(gluon)—— 模型、数据集、损失函数、优化子等类、接口大全相关推荐

  1. PyTorch主要组成模块 | 数据读入 | 数据预处理 | 模型构建 | 模型初始化 | 损失函数 | 优化器 | 训练与评估

    文章目录 一.深度学习任务框架 二.数据读入 三.数据预处理模块-transforms 1.数据预处理transforms模块机制 2.二十二种transforms数据预处理方法 1.裁剪 2. 翻转 ...

  2. MXNET gluon自定义损失函数

    在学习李沐老师的目标检测篇章 目标检测中由于负类较多,正类较少,我们可以适当的减少对负类的惩罚 因此根据视频教程我们来重新写一个损失函数 通常mxnet的损失函数需要继承Loss类 from mxne ...

  3. mxnet.gluon 加载预训练

    import mxnet as mx from mxnet.gluon import nn from mxnet import gluon,nd,autograd,init from mxnet.gl ...

  4. 深度学习1:神经网络基础前馈神经网络Feedforward Neural Network(基于Python MXNet.Gluon框架)

    目录 神经网络背景 常用的深度学习框架 机器学习的三个基本要素 模型 学习准则 损失函数 0-1损失函数 0-1 Loss Function 平方损失函数 Quadratic Loss Functio ...

  5. MXNet/Gluon 中 Triplet Loss 算法

    Triplet Loss,即三元组损失,用于训练差异性较小的数据集,数据集中标签较多,标签的样本较少.输入数据包括锚(Anchor)示例⚓️.正(Positive)示例和负(Negative)示例,通 ...

  6. 深度学习模型压缩与优化加速(Model Compression and Acceleration Overview)

    1. 简介 深度学习(Deep Learning)因其计算复杂度或参数冗余,在一些场景和设备上限制了相应的模型部署,需要借助模型压缩.系统优化加速.异构计算等方法突破瓶颈,即分别在算法模型.计算图或算 ...

  7. CUDA上的量化深度学习模型的自动化优化

    CUDA上的量化深度学习模型的自动化优化 深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参 ...

  8. mxnet可视化模型中间层feature map输出

    注: model输入 112x112 保存的图片可能是白色的(这个还没有修复),但是在pycharm中运行时可以通过scientific tool窗口看到 #构造辅助函数做预处理, 注意mxnet中为 ...

  9. MXNet.gluon——图像I/O

    MXNet gluon如何从文件夹读入图像 分类任务中需要将图像从文件夹中读入,并以迭代器的形式进行训练.gluon 的api 提供了一个方便的函数gluon.data.vision.ImageFol ...

最新文章

  1. torch.full()简介
  2. Apache https服务器配置笔记
  3. Tomcat与Gzip与缓存
  4. 前端有用JavaScript技巧
  5. HTC ThunderBolt无法打开3G问题解决方法
  6. ffmpeg实战教程(八)Android平台下AVfilter 实现水印,滤镜等特效功能
  7. [唐诗]诗(选二首)-王梵志
  8. 東京タワー初めてphoto
  9. memcpy-avx-unaligned/strcpy_sse2_unaligned崩溃记录
  10. android最新版本8.0,安卓8.0系统安装包下载
  11. 【AI视野·今日CV 计算机视觉论文速览 第189期】Fri, 1 Jan 2021
  12. vue axios封装及使用
  13. 319@365 RStudio中rgl包安装后调用出错解决方法初探。
  14. MD5密码破解原理和网站
  15. bzoj 1814 Fornula 1
  16. 如何起Linux服务器的21端口,linux下开启ftp的21号端口
  17. SharePoint On Premise 数据迁移到 SharePoint Online的几点考虑
  18. 什么是进程,进程的特征
  19. IPVS(也叫LVS)的源码分析之persistent参数
  20. 原装RFX2401C集成电路2.4GHZ单芯片射频前端IC无线教学模块

热门文章

  1. (转)Managed DirectX +C# 开发(入门篇)(七)
  2. linux asm 使用情况,在Linux 6上使用UDEV解决 ASM存储设备问题( single path)
  3. python 堆栈溢出_IAR堆栈溢出的问题
  4. 三、Nginx内置变量
  5. idea中 mybatis 的 mapper.xml 新建没有 头文件
  6. Rxjava2+Retrofit2结合使用
  7. oracle 10g rac 停止,Oracle10g RAC 关闭及启动
  8. spark加载数据的方式
  9. asp oracle 分页显示,asp + oracle 分页方法(不用存储过程)
  10. nokia 3030 java 应用_诺基亚3030怎么样 :诺基亚3030测评【图解】