paddle学习笔记(1)--clear_grad()函数
在梯度更新的时候,使用了一个clear_grad函数,当时在想,如果没有清空梯度会怎么样(其实我主要是想了解损失函数是怎么backforward的,但是那个代码调试到
core.dygraph_run_backward([self], [grad_tensor],retain_graph,framework._dygraph_tracer())
就不知道后面说的啥了,不过在这个文件里面有对清空梯度的解释:
The new gradient will accumulat on previous gradient.You can clear gradient by ``Tensor.clear_grad()`` .
这里面就是说如果不把之前的清空就会一直累加
顺便还有例子,体会一下:
Examples:.. code-block:: pythonimport paddlex = paddle.to_tensor(5., stop_gradient=False)for i in range(5):y = paddle.pow(x, 4.0)y.backward()print("{}: {}".format(i, x.grad))# 0: [500.]# 1: [1000.]# 2: [1500.]# 3: [2000.]# 4: [2500.]x.clear_grad()print("{}".format(x.grad))# 0.grad_tensor=paddle.to_tensor(2.)for i in range(5):y = paddle.pow(x, 4.0)y.backward(grad_tensor)print("{}: {}".format(i, x.grad))# 0: [1000.]# 1: [2000.]# 2: [3000.]# 3: [4000.]# 4: [5000.]"""
paddle学习笔记(1)--clear_grad()函数相关推荐
- c++学习笔记内联函数,函数重载,默认参数
c++学习笔记内联函数,函数重载,默认参数 1 inline内联函数 C++中的const常量可以替代宏常数定义,如: const int A = 3; #define A 3 C++中是否有解决 ...
- c语言中void arrout,c语言学习笔记(数组、函数
<c语言学习笔记(数组.函数>由会员分享,可在线阅读,更多相关<c语言学习笔记(数组.函数(53页珍藏版)>请在人人文库网上搜索. 1.数组2010-3-29 22:40一维数 ...
- IOS学习笔记07---C语言函数-scanf函数
2013/8/7 IOS学习笔记07---C语言函数-scanf函数 ------------------------------ qq交流群:创梦技术交流群:251572072 ...
- IOS学习笔记07---C语言函数-printf函数
IOS学习笔记07---C语言函数-printf函数 0 7.C语言5-printf函数 ------------------------- ----------------------------- ...
- IOS学习笔记06---C语言函数
IOS学习笔记06---C语言函数 -------------------------------------------- qq交流群:创梦技术交流群:251572072 ...
- jquery学习笔记及常用函数封装
二.JQuery 学习笔记及常用函数封装 https://download.csdn.net/download/weixin_42530002/13087988 1.JQuery入门 (1).css选 ...
- STATA学习笔记:egen函数
STATA学习笔记:egen函数 1. egen (1)mean() webuse egenxmpl,clear egen avg = mean(cholesterol) gen deviation ...
- Python学习笔记11:函数修饰符
Python学习笔记11:函数修饰符 Python有很多有趣的特性,其中函数修饰符就是一个. 我们在之前的那个web应用示例中用过如下写法: @web.route('/log') @符号后边的,就是一 ...
- Hive学习笔记三之函数操作
文章目录 5 函数 5.1 系统内置函数 5.2 常用内置函数 5.2.1 空字段赋值 5.2.2 CASE WHEN THEN ELSE END(类似于java中的switch case) 5.2. ...
最新文章
- python >> 和 <<
- sorry for yesterday
- Homebrew存在大漏洞,恶意代码远程操纵电脑! 网友:这不是单方面的责任
- 九零后程序员心塞大哭:“我累的心脏疼,父母却说我工作很轻松”
- 德哥的PostgreSQL私房菜 - 史上最屌PG资料合集
- CSS 常用中文字体的英文名称
- 1200万!硅谷AI大牛一年赚够北京二环一套房
- 【java笔记】打印流printStream
- 二级c语言准考证,考试准考证打印
- kafaka,activityMQ,rabbitMQ消息中间件对比
- protues仿真arduino串口通讯
- android build.prop 修改,修改android的build.prop文件真的能够提高android设备性能?!...
- 电子商务的未来谁主宰?
- jh锂电保护电路_锂电池保护电路工作原理
- HTML5和CSS3的一些小总结
- PostgreSQL 源码解读(31)- 查询语句#16(查询优化-表达式预处理#1)
- 腾讯2020校园招聘正式批市场研究 | 群面(2019.10.17)
- 音视频 — 图像基础
- 蓝天学校计算机教学反思,高中语文教学反思
- MYSQL学习笔记(一)概述
热门文章
- oracle 49152,使用 snoop 命令监视包传送 - Oracle Solaris 管理:IP 服务
- Vid2Vid:Video-to-Video Synthesis
- 科大奥锐密立根油滴实验数据_密立根油滴实验数据表格
- SpringBoot实战教程(3.1)——失败重试机制
- 戴尔服务器光盘装Linux系统,DELL服务器引导光盘下载连接,DELL引导盘万能驱动支持所有型号...
- 美国大学本科计算机本科排名2015,美国大学计算机本科最新排名
- VB编程小实例-----儿童识字
- keepalived的健康检查方式
- MFC 不同编译平台宏定义
- Source Insight常用配置