北京某某塑料板材有限公司

诚信 / 务实 / 完善 / 快速 / 放心 - 国际品牌

咨询热线： 020-88888888

当前位置：主页 > 资讯中心 > 常见问题 » 【优化器】(二) AdaGrad原理 & pytorch代码解析

【优化器】(二) AdaGrad原理 & pytorch代码解析

在上一篇文章里，我们介绍了SGD这个最朴素的梯度下降方法，以及其Momentum和NAG的优化改进方法。我们现在又回过头来看这个没加Momentum的图，可以看到在垂直方向上的梯度较大，走得很快，而水平方向上的位移较小，走的很慢，看着就很急！但你先别急，那么能不能不使用Momentum就让水平方向上的位移大一点，垂直方向上的位移小一点呢？

我们想要迄今为止梯度大的参数（即垂直方向）更新得慢一点，梯度小的参数（即水平方向）更新得快一点，这个就是二阶动量的定义：

$V_{t}=\sum_{ au =1}^{t}g_{ au }^{2}$

其中， $V_{t}$ 为当前时刻的二阶动量， $g_{ au }^{}$ 是某一时刻的梯度， $\sum_{ au =1}^{t}g_{ au }^{2}$ 表示迄今所有梯度的平方和。AdaGrad就是在SGD的基础上，把二阶动量加入到参数更新的过程中：

$w^{t+1}=w^{t}-\alpha \cdot g_{t}/\sqrt{V_{t}}$

其中， $w$ 为模型参数， $\alpha$ 为学习率，这时学习速率就会根据二阶动量来自适应进行调整。

我们现在再从上述的二维图扩展到整个深度学习模型中，并不是所有模型参数都会被频繁更新。对于频繁更新的参数，由于我们已经积累了大量的先验信息，所以不希望被单个样本影响的太大，所以希望学习速率慢一点；对于偶尔更新的参数，我们想要它从偶尔出现的样本上尽可能获取更多得信息，所以希望学习速率快一点。

因此二阶动量可以在数据稀疏的情况下表现很好，因为稀疏数据中0占大多数，此时二阶动量累积梯度和较大，可以有效降低重复数据的学习速度。但是由于 $V_{t}$ 会随着训练过程不断增大，所以学习率最终会逼近于0，可能会造成训练的提前终止。

AdaGrad的伪代码流程如下，重点在最后两行，不考虑weight_decay的情况下，把梯度的平方累加到state_sum中，再用当前梯度除以state_sum乘以学习率来更新参数：

以下代码为pytorch官方AdaGrad代码。

业务合作/学习交流+v：lizhiTechnology

?如果想要了解更多优化器相关知识，可以参考我的专栏和其他相关文章：

优化器_Lcm_Tech的博客-CSDN博客

【优化器】(一) SGD原理 & pytorch代码解析_sgd优化器-CSDN博客

【优化器】(二) AdaGrad原理 & pytorch代码解析_adagrad优化器-CSDN博客

【优化器】(三) RMSProp原理 & pytorch代码解析_rmsprop优化器-CSDN博客

【优化器】(四) AdaDelta原理 & pytorch代码解析_adadelta里rho越大越敏感-CSDN博客

【优化器】(五) Adam原理 & pytorch代码解析_adam优化器-CSDN博客

【优化器】(六) AdamW原理 & pytorch代码解析-CSDN博客

【优化器】(七) 优化器统一框架 & 总结分析_mosec优化器优点-CSDN博客

如果想要了解更多深度学习相关知识，可以参考我的其他文章：

【损失函数】(一) L1Loss原理 & pytorch代码解析_l1 loss-CSDN博客

【图像生成】(一) DNN 原理 & pytorch代码实例_pytorch dnn代码-CSDN博客

上一篇：英国VS美国中小学，原来低龄留学差别这么大！

下一篇：搜索引擎优化英文(谷歌优化流程是什么？谷歌推广的门槛怎么样)

推荐阅读

美术单词'art'的发音技巧？如何正确朗读？ 2025-07-05
幸运破解器2025最新版 2025-07-05
2024年体育生可以考警校吗？需要什么条件？体育生多少分能上警校 2025-07-05
Wieliczka Salt Mine 2025-07-05
如何在Chrome浏览器中启用或禁用Flash插件 2025-07-05
音集协发布2023年报：著作权使用费收入超5.6亿元创历史新高 2025-07-05
【枫与铃】第一、二、三卷动画～ 2025-07-05
excel怎么填充从小到大排名 2025-07-05

推荐产品

关于我们

北京某某塑料板材有限公司

启航娱乐环保设计研发站成立于1970年，公司专业提供环保设备研发设计，环保设备销售等启航注册，登录，...

咨询热线 020-88888888

常见问题

相关资讯

美术单词'art'的发音技巧？如何正确朗读？

音集协发布2023年报：著作权使用费收入超5.6亿元创历史新高

【枫与铃】第一、二、三卷动画～

奥数是什么意思？_1

纯干货！外贸SOHO如何起步？这份新手指南请收好！

{ 熵码匠艺： Software Craftsmanship }

c2c跨境电商平台有哪几个？（全球58家主流跨境电商平台）

“爱”字的偏旁部首是什么？

联系我们

QQ：88888888

电话：020-88888888

手机：139-8888-8888

地址：广东省广州市番禺经济开发区

: 微信公众号

工作时间
周一至周五 9:00-18:00
020-88888888
在线咨询

Copyright © 2002-2021 启航娱乐环保设计研发站版权所有非商用版本备案号：粤ICP备74518541号

平台注册入口