梯度下降更新算法

abella 2021-08-07 原文

梯度更新是要同时更新，如下图所示：θ0和θ1同时更新，而不是更新完一个后再更新另一个。

学习率α过小，梯度下降较慢，训练时间增长。若学习率α过大，梯度下降会越过最低点，难以得到最优的结果，导致难以收敛或发散。

如果参数值已是局部最优，进行梯度下降计算时导数是0，梯度下降不会作任何操作，参数不改变

在梯度下过程中无需修改学习率，因为在接近局部最有点时导数项会变小，梯度下降的步幅也会随之比变小。

梯度下降中batch:指计算一次梯度下降就使用全部的训练集数据

mini batch :指计算一次梯度下降时使用了一小部分训练集数据

多元特征的梯度下降时，进行特征缩放，可将梯度下降的速度提高，通常将特征的取值缩放至大约-1到1之间

使用小的学习率，一般0.001，0.003，0.01，0.03，0.1，0.3，1等

随机推荐

目前WEB前端UI框架受到新人追捧，下边为大家列出目前最受欢迎、最优秀的前端框架以供大家选择一款适合自己的！ […]...

Python爬虫 | Scrapy详解

一.Scrapy框架简介　　何为框架，就相当于一个封装了很多功能的结构体，它帮我们把主要的结构给搭建好了， […]...

1、while循环中使用sleep 缺点：不容易控制，而且是个阻塞函数 def timer(n): \'\'\ […]...

harbor搭建及使用

一、harbor概述　　VMware开源的企业级Registry项目Harbor，以Docker公司开源的r […]...

23种设计模式总篇

个人网站：https://chenmingyu.top/design/ 设计模式设计模式是软件设计中的最佳实 […]...

014年一月以来，自己接触web前端开发已经两年多了，记录一下自己前端学习路上看过的，以及道听途说的一些书，基 […]...

Windows&Mac安装Redis

Windows&Mac安装Redis Window 下安装Redis Redis 支持 32 位和 […]...

在学习spark时。spark运行会报一些无用的错误:ERROR Shell: Failed to locat […]...

梯度下降更新算法的更多相关文章