深度学习

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

文章目录

参考博客
正则化介绍
正则化的实现

参考博客

深入理解L1、L2正则化
 PyTorch 实现L2正则化以及Dropout的操作

正则化介绍

正则化Regularization是机器学习中一种常用的技术其主要目的是控制模型复杂度减小过拟合。最基本的正则化方法是在原目标代价函数中添加惩罚项对复杂度高的模型进行“惩罚”。其数学表达形式为
$\check{J}(w; X, y)=J(w; X, y) + \alpha\Omega(w)$
式中 $X, y$ 为训练样本和相应标签, $w$ 为权重系数向量; $J ()$ 为目标函数, $\Omega(w)$ 即为惩罚项, 可理解为模型"规模"的某种度量; 参数 $\alpha$ 控制正则化的强弱. 不同的 $\Omega$ 函数对权重w的最优解有不同的偏好, 因而会产生不同的正则化效果. 最常用的 $\Omega$ 函数有两种, 即 $l_1$ 范数与 $l_2$ 范数, 相应称之为 $l_1$ 正则化和 $l_2$ 正则化.此时有:
$l_1: \Omega(w)=||w||_1=\sum_i|w_i|$
$l_2: \Omega(w)=||w||_2=\sqrt{\sum_iw_i^2}$

正则化的实现

在Pytorch中正则化的实现只需要一行代码, 如下:

optimizer = torch.optim.SGD(model.parameters(), \
lr=config.learning_rate, momentum=0.9, weight_decay=0.000001)

在这个函数调用中 $weight\_decay=0.001$ 就是L2范数.

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

返回列表

上一篇：linux 安装,卸载jdk8

下一篇：MySQL入门篇-MySQL 8.0 延迟复制

“深度学习” 的相关文章

SpringBoot AOP统一处理Web请求日志1年前 (2023-02-02)

Springboot整合第三方技术及整合案例1年前 (2023-02-02)

记录--短视频滑动播放在 H5 下的实现1年前 (2023-02-02)

所以生命啊，她璀璨如歌。1年前 (2023-02-02)

关于GIT使用的扫盲知识1年前 (2023-02-02)

网站都变成灰色了，它是怎么实现的？_网站变灰1年前 (2023-02-02)

忙活了一年的开源社区，终于赶上了春节前的末班车！1年前 (2023-02-02)

【Linux编辑神器：vim】1年前 (2023-02-02)

会用postman不算牛，会用Eolink才是真的牛1年前 (2023-02-02)