机器学习-有监督学习-神经网络

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

目录

线性模型

  • 向量版本
    y = ⟨ w , x ⟩ + b y = \langle w, x \rangle + b y=w,x+b

分类与回归

  • 懂得两者区别
  • 激活函数损失函数

感知机模型

  • 感知机模型的本质是线性模型再加上激活函数
  • 训练数据、损失函数、梯度下降小批量梯度下降
  • 神经网络算法整体流程
  1. 初始化网络
  2. 前向传播
  3. 计算损失
  4. 计算微分
  5. 梯度下降
  6. 反向传播
  7. 多轮迭代
Created with Raphaël 2.3.0 开始 初始化函数 前向传播 计算损失 计算微分 梯度下降 反向传播 迭代完成 结束 yes no

激活函数

  • 给模型加入拟合非线性功能
  • 常见激活函数
    • Sigmoid 0-1 二分类
    • Tanh -1-1
    • relu公认的最好用的激活函数之一

维度诅咒

  • 神经网络可以很轻松的对隐藏层进行升降维
  • 升维后密度呈现指数形式逐渐下降维度太大会过拟合

过拟合和欠拟合

  • 训练误差模型在训练集上的误差
  • 泛化误差模型在同样从原始样本的分布中抽取的无限多数据样本时模型误差的期望。现实世界不可能有无限多数据所以只能将模型应用于独立的测试集来估计泛化误差。
  • 过拟合训练误差小泛化误差大。
  • 欠拟合训练误差大泛化误差大。
  • 解决过拟合
    • 正则化减少参数的大小
    • 数据增强对原始数据做变化增加数据量
    • 降维特征选择
    • 集成学习多个模型集成在一起
    • 早停法监控训练集和验证集的错误率
  • 解决欠拟合
    • 添加新特征
    • 增加模型复杂度
    • 减少正则化系数

正则

  • 正则约束模型复杂度来防止过拟合现象的一种手段。模型复杂度是由模型参数量大小和参数的可取值范围共同决定的。
  • 正则两个方向约束模型参数量(dropout)约束模型取值范围(weight decay)
  • 利用均方范数作为硬性和软性限制
  • 衡量模型好坏可以看方差和偏差
\低方差高方差
低偏差预测准且较集中预测准但较分散
高偏差预测不准且较集中预测不准且比较分散

在这里插入图片描述

  • L1正则化使参数稀疏化
    损失函数 = 原始损失函数 + λ 2 m ∑ i = 1 n ∣ w i ∣ \text{损失函数} = \text{原始损失函数} + \frac{\lambda}{2m}\sum_{i=1}^{n} |w_i| 损失函数=原始损失函数+2mλi=1nwi

  • L2正则化降低参数范围
    损失函数 = 原始损失函数 + λ 2 m ∑ i = 1 n w i 2 \text{损失函数} = \text{原始损失函数} + \frac{\lambda}{2m} \sum_{i=1}^{n} w_i^2 损失函数=原始损失函数+2mλi=1nwi2

  • Dropout 对神经网络的节点进行随机的失活训练时失活预测是全部节点

  • 集成学习是打比赛进行提点的一个很重要的方法

数据增强

  • 成功的机器学习应用不是拥有最好的算法而是拥有最多的数据
  • 当数据到达一定级数后拥有相近的高准确度。

数值稳定性

  • 计算机视觉模型很大数据集要好几万、好几亿。模型不大要需要上百。
  • 梯度消失
  • 梯度爆炸
  • 解决方法数据归一化
    • Z-Score归一化
    • 最大最小归一化
      • 原因提升模型精度和收敛速度

神经网络大家族

CNN

  • Image Search
  • Image Labeling
  • Image Segmantation
  • Object Detection
  • Object Tracking
  • OCR
  • Video Annotation
  • Recommendation
  • Image Classification
  • Robot perception
  • 以上分类不及1/10

RNN

  • 语法语义分析
  • 信息检索
  • 自动文摘
  • 文本数据挖掘
  • 自动问答
  • 机器翻译
  • 知识图谱
  • 情感分析
  • 文本相似度
  • 文本纠错
    原理下一层的输入不仅和原始输入有关还和之前的输出有关

GNN图神经网络

  • 芯片设计
  • 场景分析与问题推理
  • 推荐系统
  • 欺诈检测与风控相关
  • 知识图谱
  • 道路交通的流量预测
  • 自动驾驶无人机等场景
  • 化学医疗等场景
  • 生物制药等场景
  • 社交网络

原理图节点边和整体进行训练

GAN

  • 图像超分辨率
  • 艺术创作
  • 图像到图像的翻译风格迁移
  • 文本到图像的翻译
  • 图片编辑
  • 服装翻译
  • 照片表情符号
  • 图片融合
  • 图片修补

原理生成器和判别器

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: 机器学习