机器学习(五):机器学习算法分类

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

文章目录

机器学习算法分类

一、监督学习

1、回归问题

2、分类问题

二、无监督学习

三、半监督学习

四、强化学习


机器学习算法分类

根据数据集组成不同可以把机器学习算法分为:

  • 监督学习
  • 无监督学习
  • 半监督学习
  • 强化学习

一、监督学习

定义:输入数据是由输入特征值和目标值所组成。

函数的输出可以是一个连续的值(称为回归或是输出是有限个离散值(称作分类。

1、回归问题

例如:预测房价根据样本集拟合出一条连续曲线。

 

2、分类问题

例如:根据肿瘤特征判断良性还是恶性得到的是结果是“良性”或者“恶性”是离散的。

二、无监督学习

定义:输入数据是由输入特征值组成没有目标值。

  • 输入数据没有被标记也没有确定的结果。样本数据类别未知;
  • 需要根据样本间的相似性对样本集进行类别划分。

有监督无监督算法对比:

三、半监督学习

定义:训练集同时包含有标记样本数据和未标记样本数据。

监督学习训练方式:

半监督学习训练方式:

四、强化学习

定义:实质是make decisions 问题即自动进行决策并且可以做连续决策。

举例:

小孩想要走路但在这之前他需要先站起来站起来之后还要保持平衡接下来还要先迈出一条腿是左腿还是右腿迈出一步后还要迈出下一步。

小孩就是 agent他试图通过采取行动(即行走来操纵环境(行走的表面并且从一个状态转变到另一个状态(即他走的每一步当他完成任务的子任务(即走了几步时孩子得到奖励(给巧克力吃并且当他不能走路时就不会给巧克力。

主要包含五个元素:agent, action, reward, environment, observation;

强化学习的目标就是获得最多的累计奖励

监督学习和强化学习的对比

       监督学习强化学习
反馈映射输出的是之间的关系可以告诉算法什么样的输入对应着什么样的输出。输出的是给机器的反馈 reward function即用来判断这个行为是好是坏。
反馈时间做了比较坏的选择会立刻反馈给算法结果反馈有延时有时候可能需要走了很多步以后才知道以前的某一步的选择是好还是坏。
输入特征输入是独立同分布的。面对的输入总是在变化每当算法做出一个行为它影响下一次决策的输入。

  • 📢博客主页:https://lansonli.blog.csdn.net
  • 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正
  • 📢本文由 Lansonli 原创首发于 CSDN博客🙉
  • 📢停下休息的时候不要忘了别人还在奔跑希望大家抓紧时间学习全力奔赴更美好的生活✨
阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: 机器学习