【1】机器学习

有监督学习supervised learning
⚫ 数据集中的样本带有标签有明确目标
⚫ 回归和分类
无监督学习unsupervised learning
⚫ 数据集中的样本没有标签没有明确目标
⚫ 聚类、降维、排序、密度估计、关联规则挖掘
强化学习reinforcement learning
⚫ 智慧决策的过程通过过程模拟和观察来不断学习、提高决策能力
⚫ 试错方法
⚫ 例如AlphaGo

机器学习的一些方法是深度学习不能替代的

1.3 基本概念

1.4 有监督学习

数据集中的样本带有标签
目标找到样本到标签的最佳映射
典型方法
⚫ 回归模型线性回归、岭回归、LASSO和回归样条等
⚫ 分类模型逻辑回归

1.5 无监督学习

可以处理没有标签的数据

根据数据本身的分布特点挖掘反映数据的内在特性
⚫ 典型方法
⚫ 聚类、降维、关联规则挖掘等

1.6 过度拟合问题

模型过于复杂(例如参数过多)

导致所选模型对已知数据预测得很好但对未知数据预测很差。

正则化

正则化是模型选择的典型方法
在误差函数上加一个正则项正则项通常为参数向量的范数
在训练误差和模型复杂度之间的权衡(trade off)

1.7 模型选择

交叉验证

基本想法是重复地使用数据。将数据集随机切分将切分的数据集组合为训练集和测试集在此基础上反复进行训练测试和模型选择。

K折交叉验证

2 机器学习常用工具

3 Scikit-learn

3.1 基本流程

3.2 Scikit-learn常用函数

transform函数数据转换

from sklearn import preprocessing
scaler =preprocessing.StandardScaler().fit(X_train)
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

fit函数模型训练

from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(X_train, y_train)

predict函数模型预测

y_pred = lr.predict(X_new)

3.3 Scikit-learn主要模块

3.4 Scikit-learn回归模块的主要算法

3.5 Scikit-learn分类模块的主要算法

3.6 Scikit-learn聚类模块的主要算法

3.7 Scikit-learn降维模块的主要算法

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

标签: 机器学习

返回列表

上一篇：Deferred Components-实现Flutter运行时动态下发Dart代码 | 京东云技术团队

下一篇：什么是自动化测试框架?我们该如何搭建自动化测试框架？

“【1】机器学习” 的相关文章

人工智能与机器学习1年前 (2023-02-02)

【机器学习】Logistic Regression 逻辑回归算法详解 + Java代码实现1年前 (2023-02-02)

机器学习算法：决策树算法简介以及分类原理_决策树分类算法的原理1年前 (2023-02-02)

你应该知道的机器学习模型部署细节和实施步骤1年前 (2023-02-02)

机器学习（一）：人工智能概述1年前 (2023-02-02)

Python机器学习：一元回归1年前 (2023-02-02)

AI算法工程师 | 09机器学习-概率图模型（二）朴素贝叶斯算法与文本分类（1）1年前 (2023-02-02)

唐宇迪机器学习实战课程笔记(全)1年前 (2023-02-02)

机器学习中的聚类算法1年前 (2023-02-02)

到底什么是机器学习模型？这篇文章终于讲明白了1年前 (2023-02-03)