机器学习13(正则化)

文章目录 简介正则化经验风险和结构风险过拟合正则化建模策略 逻辑回归逻辑回归评估器 练习评估器训练与过拟合实验评估器的手动调参 简介 这一节详细探讨关于正则...

机器学习——特征工程

对于机器学习特征工程的知识你是怎样理解“特征” 在机器学习中特征Feature是指从原始数据中提取出来的、用于训练和测试机器学习模型的各种属性、变量或特点。特征可以是任何类型的数据例如数字、文...

【机器学习】决策树(实战)

决策树实战 目录 一、准备工作设置 jupyter notebook 中的字体大小样式等二、树模型的可视化展示1、通过鸢尾花数据集构建一个决策树模型2、对决策树进行可视化展示的...

机器学习(二十)贪心学院ML训练营学习1 -KNN算法

1 KNN概述K-邻近算法采用测量不同特征值之间的距离方法进行分类,工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,意思是我们知道...

机器学习(十六)特征工程之数据分箱

1 分箱简介数据分箱(也称为离散分箱或分段)是一种数据预处理技术,用于减少次要观察误差的影响,是一种将多个连续值分组为较少数量的“分箱”的方法。例如,例如我们有一组关...

机器学习实战教程(九):模型泛化

泛化能力 模型泛化是指机器学习模型对新的、未见过的数据的适应能力。在机器学习中我们通常会将已有的数据集划分为训练集和测试集使用训练集训练模型然后使用测试集来评估模型的性能。模型在训练集上表现得好并不...

Python数据挖掘与机器学习

近年来Python编程语言受到越来越多科研人员的喜爱在多个编程语言排行榜中持续夺冠。同时伴随着深度学习的快速发展人工智能技术在各个领域中的应用越来越广泛。机器学习是人工智能的基础因此掌握常用机器学习算...

机器学习(五)使用Python和R语言从头开始理解和编写神经网络

介绍你可以通过两种方式学习和实践一个概念:选项1:您可以了解一个特定主题的整个理论,然后寻找应用这些概念的方法。所以,你阅读整个算法的工作原理,背后的数学知识、假设理...

【一起啃书】《机器学习》第五章 神经网络

文章目录 第五章 神经网络5.1 神经元模型5.2 感知机与多层网络5.3 误差逆传播算法5.4 全局最小与局部极小5.5 其他常见神经网络5.6 深度学习...

机器学习:04 Kaggle 信用卡欺诈

文章目录前期准备目标数据集介绍建模思路场景分析数据预处理导入库加载数据数据分析正负样本分布信用卡正常与被盗刷用户分析是否欺诈和交易金额关系分析消费和时间关系分析V1-...