机器学习算法：决策树算法api

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

学习目标

知道决策树算法api的具体使用

class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)

criterion

特征选择标准
"gini"或者"entropy"，前者代表基尼系数，后者代表信息增益。一默认"gini"，即CART算法。

min_samples_split

内部节点再划分所需最小样本数
这个值限制了子树继续划分的条件，如果某节点的样本数少于min_samples_split，则不会继续再尝试选择最优特征来进行划分。默认是2.如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。我之前的一个项目例子，有大概10万样本，建立决策树时，我选择了min_samples_split=10。可以作为参考。

min_samples_leaf

叶子节点最少样本数
这个值限制了叶子节点最少的样本数，如果某叶子节点数目小于样本数，则会和兄弟节点一起被剪枝。默认是1,可以输入最少的样本数的整数，或者最少样本数占样本总数的百分比。如果样本量不大，不需要管这个值。如果样本量数量级非常大，则推荐增大这个值。之前的10万样本项目使用min_samples_leaf的值为5，仅供参考。

max_depth

决策树最大深度
决策树的最大深度，默认可以不输入，如果不输入的话，决策树在建立子树的时候不会限制子树的深度。一般来说，数据少或者特征少的时候可以不管这个值。如果模型样本量多，特征也多的情况下，推荐限制这个最大深度，具体的取值取决于数据的分布。常用的可以取值10-100之间

random_state

随机数种子

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

标签: 机器学习

返回列表

上一篇：[Typescript]基础篇之声明

下一篇：Web APIs DOM- 事件委托 +综合案例

“机器学习算法：决策树算法api” 的相关文章

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（23）：常数项级数的概念和性质（补充知识）1年前 (2023-02-02)

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（9）：正交补与投影定理1年前 (2023-02-02)

【机器学习｜数学基础】Mathematics for Machine Learning系列之线性代数（12）：向量组的秩1年前 (2023-02-02)

AI机器学习时序序列特征提取实现分类预测实战1年前 (2023-02-02)

机器学习知识总结 —— 19.朴素贝叶斯网络1年前 (2023-02-02)

机器学习【西瓜书/南瓜书】--- 第四章决策树1年前 (2023-02-02)

【机器学习】逻辑回归（实战）1年前 (2023-02-02)

零基础机器学习做游戏辅助第八课--使用预训练模型做迁移学习1年前 (2023-02-02)

机器学习模型的评价指标1年前 (2023-02-02)

机器学习中的数学原理——线性不可分1年前 (2023-02-03)