Learn Beyond Limits

Regression Trees|回归树

一、回归树的定义 回归树是一种用于解决回归问题的机器学习模型,它通过将特征空间划分为不同的区域,为每个区域分配一个预测值来实现对目标变量的预测。 通俗理解: 回归树就像是根据一系列问题(特征)把数据分到不同的“篮子”里,每个“篮子”都有一个对应的预测结果,当有新的

bolin bolin 发布于 2025-08-05

Continuous valued features|连续的有价值特征

一、连续特征的数据表示 图片展示了一个关于宠物(猫和狗)的数据集,其中包含了几个特征:耳朵形状(尖耳或垂耳)、脸型(圆形或非圆形)、胡须(有或无)、体重(以磅为单位)以及一个目标变量“是否为猫”(用1表示猫,0表示狗)。

bolin bolin 发布于 2025-08-04

One-hot encoding|独热编码

一、独热编码的定义 One-hot encoding(独热编码)是一种将分类变量转换为数值形式的编码方法。它通过为每个类

bolin bolin 发布于 2025-08-03

Information Gain|信息增益

一、信息增益的定义 信息增益(Information Gain)是机器学习中,特别是在构建决策树时,用来评估某个特征对分类结果贡献大小的一个指标。它基于信息论中的熵(Entropy)概念,熵是衡量数据集纯度或不确定性的量度。信息增益通过计算数据集在某个特征上的熵的减少量来确定该特征的价值。 通俗理解

bolin bolin 发布于 2025-07-31

Entropy|熵

一、熵的定义 熵是信息论中的一个概念,用于衡量信息的不确定性或混乱程度。在机器学习中,熵常用来评估数据集的纯度,即数据集中样本属于同一类别的程度。 通俗理解: 熵越高,表示数据越混乱,分类越困难;熵越低,数据越有序,分类越容易。 二、熵与样本纯度的关系

bolin bolin 发布于 2025-07-30

The learning process of Decision Tree Model|决策树模型学习过程

一、决策树模型:分类示例 这幅图片展示了一个决策树模型,用于区分动物是否为猫。在这个例子中,决策树使用耳朵形状、面部形状和胡须的存在与否来确定一个动物是否是猫。 以下是决策树的详细解释

bolin bolin 发布于 2025-07-29

Decision Tree Model|决策树模型

一、决策树模型的定义 决策树模型是一种经典的机器学习算法,它通过一系列的条件判断来对数据进行分类或回归预测。通俗来说,决策树模型就像是一张“问题树”,从根节点开始,通过回答一系列简单的问题,逐步向下分支,最终到达叶节点得出结论。 通俗理解:

bolin bolin 发布于 2025-07-28

F1 Score|F1指标

一、F1指标的定义 在机器学习和数据分析领域,F1指标是一个非常重要的评估工具。它通过综合考虑精确率(Precision)和召回率(Recall),来衡量分类模型的性能。精确率关注的是模型预测为正的样本中,实际为正的比例;而召回率则关注实际为正的样本中,被模型正确预测为正的比例。 通俗理解:

bolin bolin 发布于 2025-07-27

Error metrics for skewed datasets|倾斜数据集的误差指标

一、概述 在机器学习的应用中,特别是在医疗诊断领域,准确评估分类模型的性能至关重要。然而,当面对罕见疾病的分类问题时,传统的性能评估指标,如总体准确率,可能无法充分反映模型在识别稀有事件方面的能力。这是因为在罕见疾病的背景下,数据集往往高度不平衡,即负类(无疾病)的样本数量远远超过正类(有疾病)的样

bolin bolin 发布于 2025-07-26

Fairness, bias, and ethics|公平,偏见与伦理

一、机器学习中的公平性、偏见与伦理挑战 在当今数字化时代,机器学习技术正以惊人的速度改变着我们的生活和工作方式。从个性化推荐系统到医疗诊断工具,再到金融风险评估模型,机器学习的应用无处不在。然而,随着其广泛应用,一些关键问题也逐渐浮出水面,其中最为突出的便是公平性、偏见以及伦理问题。这些问题不仅关乎

bolin bolin 发布于 2025-07-25