Learn Beyond Limits

Error metrics for skewed datasets|倾斜数据集的误差指标

一、概述 在机器学习的应用中,特别是在医疗诊断领域,准确评估分类模型的性能至关重要。然而,当面对罕见疾病的分类问题时,传统的性能评估指标,如总体准确率,可能无法充分反映模型在识别稀有事件方面的能力。这是因为在罕见疾病的背景下,数据集往往高度不平衡,即负类(无疾病)的样本数量远远超过正类(有疾病)的样

bolin bolin 发布于 2025-07-26

Fairness, bias, and ethics|公平,偏见与伦理

一、机器学习中的公平性、偏见与伦理挑战 在当今数字化时代,机器学习技术正以惊人的速度改变着我们的生活和工作方式。从个性化推荐系统到医疗诊断工具,再到金融风险评估模型,机器学习的应用无处不在。然而,随着其广泛应用,一些关键问题也逐渐浮出水面,其中最为突出的便是公平性、偏见以及伦理问题。这些问题不仅关乎

bolin bolin 发布于 2025-07-25

Full cycle of a machine learning project|机器学习项目的完整周期

一、机器学习项目完整周期 1. 定义项目(Scope project)

bolin bolin 发布于 2025-07-24

Transfer Learning|迁移学习

一、迁移学习的定义 迁移学习(Transfer Learning)是一种机器学习方法,它通过将一个预训练模型在源任务上学习到的知识迁移到目标任务上,从而提高目标任务的学习效率和性能。 通俗理解: 就像我们人类在学习新技能时会利用已有的经验一样,迁

bolin bolin 发布于 2025-07-23

Adding Data|添加数据

一、数据增强的定义 数据增强是一种机器学习技术,它通过对原始数据进行变换(如旋转、缩放、裁剪等)来生成新的训练样本。这样做可以增加训练数据的多样性,帮助模型更好地学习和泛化。 通俗理解: 就像通过给厨师提供不同形状和大小的食材来训练他们识别食材,数据增强帮助模型在面对不同变化时仍

bolin bolin 发布于 2025-07-22

Error analysis|错误分析

一、错误分析的定义 错误分析是一种用于识别和理解机器学习模型预测错误的技术。它涉及手动检查模型错误分类的样本,并根据错误的性质对这些样本进行分类。 通俗理解: 错误分析类似于医生诊断病人,通过检查病人的症状(错误的预测)来找出病因(错误的类型),然后根据病因来制定治疗方案(改进模型)。

bolin bolin 发布于 2025-07-21

Iterative loop of ML development|机器学习的迭代发展

一、机器学习迭代发展过程 这张图片展示了机器学习(ML)开发的迭代循环过程。循环包括三个主要步骤: 选择架构(模型、数据等):确定模型类型和准备数据。

bolin bolin 发布于 2025-07-20

Bias / variance and neural networks|偏差/方差和神经网络

一、偏差与方差权衡 这幅图解释了偏差-方差权衡(bias-variance tradeoff)的概念。图中展示了三个不同复杂度的模型: 简单模型(Simple model):具有高偏差(High bias),表示模型过于简

bolin bolin 发布于 2025-07-18

Learning Curve|学习曲线

一、学习曲线的定义 学习曲线(Learning Curve)是一种用来衡量随着学习或练习的增加,完成某项任务所需时间和精力的变化趋势的图形。它通常呈现为随着学习时间的增加,效率逐渐提高,错误率逐渐降低的曲线形态。 通俗理解: 学习曲线就像我们学习

bolin bolin 发布于 2025-07-17

Baseline|基线

一、基线的定义 基线是项目、系统或过程中的一个初始参考点,用于衡量后续的变更或进展。它通常代表某个时间点的稳定状态,比如项目计划、软件版本或性能指标。 通俗理解: 就像盖房子前打下的地基线,后续所有施工都以此为准;或者像手机系统的“出厂设置”,之后装的软件或更新都可以对比这个原始状态来判断变化。 例

bolin bolin 发布于 2025-07-16