Supervised Learning|监督学习

bolin
发布于 2025-06-11 / 7 阅读
0
0

Supervised Learning|监督学习

一、监督学习的含义

监督学习是机器学习的一种类型,它通过已有的标注数据来训练模型,使其能够对未知数据进行预测或分类。所谓“监督”,就是在训练过程中,算法知道每条数据的“答案”(即标签),这就像老师在教学生题目并给出正确答案。

通俗理解:

  • 就像你在做选择题,题干是“输入”,标准答案是“标签”;你做多了,自然会掌握规律,以后遇到类似题目就知道怎么选。

监督学习(图1).png


例子(一)

监督学习(图2).png

📨 1. Email → Spam? (0/1) → Spam Filtering

  • 输入(X):电子邮件的内容、标题、发件人等。

  • 输出(Y):这是垃圾邮件吗?用0表示“不是垃圾邮件”,1表示“是垃圾邮件”。

  • 应用场景:垃圾邮件过滤系统。

  • 监督学习类型分类(Binary Classification)。

  • 原理:你先提供很多邮件,每封都标明是不是垃圾,模型学会后,能自动判断新邮件是否是垃圾。


🔊 2. Audio → Text Transcripts → Speech Recognition

  • 输入(X):人的语音(如说“你好”)。

  • 输出(Y):语音对应的文字(比如“你好”)。

  • 应用场景:语音识别,比如手机语音输入或 Siri。

  • 监督学习类型序列到序列(Sequence-to-Sequence)问题。

  • 原理:训练时使用很多“语音 + 正确文字”对,模型学会从声音转换为文本。


🌐 3. English → Spanish → Machine Translation

  • 输入(X):英文句子。

  • 输出(Y):对应的西班牙语翻译。

  • 应用场景:机器翻译,如 Google 翻译。

  • 监督学习类型序列到序列翻译任务。

  • 原理:训练时输入英文和对应西语句子,模型学会语言转换规律。


📢 4. Ad, User Info → Click? (0/1) → Online Advertising

  • 输入(X):广告内容 + 用户信息(如年龄、兴趣、历史点击等)。

  • 输出(Y):用户是否会点击广告?0=不会,1=会。

  • 应用场景:个性化广告推荐。

  • 监督学习类型分类(点击预测)。

  • 原理:用大量“广告+用户”与“是否点击”对进行训练,预测未来广告点击概率。


🚗 5. Image, Radar Info → Position of Other Cars → Self-driving Car

  • 输入(X):来自摄像头、雷达的图像和传感器信息。

  • 输出(Y):其他车辆的位置(比如坐标)。

  • 应用场景:自动驾驶汽车。

  • 监督学习类型回归目标检测

  • 原理:通过标注图像中汽车的位置,训练模型识别并定位其他车辆。


例子(二):回归(Regression)

监督学习(图3).png

🌟 图解说明

1. 标题:

Regression: Housing price prediction
“回归:房价预测”

2. 坐标轴:

  • 横轴(X轴):房子的面积,单位是平方英尺(feet²)。

  • 纵轴(Y轴):房子的价格,单位是千美元($1000’s),比如 200 就代表 200,000 美元。


🏠 输入与输出(监督学习的核心)

  • 输入 X:房子的大小,比如图中标注的 750 平方英尺。

  • 输出 Y:房子的售价,比如 150K 或 200K 美元。

  • 图中红色的 ❌ 是真实的数据点(训练样本),表示训练集中给定的“输入→输出”对应关系。


📈 两条曲线表示模型

  • 直线:线性回归模型。假设房价与面积是线性关系(价格随着面积均匀增长)。

  • 曲线:非线性回归模型,更加灵活,能更准确拟合复杂的数据趋势。


🎯 预测示例说明

  • 当房屋面积为 750 平方英尺时,两种模型预测的价格不一样:

    • 蓝色线性模型预测约 150K

    • 紫色非线性模型预测约 200K

这说明不同的回归模型会对同一输入得出不同的预测结果。


✅ 这体现了什么是监督学习?

  • 我们拥有一批带标签的数据(如面积和对应的房价)来训练模型

  • 模型学会了如何从 输入(面积)→输出(房价)

  • 学好了之后,可以对新的输入数据(比如 750 平方英尺)进行预测。


例子(三):分类(Classification)

监督学习(图4).png🖼️ 图解说明

1. 标题:

Classification:Breast cancer detection
“分类:乳腺癌检测”

2. 坐标轴:

  • 横轴: 肿瘤的直径(Diameter),单位是 cm,范围从 0 到 10 cm

  • 每个图形代表一个肿瘤样本:

    • 🔵 蓝色圆圈:良性肿瘤(benign

    • 🔺 黄色三角:恶性肿瘤 Type 2(malignant type 2

    • ❌ 红色叉:恶性肿瘤 Type 1(malignant type 1

这些都是我们用来训练模型的数据(有特征标签)。


🧩 监督学习元素一一对应

元素

图中的体现

输入特征

肿瘤的直径(比如一个肿瘤是 5.2 cm)

输出标签

类别标签(良性/恶性1型/恶性2型)

样本点

图中每个蓝圆、黄三角、红叉代表的就是一个训练样本

目标任务

学习一个模型:输入一个直径 → 输出对应的肿瘤类别


🧠 模型学习类别

模型要学习如何根据肿瘤的大小来预测它的类别

  • 比如:

    • 输入 直径 = 3.5cm → 预测为 benign

    • 输入 直径 = 6.7cm → 预测为 malignant type 2


例子(四):分类(多特征)

监督学习(图5).png

🖼️ 图解说明

1. 标题:

Classification:Breast cancer detection(Two or more inputs)
“分类:乳腺癌检测(多特征输入)”

2. 坐标轴:

  • 横轴(x 轴):Tumor size(肿瘤大小)

  • 纵轴(y 轴):Age(患者年龄)

每一个点代表一个病人,具有两个输入特征(年龄 + 肿瘤大小),输出是类别:

图形

含义

🔵 蓝圆

良性(benign)

❌ 红叉

恶性(malignant)


🧩 监督学习要素一一对应

元素

图中体现

输入特征

AgeTumor size,每个病人对应一个二维坐标点

输出标签

类别标签(良性 or 恶性)

训练样本

图中的所有点(有两个输入 + 一个输出)

目标任务

学习一个分类边界,能把不同类别“尽可能”分开


🧠 模型展示目的

模型要找出一条分界线(图中粉红色的那条曲线),使得:

  • 左下区域(肿瘤小 + 年龄偏低)→ 更可能是 良性

  • 右上区域(肿瘤大 + 年龄偏高)→ 更可能是 恶性


二、监督学习的两种主要类型

监督学习(图6).png

🔵 Regression(回归)

📌 定义

回归任务是预测一个连续的数值型输出

📊 举例

  • 输入一个人的年龄、身高、体重 → 预测他的血压值

  • 输入过去房价趋势、位置、面积 → 预测房屋价格

  • 输入一辆车的行驶公里数、品牌 → 预测二手车价值

🧮 特征

特征

描述

输出类型

实数(continuous real number)

输出空间

无限多可能值(infinitely many outputs)

常用模型

线性回归、SVR、神经网络等


总结关键词

  • Predict a number

  • Infinitely many possible outputs


🟣 Classification(分类)

📌 定义

分类任务是预测一个离散的类别标签(也就是判断样本属于哪一类)。

📊 举例

  • 输入一个肿瘤的大小、形状 → 预测是良性(benign)还是恶性(malignant)

  • 输入一段邮件文本 → 预测是否是垃圾邮件

  • 输入图像像素 → 预测图中是猫、狗还是人

🧮 特征

特征

描述

输出类型

类别标签(例如 A/B/C)

输出空间

少量可能值(如2类、3类、10类等)

常用模型

Logistic回归、决策树、SVM、神经网络


✅ 总结关键词

  • Predict categories

  • Small number of possible outputs


三、回归和分类的区别

🧠 定义区别

类型

回归(Regression)

分类(Classification)

定义

预测一个连续数值的任务

预测一个离散类别标签的任务

目标

输出一个具体的数,如温度、价格、概率

输出所属类别,如良性/恶性、猫/狗

📦 输出形式区别

项目

回归

分类

输出值

任意实数(∞个可能值)

有限类别(如2类/3类/n类)

举例

预测房价:$123,456

判断邮件是否垃圾邮件:是/否

举例(医学)

年龄+肿瘤尺寸 → 恶性概率为 0.91

年龄+肿瘤尺寸 → 属于“恶性”


评论