一、监督学习的含义
监督学习是机器学习的一种类型,它通过已有的标注数据来训练模型,使其能够对未知数据进行预测或分类。所谓“监督”,就是在训练过程中,算法知道每条数据的“答案”(即标签),这就像老师在教学生题目并给出正确答案。
通俗理解:
就像你在做选择题,题干是“输入”,标准答案是“标签”;你做多了,自然会掌握规律,以后遇到类似题目就知道怎么选。
例子(一)
📨 1. Email → Spam? (0/1) → Spam Filtering
输入(X):电子邮件的内容、标题、发件人等。
输出(Y):这是垃圾邮件吗?用0表示“不是垃圾邮件”,1表示“是垃圾邮件”。
应用场景:垃圾邮件过滤系统。
监督学习类型:分类(Binary Classification)。
原理:你先提供很多邮件,每封都标明是不是垃圾,模型学会后,能自动判断新邮件是否是垃圾。
🔊 2. Audio → Text Transcripts → Speech Recognition
输入(X):人的语音(如说“你好”)。
输出(Y):语音对应的文字(比如“你好”)。
应用场景:语音识别,比如手机语音输入或 Siri。
监督学习类型:序列到序列(Sequence-to-Sequence)问题。
原理:训练时使用很多“语音 + 正确文字”对,模型学会从声音转换为文本。
🌐 3. English → Spanish → Machine Translation
输入(X):英文句子。
输出(Y):对应的西班牙语翻译。
应用场景:机器翻译,如 Google 翻译。
监督学习类型:序列到序列翻译任务。
原理:训练时输入英文和对应西语句子,模型学会语言转换规律。
📢 4. Ad, User Info → Click? (0/1) → Online Advertising
输入(X):广告内容 + 用户信息(如年龄、兴趣、历史点击等)。
输出(Y):用户是否会点击广告?0=不会,1=会。
应用场景:个性化广告推荐。
监督学习类型:分类(点击预测)。
原理:用大量“广告+用户”与“是否点击”对进行训练,预测未来广告点击概率。
🚗 5. Image, Radar Info → Position of Other Cars → Self-driving Car
输入(X):来自摄像头、雷达的图像和传感器信息。
输出(Y):其他车辆的位置(比如坐标)。
应用场景:自动驾驶汽车。
监督学习类型:回归或目标检测。
原理:通过标注图像中汽车的位置,训练模型识别并定位其他车辆。
例子(二):回归(Regression)
🌟 图解说明
1. 标题:
Regression: Housing price prediction
“回归:房价预测”
2. 坐标轴:
横轴(X轴):房子的面积,单位是平方英尺(feet²)。
纵轴(Y轴):房子的价格,单位是千美元($1000’s),比如 200 就代表 200,000 美元。
🏠 输入与输出(监督学习的核心)
输入 X:房子的大小,比如图中标注的 750 平方英尺。
输出 Y:房子的售价,比如 150K 或 200K 美元。
图中红色的 ❌ 是真实的数据点(训练样本),表示训练集中给定的“输入→输出”对应关系。
📈 两条曲线表示模型
直线:线性回归模型。假设房价与面积是线性关系(价格随着面积均匀增长)。
曲线:非线性回归模型,更加灵活,能更准确拟合复杂的数据趋势。
🎯 预测示例说明
当房屋面积为 750 平方英尺时,两种模型预测的价格不一样:
蓝色线性模型预测约 150K。
紫色非线性模型预测约 200K。
这说明不同的回归模型会对同一输入得出不同的预测结果。
✅ 这体现了什么是监督学习?
我们拥有一批带标签的数据(如面积和对应的房价)来训练模型。
模型学会了如何从 输入(面积)→输出(房价)。
学好了之后,可以对新的输入数据(比如 750 平方英尺)进行预测。
例子(三):分类(Classification)
🖼️ 图解说明
1. 标题:
Classification:Breast cancer detection
“分类:乳腺癌检测”
2. 坐标轴:
横轴: 肿瘤的直径(Diameter),单位是 cm,范围从 0 到 10 cm。
每个图形代表一个肿瘤样本:
🔵 蓝色圆圈:良性肿瘤(benign)
🔺 黄色三角:恶性肿瘤 Type 2(malignant type 2)
❌ 红色叉:恶性肿瘤 Type 1(malignant type 1)
这些都是我们用来训练模型的数据(有特征和标签)。
🧩 监督学习元素一一对应
🧠 模型学习类别
模型要学习如何根据肿瘤的大小来预测它的类别:
比如:
输入
直径 = 3.5cm
→ 预测为benign
输入
直径 = 6.7cm
→ 预测为malignant type 2
例子(四):分类(多特征)
🖼️ 图解说明
1. 标题:
Classification:Breast cancer detection(Two or more inputs)
“分类:乳腺癌检测(多特征输入)”
2. 坐标轴:
横轴(x 轴):Tumor size(肿瘤大小)
纵轴(y 轴):Age(患者年龄)
每一个点代表一个病人,具有两个输入特征(年龄 + 肿瘤大小),输出是类别:
🧩 监督学习要素一一对应
🧠 模型展示目的
模型要找出一条分界线(图中粉红色的那条曲线),使得:
左下区域(肿瘤小 + 年龄偏低)→ 更可能是 良性
右上区域(肿瘤大 + 年龄偏高)→ 更可能是 恶性
二、监督学习的两种主要类型
🔵 Regression(回归)
📌 定义
回归任务是预测一个连续的数值型输出。
📊 举例
输入一个人的年龄、身高、体重 → 预测他的血压值
输入过去房价趋势、位置、面积 → 预测房屋价格
输入一辆车的行驶公里数、品牌 → 预测二手车价值
🧮 特征
✅ 总结关键词
Predict a number
Infinitely many possible outputs
🟣 Classification(分类)
📌 定义
分类任务是预测一个离散的类别标签(也就是判断样本属于哪一类)。
📊 举例
输入一个肿瘤的大小、形状 → 预测是良性(benign)还是恶性(malignant)
输入一段邮件文本 → 预测是否是垃圾邮件
输入图像像素 → 预测图中是猫、狗还是人
🧮 特征
✅ 总结关键词
Predict categories
Small number of possible outputs