一、神经网络的定义
神经网络(Neural Network)是一种受生物大脑神经元结构启发的机器学习模型,由多层相互连接的“神经元”组成,能够通过数据自动学习复杂的模式和关系。它通过调整神经元之间的连接权重(参数)来优化预测或分类任务,广泛应用于图像识别、自然语言处理等领域。
通俗理解
你可以把神经网络想象成一个“多级信息加工厂”:输入数据(比如一张猫的图片)经过层层“车间”(神经元层),每一层提取不同特征(如边缘→花纹→猫耳朵),最终输出结果(“这是猫!”)。训练过程就是不断纠正错误,让工厂越来越精准。
1. 神经网络的发展历程
起源:算法试图模仿大脑的工作原理。
早期应用:20世纪80年代至90年代初被使用,但在90年代末逐渐失去关注。
复兴:约从2005年开始重新兴起。
应用演进:列举了其应用领域的扩展方向,如语音→图像→文本(自然语言处理/NLP)等。
2. 神经元的结构与信号传递(生物神经元图解)
输入部分(inputs):
列出了生物神经元的结构,包括细胞体(cell body)、细胞核(nucleus)、轴突(axon)和树突(dendrites)。
输出部分(outputs):
指向另一个神经元(another neuron),下方附有一长串数字(如
2 → 0.7 → ...
),模拟神经信号传递的数值化表示。
3. 处理器性能与AI发展的关系
二、神经网络结构
1. 需求预测
核心问题:判断商品是否为「top seller」(是/否分类问题)。
使用函数:「sigmoid」函数:
公式形式为逻辑回归的变体,输入为价格(x),输出为成为「top seller」的概率(a)。
变量说明:
x 表示价格,输出 a 是概率值(0到1之间)。
① 神经网络结构
输入层:包含多个特征:
价格(price)
运费(shipping cost)
营销力度(marketing)
材料(material)
隐藏层:
标注为 "layer"(未明确层数),提到「可包含多个神经元」(can have multiple neurons)。
激活值(activations)被特别强调,可能是ReLU、sigmoid等函数的结果。激活值有三个,或许将输入层的4个特征转成3个特征(分别是“支付能力(affordability)”,“市场认知度(awareness)”,“感知质量(perceived quality)”)
可能就是第一个神经元里面是price和marketing结合
输出层:
生成一个概率值(probability of being a top seller),对应「1 number」。
② 数据维度提示
图中标注了各层可能的输出维度:
隐藏层激活值:4个数字 → 3个数字(可能表示两层隐藏层,神经元数量递减)。
输出层:1个数字(最终概率)。
③ 把特征看成向量
④ 多个隐藏层(多层感知机)
结构组成:
输入层(input)
多个隐藏层(1st hidden layer, 2nd hidden layer, 3rd hidden layer)
输出层(output layer)
连接方式:
展示了从输入到输出的单向流动(x →)
隐藏层数量最多到第三层
2. 人脸识别
① 图像处理
这是一张 1000×1000 像素的图像,其中每一个像素表示的是该像素点的特征。首先是对该图像展开,形成一个 1,000,000
个特征到输入层
② 神经网络结构
输入层:包含
1,000,000
个特征:隐藏层:
第一个隐藏层:处理边缘、纹理等低级特征(如卷积核检测到的线条)
第二个隐藏层:处理五官结构等语义特征(如眼睛、鼻子的空间组合)
第三个隐藏层:处理面部特征
输出层:
生成一个人名(probability of being person 'XYZ')。
3. 汽车分类
这个与人脸识别也是同样的原理