Neural Network|神经网络

bolin
发布于 2025-06-29 / 3 阅读
0
0

Neural Network|神经网络

一、神经网络的定义

神经网络(Neural Network)是一种受生物大脑神经元结构启发的机器学习模型,由多层相互连接的“神经元”组成,能够通过数据自动学习复杂的模式和关系。它通过调整神经元之间的连接权重(参数)来优化预测或分类任务,广泛应用于图像识别、自然语言处理等领域。

通俗理解

你可以把神经网络想象成一个“多级信息加工厂”:输入数据(比如一张猫的图片)经过层层“车间”(神经元层),每一层提取不同特征(如边缘→花纹→猫耳朵),最终输出结果(“这是猫!”)。训练过程就是不断纠正错误,让工厂越来越精准。


1. 神经网络的发展历程

F9855F78-CB79-468A-BDA5-B90F34F6E236.png

  1. 起源:算法试图模仿大脑的工作原理。

  2. 早期应用:20世纪80年代至90年代初被使用,但在90年代末逐渐失去关注。

  3. 复兴:约从2005年开始重新兴起。

  4. 应用演进:列举了其应用领域的扩展方向,如语音→图像→文本(自然语言处理/NLP)等。


2. 神经元的结构与信号传递(生物神经元图解)

FFAD4E59-B757-4312-8CE5-C5315D5FEB22.png

  1. 输入部分(inputs)

    • 列出了生物神经元的结构,包括细胞体(cell body)、细胞核(nucleus)、轴突(axon)和树突(dendrites)。

  2. 输出部分(outputs)

    • 指向另一个神经元(another neuron),下方附有一长串数字(如 2 → 0.7 → ...),模拟神经信号传递的数值化表示。


3. 处理器性能与AI发展的关系

37471082-04C0-4B01-92B7-5C60398E1FE9.png


二、神经网络结构

1. 需求预测

BE7F7DA8-D7E8-4DE3-857E-642016FB8940.png

  1. 核心问题:判断商品是否为「top seller」(是/否分类问题)。

  2. 使用函数:「sigmoid」函数:

    • 公式形式为逻辑回归的变体,输入为价格(x),输出为成为「top seller」的概率(a)。

  3. 变量说明

    • x 表示价格,输出 a 是概率值(0到1之间)。

F3AA8D03-A284-4830-B643-95D5781078C1.png

① 神经网络结构

  • 输入层:包含多个特征:

    • 价格(price)

    • 运费(shipping cost)

    • 营销力度(marketing)

    • 材料(material)

  • 隐藏层

    • 标注为 "layer"(未明确层数),提到「可包含多个神经元」(can have multiple neurons)。

    • 激活值(activations)被特别强调,可能是ReLU、sigmoid等函数的结果。激活值有三个,或许将输入层的4个特征转成3个特征(分别是“支付能力(affordability)”,“市场认知度(awareness)”,“感知质量(perceived quality)”

    • 可能就是第一个神经元里面是price和marketing结合

  • 输出层

    • 生成一个概率值(probability of being a top seller),对应「1 number」。

② 数据维度提示

  • 图中标注了各层可能的输出维度:

    • 隐藏层激活值:4个数字 → 3个数字(可能表示两层隐藏层,神经元数量递减)。

    • 输出层:1个数字(最终概率)。

③ 把特征看成向量

DE5BE46B-AD36-4AEF-AC8D-67FD567F12B4.png

④ 多个隐藏层(多层感知机)

C3BE2679-30C8-4433-9551-CD3E38D414DC.png

  1. 结构组成

    • 输入层(input)

    • 多个隐藏层(1st hidden layer, 2nd hidden layer, 3rd hidden layer)

    • 输出层(output layer)

  2. 连接方式

    • 展示了从输入到输出的单向流动(x →)

    • 隐藏层数量最多到第三层


2. 人脸识别

83D27559-64CB-4841-953F-AD6F4A29D85F.png

88858C8E-F093-4E38-8CE8-2AFFB1BFC37E.png

① 图像处理

这是一张 1000×1000 像素的图像,其中每一个像素表示的是该像素点的特征。首先是对该图像展开,形成一个 1,000,000 个特征到输入层

② 神经网络结构

  • 输入层:包含1,000,000个特征:

  • 隐藏层

    • 第一个隐藏层:处理边缘、纹理等低级特征(如卷积核检测到的线条)

    • 第二个隐藏层:处理五官结构等语义特征(如眼睛、鼻子的空间组合)

    • 第三个隐藏层:处理面部特征

  • 输出层

    • 生成一个人名(probability of being person 'XYZ')。


3. 汽车分类

6F67D0A0-E0E4-4586-BD81-54662659866C.png

这个与人脸识别也是同样的原理


评论