Learn Beyond Limits

固定窗口神经语言模型|A fixed-window neural Language Model

第一节:语言模型任务回顾 在深入研究复杂的神经网络架构之前,我们首先需要明确:什么是语言模型(Language Modeling)? 简单来说,语言模型的目标是预测序列中下一个出现的词。假设我们已经有了一个单词序列 x(1), x(2), ... , x(t),模型的核心任务就是计算在给定这些已知词

bolin bolin 发布于 2026-03-09

n-gram语言模型|n-gram Language Model

第一节:什么是语言模型? 在自然语言处理(NLP)的广阔领域中,语言模型(Language Modeling) 是最基础且最重要的核心任务之一。简单来说,它的目标是让计算机能够理解和生成人类的语言序列。 1. 核心任务:预测下一个词 语言模型的核心任务非常直观:给定一段已经出现的词序列,预测下一个可

bolin bolin 发布于 2026-03-06

优化器|Optimizer

第一节:绪论——优化算法在神经网络训练中的核心地位 在深度学习的范畴内,模型训练的本质是一个在大规模参数空间内寻找最优解的非凸优化问题。优化器(Optimizer)作为连接模型架构与数据特征的桥梁,其核心任务是通过计算损失函数 L 对模型参数 θ 的梯度,利用特定的更新规则使目标函数最小化。

bolin bolin 发布于 2026-03-03

Dropout

一、 引言:深度神经网络中的过拟合风险与正则化策略 在深度学习领域,模型的泛化能力(Generalization Ability)是衡量算法优劣的核心指标。随着网络深度的增加和参数量(Capacity)的指数级增长,深度神经网络展现出了极强的函数拟合能力。然而,这种强大的表达能力往往是一把双刃剑:当

bolin bolin 发布于 2026-03-01

依存句法分析|Dependency Parsing

第一节:句式结构的两种视野 在自然语言处理中,理解一个句子不仅仅是识别每个词的意思,更重要的是理解这些词是如何组合在一起表达完整语义的。目前主流的句法分析主要有两种视角:成分句法分析和依存句法分析。 1. 成分句法分析 (Constituency Parsing) 成分句法分析又被称为短语结构语法(

bolin bolin 发布于 2026-01-10

Types of Attributes|属性类型

一、引言 在数据挖掘与机器学习中,“属性(Attribute)”是描述数据对象的最小信息单元。无论是构建模型、分析数据分布,还是进行特征工程,所有步骤都离不开对属性类型的理解。一个模型是否能够正确地处理某些特征,很大程度上取决于我们是否正确识别了属性的类型。 在实际的数据集中,属性并不是单一形式出现

bolin bolin 发布于 2025-09-23

Clustering vs Classification|聚类vs分类

一、引言 在机器学习的广阔体系中,分类(Classification)与聚类(Clustering)是两种看似相似但本质不同的任务。二者都涉及对数据进行分组或划分,但在学习方式、目标与所需信息上存在根本差异。 分类是一种有监督学习(Supervised Learning)

bolin bolin 发布于 2025-09-22

Regression vs. Classification|回归vs分类

一、引言 在数据挖掘与机器学习领域中,预测建模(Predictive Modeling) 是最核心的任务之一。它的目标是利用历史数据,建立数学模型,对未知或未来的结果进行预测。而在预测建模的范畴下,最常见的两类问题便是——回归(Regression)与分类(Classification)。

bolin bolin 发布于 2025-09-21

Algorithm Refinement: ε-Greedy Policy|算法改进:ε-贪婪策略

一、为什么需要探索 在强化学习的训练过程中,智能体需要不断地与环境交互, 通过观察状态、采取动作、获得奖励,逐渐学会什么是“好”的决策。 但这里有一个核心问题: 如果智能体总是选择当前看起来最优的动作,会怎样? 它可能会陷入局部最优—— 也就是说,它学到的策略在局部区域看起来很好, 但在整个任务范围

bolin bolin 发布于 2025-09-10