Learn Beyond Limits

Collaborative Filtering Algorithm|协同过滤算法

一、协同过滤算法简介 协同过滤算法是一种常见的推荐系统方法,它的核心思想是“物以类聚,人以群分”。也就是说,如果两个用户在过去对某些物品的兴趣相似,那么他们对其他物品的兴趣也很可能相似。换句话说,用户的行为和偏好可以相互参考。 通俗理解: 就像你会向朋友请教电影推荐:如果你和朋友过去喜欢的电影很接近

bolin bolin 发布于 2025-08-23

Using per-item Features|使用每项特征

一、用户—电影评分矩阵 在推荐系统中,最常见的任务就是预测用户对物品(这里是电影)的

bolin bolin 发布于 2025-08-22

Choosing what features to use|选择要使用的特征

一、概括 这篇文章主要围绕如何根据数据分布选择合适的特征展开。通过直方图和分布曲线对比,展示了非高斯分布的数据在经过对数、平方根、幂次等数学变换后,能够更接近高斯分布,从而提升模型的表现。文章强调了理解数据特征分布的重要性,并介绍了常见的特征变换方法,为构建更稳健的机器学习模型提供思路。 二、非高斯

bolin bolin 发布于 2025-08-21
bolin bolin 发布于 2025-08-20

Density Estimation in Anomaly Detection|异常检测中的密度估计

一、密度估计 图中说明了对多维特征向量进行密度估计的设定与公式。 训练集:{x(1),x(2),…,x(m)},每个样本 xi 有 n 个特征。右侧用列向量表示样本 xx由各维特征组成(x

bolin bolin 发布于 2025-08-18

Normal Distribution|正态分布

一、正态分布的定义 正态分布(Normal Distribution),又称高斯分布(Gaussian Distribution),是统计学和概率论中最经典、最重要的一种分布形式。它的曲线形状呈对称的钟形,中间高、两边低,且以均值为中心对称展开,数据大多集中在均值附近,越往两端越稀少。正态分布由均值

bolin bolin 发布于 2025-08-17

Anomaly Detection|异常检测

一、异常检测的定义 异常检测(Anomaly Detection)是一种数据分析技术,它通过分析数据集中的模式和行为,识别出那些与正常模式显著不同的观测值或事件。在实际应用中,它就像是一个敏锐的“守门人”,时刻监视着数据流,寻找那些“不按套路出牌”的数据点。 通俗理解:

bolin bolin 发布于 2025-08-16

Initializing K-means|初始化K-means

一、K-means 初始化的定义 K-means 的初始化是指在算法开始时,随机选择 KK 个数据点作为初始聚类中心。之后,算法会不断迭代,逐步调整这些中心的位置。

bolin bolin 发布于 2025-08-13