一、引言

在现代推荐系统中，应用场景的规模往往非常庞大。比如：

在这样的大目录中，推荐系统需要在极短的时间内为用户找到最合适的内容。如果没有高效的方法，系统可能会陷入性能瓶颈：要么计算开销过大，要么推荐结果不够精准。

为了解决这一挑战，研究者和工程师们通常采用一种高效的思路：
👉 先缩小范围，再做精细化选择。

这意味着推荐系统不会直接在所有候选项目中逐一比较，而是通过一系列机制先快速筛选出一个较小的候选集，然后再进一步做更精确的排序和预测。这样既能保证推荐的效率，也能兼顾推荐的质量。

二、两步法：检索与排序

在面对千万级别的候选集合时，推荐系统通常采用 Retrieval（检索）+ Ranking（排序） 的两步策略。这种方法将大规模推荐问题拆解为两个阶段，从而在效率与效果之间取得平衡。

在检索阶段，系统的目标是从海量候选集中，快速生成一个较小的候选集（例如几百个项目），这些项目需要满足基本的相关性。
常见的方式包括：

这个阶段的重点是 覆盖广、召回快，确保不会错过潜在的高相关候选。

检索出来的候选集数量虽然已经减少，但仍然可能有几百甚至上千个项目。排序阶段的任务就是利用更加复杂和精确的模型，对这些候选进行打分和排名。

这个阶段注重的是 精准性和个性化，是决定最终推荐体验好坏的关键。

在大规模推荐系统中，检索和排序之间始终存在一个核心矛盾：

因此，需要根据业务目标来调整检索规模。

为了找到最佳平衡点，推荐系统通常会通过 离线实验 和 在线 A/B 测试 来评估不同检索规模的效果：

通过这样的实验，可以找到一个合适的 检索数量，既保证了推荐的相关性，又不至于让系统延迟过高。

在海量候选项目的背景下，推荐系统必须在效率与效果之间找到平衡。

最终，一个成熟的推荐系统往往需要结合 大规模检索 与 个性化排序，并不断迭代优化，才能在保持系统响应速度的同时，为用户提供真正精准且令人满意的推荐。