Trends
Trends
这页不是“最新论文清单”,而是记录当前研究正在往哪里移动。
1. Embedding efficiency 正在从工程问题变成研究问题
过去很多工作默认在线成本不是主要限制。
现在情况不同了:RAG、企业检索、知识库问答都要求低延迟、高吞吐、可缓存的表示层。
因此,量化、低维表示、MRL、蒸馏和 ANN 协同不再只是部署附录,而是模型设计的一部分。
2. Dense embedding 不再是唯一答案
单向量检索仍然重要,但越来越多工作在探索:
- token-level late interaction
- hybrid sparse + dense retrieval
- reranker / retriever 协同
- query-side light, document-side heavy 的非对称路径
这意味着后续研究不会只问“向量是不是更好”,而会问“在什么约束下它更合适”。
3. Evaluation 正在成为瓶颈
MTEB 和 BEIR 提醒我们一件事:
一个 embedding 模型在单个任务上更强,不代表它在更广泛场景中更稳。
后续真正重要的问题是:
- 评测是否覆盖真实检索任务?
- 是否覆盖不同语言、长度和领域?
- 榜单增益是否能转化为系统收益?
4. Domain-specific embedding 仍有很大空间
医学、法律、代码、企业文档等场景都表明:
- 通用模型的零样本能力并不总是足够。
- 领域数据、任务格式和负样本构造会显著影响效果。
- 但领域模型也会带来更重的部署和维护成本。
这类权衡会长期存在,不会因为更大的基础模型出现而消失。
5. 我接下来会重点跟踪的主题
- Asymmetric retrieval
- Efficient embedding for RAG
- Benchmark 与真实系统收益之间的关系
- 长文档与任务感知 embedding