Trends

这页不是“最新论文清单”，而是记录当前研究正在往哪里移动。

1. Embedding efficiency 正在从工程问题变成研究问题

过去很多工作默认在线成本不是主要限制。
现在情况不同了：RAG、企业检索、知识库问答都要求低延迟、高吞吐、可缓存的表示层。

因此，量化、低维表示、MRL、蒸馏和 ANN 协同不再只是部署附录，而是模型设计的一部分。

单向量检索仍然重要，但越来越多工作在探索：

这意味着后续研究不会只问“向量是不是更好”，而会问“在什么约束下它更合适”。

MTEB 和 BEIR 提醒我们一件事：
一个 embedding 模型在单个任务上更强，不代表它在更广泛场景中更稳。

后续真正重要的问题是：

医学、法律、代码、企业文档等场景都表明：

这类权衡会长期存在，不会因为更大的基础模型出现而消失。

如果你想看结构化入口，回到 Topics；如果想看正在写的内容，去 Notes。