Resources

Resources

这页不按时间倒序。
它只做一件事:把真正值得反复回看的入口资源集中在一起。

Book Series

Principles and Practice of Deep Representation Learning Buchanan 等 · 章节 PDF 索引
Deep Learning Goodfellow / Bengio / Courville · 官方 HTML 章节入口

Surveys and Foundations

Sentence-BERT

FoundationSentence Embedding

句向量真正走向实用的代表性起点,适合建立“单向量表示”直觉。

Open resource

SimCSE

Contrastive LearningText Embedding

用非常简洁的对比学习方法推动句向量训练,适合看训练目标如何改变表征空间。

Open resource

DPR

Dense RetrievalOpen-domain QA

双塔检索进入主流的关键工作之一,适合建立 retrieval 视角。

Open resource

Retrieval and Interaction

ColBERT

Late InteractionRetrieval

如果你想理解为什么单向量之外仍然有持续空间,这篇几乎绕不开。

Open resource

BEIR

BenchmarkZero-shot IR

帮助区分“模型在单一数据集上更高分”和“模型在异构检索场景里更稳”。

Open resource

MTEB

BenchmarkEvaluation

把 embedding 评测从少数任务扩到更完整任务集合,是理解“通用 embedding”最好的入口之一。

Open resource

Recent and Practical Directions

E5

General-purposeRetrieval

很适合观察统一训练数据、任务提示和零样本检索之间的关系。

Open resource

MAR Reading Note

Internal NoteAsymmetric Retrieval

站内一篇已经成形的非对称检索笔记,适合作为“研究型笔记”的示例页。

Open note

Notes Stream

InternalIncremental Updates

如果你想看最近新增的内容,而不是按专题浏览,可以直接进入时间流。

Open notes stream

如何使用这页 阅读顺序建议
  • 想快速入门:先看 Sentence-BERT、DPR、MTEB。
  • 想理解检索系统结构:继续看 ColBERT、BEIR、MAR。
  • 想关注更实用的统一 embedding:再看 E5 以及后续效率问题。