分类: 学习笔记 - Embedding Research Hub

2025-10-08发表2026-04-14更新学习笔记1 分钟读完 (大约202个字)

大语言模型（阅读笔记1）

第一章引言

1.1 语言模型的发展历程

语言模型的发展大致分为四个阶段：统计语言模型解决了最初的词序预测问题，但受限于稀疏性与维度灾难；神经语言模型引入词嵌入，改进语义表征；预训练模型（如 BERT、GPT-1）借助大规模无监督学习与微调，提升了上下文理解；最终演进到大语言模型（如 GPT-3/4），通过规模扩展展现出“涌现能力”。
这里最关键的转折点是 Transformer 的提出，它既解决了长程依赖问题，又适配了并行计算，为后续 LLM 奠定了基础。

1.2 大语言模型的能力特点