大语言模型基础

大语言模型（Large Language Model, LLM）是 AI Agent 的核心引擎。理解 LLM 的工作原理，对于构建高效的 Agent 至关重要。

什么是大语言模型？

大语言模型是一种基于深度学习的人工智能模型，通过海量文本数据训练，能够理解和生成人类语言。

「大」指的是模型参数量巨大，通常达到数十亿甚至数万亿参数，这使模型具备强大的语言理解和推理能力。

LLM 处理文本的最小单位。一个汉字通常是 1-2 个 token，英文单词则根据长度可能被分成多个 token。

模型一次能处理的最大 token 数量。GPT-4 支持 128K tokens，Claude 支持 200K tokens。

控制输出的随机性。温度越高，输出越有创意但可能不稳定；温度越低，输出越确定和可预测。

将文本转换为向量表示，便于进行语义相似度计算，是 RAG（检索增强生成）的基础。

LLM 是 Agent 的「大脑」，但单独的 LLM 只能做文本生成。要让 LLM 变成真正能干活的 Agent，还需要：