为什么你用的 AI 都在“聊天”,而不是“续写”?
什么是 Chat Completions、Responses?接口规范到底有几种?
看完这篇,你也能和开发者聊上几句行话。
前言
最近有位刚入行的小伙伴拿着两句话来问我:
- 现代大部分模型都是走 chat completions 的模式,不是文本 completions
- 现在比较常见的接口规范是 OpenAI 的 ChatCompletions 和 Completions、OpenAI 的 Responses,以及 Anthropic 的 ChatCompletions 三种
他说每个字都认识,但连起来就不知道在说什么。
如果你也有同感,别急,这篇文章就用纯大白话,把这两句话掰开揉碎讲清楚。全程不写一行代码,保证你读完就能拿去跟同事吹牛。
一、先搞懂两个“补全”是啥
1. 文本补全(Completions):最原始的“接话”模式
你可以把文本补全想象成完形填空或者一句话接龙。
你给模型一个开头,比如:
“今天天气真好,适合去”
模型会根据它学过的海量文本,直接续写后面的内容:
“公园散步,顺便买个冰淇淋。”
特点非常明显:
- 一问一答,说完就忘 —— 它不记得你上一句说了什么,每次对话都是独立事件。
- 没有身份区分 —— 你说的和模型说的混在一起,它分不清谁是用户、谁是机器人。
- 适合单次任务 —— 比如生成文案、写邮件、翻译一句话,干完就结束。
早期的 GPT-3 就是通过这种 Text Completions 接口提供服务。开发者传一段文本进去,它吐一段文本出来,纯纯的“续写工具”。
2. 聊天补全(Chat Completions):有角色、有记忆的“对话”模式
聊天补全就高级多了,它更像是两个人在微信上聊天。
这里不光有文字,还有角色和历史记录。
通常一条消息会标明是谁说的:
- system:系统设定(给模型定人设,比如“你是一个幽默的助手”)
- user:用户说的话
- assistant:模型回复的内容
比如:
system: 你是一只傲娇的猫娘。
user: 今天吃什么?
assistant: 哼,本喵才不关心人类的午饭呢……不过,鱼罐头的话可以考虑一下。
它的核心好处:
- 多轮对话有记忆 —— 你前面说过“我养了一只猫”,后面它还能接“你家的猫多大了?”
- 角色控制精准 —— 能通过 system 消息约束模型的语气、身份和知识边界
- 更适合交互场景 —— 客服机器人、虚拟伴侣、智能助手全靠这种模式
OpenAI 推出 GPT-3.5-turbo 时,用的就是 Chat Completions 接口。自此,对话式 AI 正式成为绝对主流。
二、为什么现在都走 Chat Completions 模式?
第一句话“现代大部分模型都是走 chat completions 的模式,不是文本 completions”,说的就是这个趋势。
原因其实很好理解:
-
用户想要的是“助手”,不是“接话工具”
人们需要 AI 像人一样对话,能记住上下文,能理解意图,而不是每次都重新认识你。 -
多轮交互是刚需
你问“今天天气怎么样?”,然后直接说“那适合出门吗?”
Chat Completions 会明白“那”是指天气,文本补全则会一脸懵地胡说八道。 -
应用生态更统一
插件、工具调用、函数计算……这些高级功能都建立在“消息列表”这种结构化对话上。
文本补全是纯字符串,很难塞进工具调用这样的复杂逻辑。
所以,不管是 ChatGPT、文心一言、通义千问,还是 Claude,它们的底层 API 几乎都是基于聊天补全设计的,哪怕你只发一句话,它内部也是按“一条 user 消息”来处理的。
三、主流接口规范,到底有哪几种?
第二句话提到三种接口规范,我们一个个来认脸。
① OpenAI 的 Completions 和 ChatCompletions
这是 OpenAI 历史上提供的两套接口,算是“爷爷”和“爸爸”的关系。
- Completions:就是前面说的文本补全,早年用来直接续写文本,现在已经逐步退役,很多新模型不再支持它。
- ChatCompletions:当前的当家花旦,几乎所有的 OpenAI 模型都通过这个接口提供服务。
采用“消息数组”的形式,每条消息包含 role 和 content,完美支撑多轮对话。
虽然第一句话里把“ChatCompletions 和 Completions”放在一起说,但你可以这么理解:它们是同一公司的两代产品,如今 ChatCompletions 一统天下,Completions 已基本是历史名词。
② OpenAI 的 Responses —— 新上任的“统一接口”
2025 年初,OpenAI 又搞了个大新闻,推出了 Responses API。
这玩意儿可以看作是 ChatCompletions 的升级版,目标是一个接口搞定所有交互。
它把聊天、调用工具、网页搜索、生成结构化数据等功能全部揉合在一起,开发者不用再在聊天接口和补全接口之间切来切去。
你可以理解为:以前你是打电话沟通(ChatCompletions),现在有了一个全能的协作面板(Responses),打电话、发文件、做表格全在这里完成。
这是 OpenAI 目前主推的新一代规范,未来很可能会成为新的标准。
③ Anthropic 的 ChatCompletions
Anthropic 的接口在官方文档里虽然叫 Messages API,但它的设计思路和 ChatCompletions 几乎一模一样:
- 也是用消息数组,区分 user 和 assistant 角色
- 也支持 system 提示词来塑造人格
- 也是多轮对话、有状态维护
所以业界常直接把它归到“Chat Completions 规范”这一大类里。
可以说,OpenAI 和 Anthropic 虽然是对手,但在接口设计的核心理念上已经“英雄所见略同”了。
四、一张图帮你理清关系
如果用一张表格来总结,会是这样:
| 接口规范 | 所属公司 | 模式 | 当前状态 |
|---|---|---|---|
| Completions | OpenAI | 文本补全 | 逐渐淘汰 |
| Chat Completions | OpenAI | 聊天补全 | 主流,稳如老狗 |
| Responses | OpenAI | 新一代统一接口 | 冉冉升起 |
| Messages(类ChatCompletions) | Anthropic | 聊天补全 | Claude 的标配 |
第二句话的意思就是: 现在搞大模型开发,你基本上只会跟这三种接口打交道。其他公司的 API,大多也是模仿这三套来的。
五、给非技术读者的终极总结
- “文本补全” 就像跟一个健忘的人玩成语接龙,说完就忘,只适合一次性的生成任务。
- “聊天补全” 就是带人设、带记忆的聊天,也是目前所有主流 AI 助手的运作方式。
- 接口规范这块,OpenAI 有三种演变(Completions → ChatCompletions → Responses),而 Anthropic 的接口也采用聊天补全的设计。
- 以后你只要看到“模型走 chat completions”,就可以优雅地点点头:“嗯,用的是带角色的多轮对话模式。”
希望这篇小文能帮你彻底搞懂这两句看似天书的话。如果身边还有朋友一脸茫然,不妨把这篇文章甩给他——毕竟,懂一点接口模式,也是你推开 AI 世界大门的重要一步。
1万+

被折叠的 条评论
为什么被折叠?



