模型（Models）

概览 Overview

OpenAI API是由多种具有不同能力和价格的模型驱动的。您还可以通过微调我们的原始基础模型，针对您的特定用例进行有限的自定义。

模型	描述
GPT-4 限量beta版	一组模型，改进了GPT-3.5，并且能够理解和生成自然语言或代码
GPT-3.5	一组模型，改进了GPT-3并且能够理解和生成自然语言或代码
DALL·EBeta版	一款模型，能够根据自然语言提示生成和编辑图像
WhisperBeta版	一款模型，能够将音频转换为文本
嵌入（Embeddings）	一组模型，能够将文本转换为数字形式
审查（Moderation）	一个经过Fine-tune的模型，能够检测文本是否可能存在敏感或不安全的内容
GPT-3	一组模型，能够理解和生成自然语言
Codex已弃用	一组模型，能够理解和生成代码，包括将自然语言转换为代码

我们还发布了开源模型，包括Point-E (opens in a new tab)、Whisper (opens in a new tab)、Jukebox (opens in a new tab)和CLIP (opens in a new tab)。

请访问我们的研究人员模型索引了解更多信息，了解哪些模型已在我们的研究论文中进行了特色展示以及像InstructGPT和GPT-3.5这样的模型系列之间的区别。

模型兼容性 (Model endpoint compatibility)

端点（Endpoint）	模型（Model name）
/v1/chat/completions	gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completions	text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001
/v1/edits	text-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/fine-tunes	davinci, curie, babbage, ada
/v1/embeddings	text-embedding-ada-002, text-search-ada-doc-001
/v1/moderations	text-moderation-stable, text-moderation-latest

这个列表不包括我们的第一代嵌入模型和我们的DALL·E模型。

持续性模型升级

随着gpt-3.5-turbo的发布，我们的一些模型现在正在持续更新。我们还提供静态模型版本，供开发者在更新的模型推出时继续使用至少三个月。

随着模型更新的新节奏，我们还可以让人们贡献来帮助我们改进适用于不同用例的模型。如果您有兴趣，请查看OpenAI评估 (opens in a new tab)存储库。

以下模型是临时快照，我们将在更新版本可用后宣布其废弃日期。

如果您想使用最新的模型版本，请使用标准的模型名称，例如gpt-4或gpt-3.5-turbo。

模型版本Model name	废弃日期Deprecation date
gpt-3.5-turbo-0301	TBD
gpt-4-0314	TBD
gpt-4-32k-0314	TBD

GPT-4 限量beta版

GPT-4是一个大型多模态模型（今天接受文本输入和输出文本，未来还将支持图像输入），拥有更广泛的常识和先进的推理能力，能够比我们以前的任何模型更准确地解决困难问题。与gpt-3.5-turbo一样，GPT-4针对聊天进行了优化，但在使用聊天完成API (opens in a new tab)时也可以很好地完成传统的完成任务。在我们的聊天指南中学习如何使用GPT-4。

GPT-4目前处于限量beta版，只对获得访问权限的人员开放。请加入等待列表 (opens in a new tab)以便在有空间时获得访问权限。

最新模型	描述	最大tokens数量	训练数据
gpt-4	比任何GPT-3.5模型都更有能力，能完成更复杂的任务，并针对聊天进行了优化。将随着我们的最新模型迭代进行更新。	8,192个tokens	直到2021年9月
gpt-4-0314	`gpt-4`在2023年3月14日的快照。与`gpt-4`不同，该模型将不会接收更新，并将在新版本发布后的3个月内废弃。	8,192个tokens	直到2021年9月
gpt-4-32k	与基础`gpt-4`模式具有相同的功能，但具有4倍的上下文长度。将随着我们的最新模型迭代进行更新。	32,768个tokens	直到2021年9月
gpt-4-32k-0314	`gpt-4-32`在2023年3月14日的快照。与`gpt-4-32k`不同，该模型将不会接收更新，并将在新版本发布后的3个月内废弃。	32,768个tokens	直到2021年9月

对于许多基本任务，GPT-4和GPT-3.5模型之间的差异并不显著。然而，在更复杂的推理情况下，GPT-4比我们之前的任何模型都更具有能力。

GPT-3.5

GPT-3.5模型可以理解和生成自然语言或代码。我们在GPT-3.5系列中最具能力和性价比的模型是gpt-3.5-turbo，它已经针对聊天进行了优化，但在传统的完成任务方面也运行良好。

最新模型	描述	最大tokens数量	训练数据
gpt-3.5-turbo	最具能力的GPT-3.5模型，针对聊天进行了优化，与`text-davinci-003`相比，成本降低了1/10。将随着我们的最新模型迭代进行更新。	4,096个tokens	直到2021年9月
gpt-3.5-turbo-0301	`gpt-3.5-turbo`在2023年3月1日的快照。与`gpt-3.5-turbo`不同，该模型将不会接收更新，并将在新版本发布后的3个月内废弃。	4,096个tokens	直到2021年9月
text-davinci-003	可以完成任何语言任务，并具有比curie、babbage或ada模型更好的质量、更长的输出和一致的指令执行。还支持插入完成文本。	4,097个tokens	直到2021年6月
text-davinci-002	与`text-davinci-003`具有类似的功能，但是通过监督微调进行训练，而不是通过强化学习进行训练。	4,097个tokens	直到2021年6月
code-davinci-002	针对代码完成任务进行了优化。	8,001个tokens	直到2021年6月

我们建议使用gpt-3.5-turbo，因为其成本较低。OpenAI模型是非确定性的，意味着相同的输入可以产生不同的输出。将温度(temperature) (opens in a new tab)设置为0会使输出基本上成为确定性的，但可能会留下一些变异性。

特定于功能的模型

虽然新的gpt-3.5-turbo模型针对聊天进行了优化，但在传统的完成任务方面也表现非常好。原始的GPT-3.5模型针对文本完成进行了优化。

我们为创建嵌入，以及编辑文本的端点(Completion)使用各自专用的模型集。

找到合适的模型

尝试使用gpt-3.5-turbo是了解API能够实现什么的好方法。一旦您对想要实现的内容有了想法，就可以继续使用gpt-3.5-turbo或另一个模型，并尝试优化其能力。

您可以使用GPT比较工具 (opens in a new tab)，并行运行不同的模型以比较输出、设置和响应时间，然后将数据下载到Excel电子表格中。

DALL·E Beta

DALL·E是一种AI系统，可以根据自然语言描述创建逼真的图像和艺术品。我们目前支持能力，即在给定提示的情况下，创建具有特定大小的新图像，编辑现有图像或创建用户提供的图像的变体。

当前可通过我们的API获取的DALL·E模型是第二代DALL·E，具有比原始模型更逼真、准确并且分辨率高4倍的图像。您可以通过我们的Labs界面 (opens in a new tab)或通过API试用它。

Whisper Beta

Whisper是一个通用的语音识别模型。它是在大量多样化的音频数据集上进行训练的，并且是一种多任务模型，可以执行多语言语音识别、语音翻译和语言识别。Whisper v2-large模型目前可以通过我们的API使用，其模型名称为whisper-1。

目前，Whisper的开源版本 (opens in a new tab)和我们的API版本之间没有区别。然而，通过我们的API，我们提供了一个优化的推理过程，使得通过我们的API运行Whisper比通过其他方式运行Whisper要快得多。有关Whisper的更多技术细节，您可以阅读论文 (opens in a new tab)。

嵌入（Embeddings）

嵌入是文本的数值表示，可用于测量两个文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002旨在以较低的成本取代之前的16个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章 (opens in a new tab)中了解更多关于我们最新的嵌入模型的内容。

风险控制管理（Moderation）

管理模型的设计目的是检查内容是否符合OpenAI的使用政策 (opens in a new tab)。这些模型提供分类功能，可查找以下类别的内容：仇恨、仇恨/威胁、自伤、性、性/未成年人、暴力和暴力/图形。您可以在我们的管理指南中了解更多信息。

管理模型接收任意大小的输入，自动分割以适应模型特定的上下文窗口。

模型	描述
text-moderation-latest	最具能力的管理模型。准确性比稳定模型稍高
text-moderation-stable	几乎与最新模型具有相同的能力，但是旧些。

GPT-3

GPT-3模型可以理解和生成自然语言。这些模型已被更强大的GPT-3.5一代模型所取代。但是，原始的GPT-3基础模型（davinci、curie、ada和babbage）目前是唯一可以fine-tune的模型。

最新模型	描述	最大tokens数量	训练数据
text-curie-001	非常能干，比Davinci更快、成本更低。	2,049个tokens	直到2019年10月
text-babbage-001	能够完成基本任务，速度很快，成本更低。	2,049个tokens	直到2019年10月
text-ada-001	能够完成非常简单的任务，通常是GPT-3系列中速度最快、成本最低的模型。	2,049个tokens	直到2019年10月
davinci	最有能力的GPT-3模型。可以完成其他模型能够完成的任何任务，通常具有更高的质量。	2,049个tokens	直到2019年10月
curie	非常有能力，比Davinci更快、成本更低。	2,049个tokens	直到2019年10月
babbage	能够完成基本任务，速度很快，成本更低。	2,049个tokens	直到2019年10月
ada	能够完成非常简单的任务，通常是GPT-3系列中速度最快、成本最低的模型。	2,049个tokens	直到2019年10月

停用Codex模型 Codex Deprecated

Codex模型已停用。它们是我们的GPT-3模型的后代，可以理解和生成代码。它们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。了解更多 (opens in a new tab)。

它们在Python中最具能力，并精通包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL和甚至Shell在内的十多种语言。

以下Codex模型已停用：

最新模型	描述	最大tokens数量	训练数据
code-davinci-002	最有能力的Codex模型。特别擅长将自然语言翻译成代码。除了完成代码之外，还支持插入 (opens in a new tab)完成代码。	8,001个tokens	直到2021年6月
code-davinci-001	`code-davinci-002`的早期版本	8,001个tokens	直到2021年6月
code-cushman-002	几乎与Davinci Codex一样有能力，但稍微快一些。这种速度优势可能使它更适用于实时应用程序。	最多2,048个tokens
code-cushman-001	`code-cushman-002`的早期版本	最多2,048个tokens

欲知详情，请参阅我们的Codex工作指南。

教程（Tutorials) 政策（Policies)

模型 （Models）

停用Codex模型 Codex Deprecated

模型（Models）