模型 (Models)
概览 Overview
OpenAI API是由多种具有不同能力和价格的模型驱动的。您还可以通过微调我们的原始基础模型,针对您的特定用例进行有限的自定义。
模型 | 描述 |
---|---|
GPT-4 限量beta版 | 一组模型,改进了GPT-3.5,并且能够理解和生成自然语言或代码 |
GPT-3.5 | 一组模型,改进了GPT-3并且能够理解和生成自然语言或代码 |
DALL·EBeta版 | 一款模型,能够根据自然语言提示生成和编辑图像 |
WhisperBeta版 | 一款模型,能够将音频转换为文本 |
嵌入(Embeddings) | 一组模型,能够将文本转换为数字形式 |
审查 (Moderation) | 一个经过Fine-tune的模型,能够检测文本是否可能存在敏感或不安全的内容 |
GPT-3 | 一组模型,能够理解和生成自然语言 |
Codex已弃用 | 一组模型,能够理解和生成代码,包括将自然语言转换为代码 |
我们还发布了开源模型,包括Point-E (opens in a new tab)、Whisper (opens in a new tab)、Jukebox (opens in a new tab)和CLIP (opens in a new tab)。
请访问我们的研究人员模型索引了解更多信息,了解哪些模型已在我们的研究论文中进行了特色展示以及像InstructGPT和GPT-3.5这样的模型系列之间的区别。
模型兼容性 (Model endpoint compatibility)
端点(Endpoint) | 模型(Model name) |
---|---|
/v1/chat/completions | gpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301 |
/v1/completions | text-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001 |
/v1/edits | text-davinci-edit-001, code-davinci-edit-001 |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/fine-tunes | davinci, curie, babbage, ada |
/v1/embeddings | text-embedding-ada-002, text-search-ada-doc-001 |
/v1/moderations | text-moderation-stable, text-moderation-latest |
这个列表不包括我们的第一代嵌入模型和我们的DALL·E模型。
持续性模型升级
随着gpt-3.5-turbo
的发布,我们的一些模型现在正在持续更新。我们还提供静态模型版本,供开发者在更新的模型推出时继续使用至少三个月。
随着模型更新的新节奏,我们还可以让人们贡献来帮助我们改进适用于不同用例的模型。如果您有兴趣,请查看OpenAI评估 (opens in a new tab)存储库。
以下模型是临时快照,我们将在更新版本可用后宣布其废弃日期。
如果您想使用最新的模型版本,请使用标准的模型名称,例如gpt-4
或gpt-3.5-turbo
。
模型版本Model name | 废弃日期Deprecation date |
---|---|
gpt-3.5-turbo-0301 | TBD |
gpt-4-0314 | TBD |
gpt-4-32k-0314 | TBD |
GPT-4 限量beta版
GPT-4是一个大型多模态模型(今天接受文本输入和输出文本,未来还将支持图像输入),拥有更广泛的常识和先进的推理能力,能够比我们以前的任何模型更准确地解决困难问题。与gpt-3.5-turbo
一样,GPT-4针对聊天进行了优化,但在使用聊天完成API (opens in a new tab)时也可以很好地完成传统的完成任务。在我们的聊天指南中学习如何使用GPT-4。
GPT-4目前处于限量beta版,只对获得访问权限的人员开放。请加入等待列表 (opens in a new tab)以便在有空间时获得访问权限。
最新模型 | 描述 | 最大tokens数量 | 训练数据 |
---|---|---|---|
gpt-4 | 比任何GPT-3.5模型都更有能力,能完成更复杂的任务,并针对聊天进行了优化。将随着我们的最新模型迭代进行更新。 | 8,192个tokens | 直到2021年9月 |
gpt-4-0314 | gpt-4 在2023年3月14日的快照。与gpt-4 不同,该模型将不会接收更新,并将在新版本发布后的3个月内废弃。 | 8,192个tokens | 直到2021年9月 |
gpt-4-32k | 与基础gpt-4 模式具有相同的功能,但具有4倍的上下文长度。将随着我们的最新模型迭代进行更新。 | 32,768个tokens | 直到2021年9月 |
gpt-4-32k-0314 | gpt-4-32 在2023年3月14日的快照。与gpt-4-32k 不同,该模型将不会接收更新,并将在新版本发布后的3个月内废弃。 | 32,768个tokens | 直到2021年9月 |
对于许多基本任务,GPT-4和GPT-3.5模型之间的差异并不显著。然而,在更复杂的推理情况下,GPT-4比我们之前的任何模型都更具有能力。
GPT-3.5
GPT-3.5模型可以理解和生成自然语言或代码。我们在GPT-3.5系列中最具能力和性价比的模型是gpt-3.5-turbo
,它已经针对聊天进行了优化,但在传统的完成任务方面也运行良好。
最新模型 | 描述 | 最大tokens数量 | 训练数据 |
---|---|---|---|
gpt-3.5-turbo | 最具能力的GPT-3.5模型,针对聊天进行了优化,与text-davinci-003 相比,成本降低了1/10。将随着我们的最新模型迭代进行更新。 | 4,096个tokens | 直到2021年9月 |
gpt-3.5-turbo-0301 | gpt-3.5-turbo 在2023年3月1日的快照。与gpt-3.5-turbo 不同,该模型将不会接收更新,并将在新版本发布后的3个月内废弃。 | 4,096个tokens | 直到2021年9月 |
text-davinci-003 | 可以完成任何语言任务,并具有比curie、babbage或ada模型更好的质量、更长的输出和一致的指令执行。还支持插入完成文本。 | 4,097个tokens | 直到2021年6月 |
text-davinci-002 | 与text-davinci-003 具有类似的功能,但是通过监督微调进行训练,而不是通过强化学习进行训练。 | 4,097个tokens | 直到2021年6月 |
code-davinci-002 | 针对代码完成任务进行了优化。 | 8,001个tokens | 直到2021年6月 |
我们建议使用gpt-3.5-turbo
,因为其成本较低。OpenAI模型是非确定性的,意味着相同的输入可以产生不同的输出。将温度(temperature) (opens in a new tab)设置为0会使输出基本上成为确定性的,但可能会留下一些变异性。
特定于功能的模型
虽然新的gpt-3.5-turbo
模型针对聊天进行了优化,但在传统的完成任务方面也表现非常好。原始的GPT-3.5模型针对文本完成进行了优化。
我们为创建嵌入,以及编辑文本的端点(Completion)使用各自专用的模型集。
尝试使用gpt-3.5-turbo
是了解API能够实现什么的好方法。一旦您对想要实现的内容有了想法,就可以继续使用gpt-3.5-turbo
或另一个模型,并尝试优化其能力。
您可以使用GPT比较工具 (opens in a new tab),并行运行不同的模型以比较输出、设置和响应时间,然后将数据下载到Excel电子表格中。
DALL·E Beta
DALL·E是一种AI系统,可以根据自然语言描述创建逼真的图像和艺术品。我们目前支持能力,即在给定提示的情况下,创建具有特定大小的新图像,编辑现有图像或创建用户提供的图像的变体。
当前可通过我们的API获取的DALL·E模型是第二代DALL·E,具有比原始模型更逼真、准确并且分辨率高4倍的图像。您可以通过我们的Labs界面 (opens in a new tab)或通过API试用它。
Whisper Beta
Whisper是一个通用的语音识别模型。它是在大量多样化的音频数据集上进行训练的,并且是一种多任务模型,可以执行多语言语音识别、语音翻译和语言识别。Whisper v2-large模型目前可以通过我们的API使用,其模型名称为whisper-1
。
目前,Whisper的开源版本 (opens in a new tab)和我们的API版本之间没有区别。然而,通过我们的API,我们提供了一个优化的推理过程,使得通过我们的API运行Whisper比通过其他方式运行Whisper要快得多。有关Whisper的更多技术细节,您可以阅读论文 (opens in a new tab)。
嵌入 (Embeddings)
嵌入是文本的数值表示,可用于测量两个文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002
旨在以较低的成本取代之前的16个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章 (opens in a new tab)中了解更多关于我们最新的嵌入模型的内容。
风险控制管理 (Moderation)
管理模型的设计目的是检查内容是否符合OpenAI的使用政策 (opens in a new tab)。这些模型提供分类功能,可查找以下类别的内容:仇恨、仇恨/威胁、自伤、性、性/未成年人、暴力和暴力/图形。您可以在我们的管理指南中了解更多信息。
管理模型接收任意大小的输入,自动分割以适应模型特定的上下文窗口。
模型 | 描述 |
---|---|
text-moderation-latest | 最具能力的管理模型。准确性比稳定模型稍高 |
text-moderation-stable | 几乎与最新模型具有相同的能力,但是旧些。 |
GPT-3
GPT-3模型可以理解和生成自然语言。这些模型已被更强大的GPT-3.5一代模型所取代。但是,原始的GPT-3基础模型(davinci
、curie
、ada
和babbage
)目前是唯一可以fine-tune的模型。
最新模型 | 描述 | 最大tokens数量 | 训练数据 |
---|---|---|---|
text-curie-001 | 非常能干,比Davinci更快、成本更低。 | 2,049个tokens | 直到2019年10月 |
text-babbage-001 | 能够完成基本任务,速度很快,成本更低。 | 2,049个tokens | 直到2019年10月 |
text-ada-001 | 能够完成非常简单的任务,通常是GPT-3系列中速度最快、成本最低的模型。 | 2,049个tokens | 直到2019年10月 |
davinci | 最有能力的GPT-3模型。可以完成其他模型能够完成的任何任务,通常具有更高的质量。 | 2,049个tokens | 直到2019年10月 |
curie | 非常有能力,比Davinci更快、成本更低。 | 2,049个tokens | 直到2019年10月 |
babbage | 能够完成基本任务,速度很快,成本更低。 | 2,049个tokens | 直到2019年10月 |
ada | 能够完成非常简单的任务,通常是GPT-3系列中速度最快、成本最低的模型。 | 2,049个tokens | 直到2019年10月 |
停用Codex模型 Codex Deprecated
Codex模型已停用。它们是我们的GPT-3模型的后代,可以理解和生成代码。它们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。了解更多 (opens in a new tab)。
它们在Python中最具能力,并精通包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL和甚至Shell在内的十多种语言。
以下Codex模型已停用:
最新模型 | 描述 | 最大tokens数量 | 训练数据 |
---|---|---|---|
code-davinci-002 | 最有能力的Codex模型。特别擅长将自然语言翻译成代码。除了完成代码之外,还支持插入 (opens in a new tab)完成代码。 | 8,001个tokens | 直到2021年6月 |
code-davinci-001 | code-davinci-002 的早期版本 | 8,001个tokens | 直到2021年6月 |
code-cushman-002 | 几乎与Davinci Codex一样有能力,但稍微快一些。这种速度优势可能使它更适用于实时应用程序。 | 最多2,048个tokens | |
code-cushman-001 | code-cushman-002 的早期版本 | 最多2,048个tokens |
欲知详情,请参阅我们的Codex工作指南。