入门文档(docs)
模型(Models)

模型 (Models)

概览 Overview

OpenAI API是由多种具有不同能力和价格的模型驱动的。您还可以通过微调我们的原始基础模型,针对您的特定用例进行有限的自定义。

模型描述
GPT-4 限量beta版一组模型,改进了GPT-3.5,并且能够理解和生成自然语言或代码
GPT-3.5一组模型,改进了GPT-3并且能够理解和生成自然语言或代码
DALL·EBeta版一款模型,能够根据自然语言提示生成和编辑图像
WhisperBeta版一款模型,能够将音频转换为文本
嵌入(Embeddings)一组模型,能够将文本转换为数字形式
审查 (Moderation)一个经过Fine-tune的模型,能够检测文本是否可能存在敏感或不安全的内容
GPT-3一组模型,能够理解和生成自然语言
Codex已弃用一组模型,能够理解和生成代码,包括将自然语言转换为代码

我们还发布了开源模型,包括Point-E (opens in a new tab)Whisper (opens in a new tab)Jukebox (opens in a new tab)CLIP (opens in a new tab)

请访问我们的研究人员模型索引了解更多信息,了解哪些模型已在我们的研究论文中进行了特色展示以及像InstructGPT和GPT-3.5这样的模型系列之间的区别。

模型兼容性 (Model endpoint compatibility)


端点(Endpoint)模型(Model name)
/v1/chat/completionsgpt-4, gpt-4-0314, gpt-4-32k, gpt-4-32k-0314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completionstext-davinci-003, text-davinci-002, text-curie-001, text-babbage-001, text-ada-001
/v1/editstext-davinci-edit-001, code-davinci-edit-001
/v1/audio/transcriptionswhisper-1
/v1/audio/translationswhisper-1
/v1/fine-tunesdavinci, curie, babbage, ada
/v1/embeddingstext-embedding-ada-002, text-search-ada-doc-001
/v1/moderationstext-moderation-stable, text-moderation-latest

这个列表不包括我们的第一代嵌入模型和我们的DALL·E模型

持续性模型升级


随着gpt-3.5-turbo的发布,我们的一些模型现在正在持续更新。我们还提供静态模型版本,供开发者在更新的模型推出时继续使用至少三个月。

随着模型更新的新节奏,我们还可以让人们贡献来帮助我们改进适用于不同用例的模型。如果您有兴趣,请查看OpenAI评估 (opens in a new tab)存储库。

以下模型是临时快照,我们将在更新版本可用后宣布其废弃日期。

如果您想使用最新的模型版本,请使用标准的模型名称,例如gpt-4gpt-3.5-turbo

模型版本Model name废弃日期Deprecation date
gpt-3.5-turbo-0301TBD
gpt-4-0314TBD
gpt-4-32k-0314TBD

GPT-4 限量beta版


GPT-4是一个大型多模态模型(今天接受文本输入和输出文本,未来还将支持图像输入),拥有更广泛的常识和先进的推理能力,能够比我们以前的任何模型更准确地解决困难问题。与gpt-3.5-turbo一样,GPT-4针对聊天进行了优化,但在使用聊天完成API (opens in a new tab)时也可以很好地完成传统的完成任务。在我们的聊天指南中学习如何使用GPT-4。

GPT-4目前处于限量beta版,只对获得访问权限的人员开放。请加入等待列表 (opens in a new tab)以便在有空间时获得访问权限。

最新模型描述最大tokens数量训练数据
gpt-4比任何GPT-3.5模型都更有能力,能完成更复杂的任务,并针对聊天进行了优化。将随着我们的最新模型迭代进行更新。8,192个tokens直到2021年9月
gpt-4-0314gpt-4在2023年3月14日的快照。与gpt-4不同,该模型将不会接收更新,并将在新版本发布后的3个月内废弃。8,192个tokens直到2021年9月
gpt-4-32k与基础gpt-4模式具有相同的功能,但具有4倍的上下文长度。将随着我们的最新模型迭代进行更新。32,768个tokens直到2021年9月
gpt-4-32k-0314gpt-4-32在2023年3月14日的快照。与gpt-4-32k不同,该模型将不会接收更新,并将在新版本发布后的3个月内废弃。32,768个tokens直到2021年9月

对于许多基本任务,GPT-4和GPT-3.5模型之间的差异并不显著。然而,在更复杂的推理情况下,GPT-4比我们之前的任何模型都更具有能力。

GPT-3.5


GPT-3.5模型可以理解和生成自然语言或代码。我们在GPT-3.5系列中最具能力和性价比的模型是gpt-3.5-turbo,它已经针对聊天进行了优化,但在传统的完成任务方面也运行良好。

最新模型描述最大tokens数量训练数据
gpt-3.5-turbo最具能力的GPT-3.5模型,针对聊天进行了优化,与text-davinci-003相比,成本降低了1/10。将随着我们的最新模型迭代进行更新。4,096个tokens直到2021年9月
gpt-3.5-turbo-0301gpt-3.5-turbo在2023年3月1日的快照。与gpt-3.5-turbo不同,该模型将不会接收更新,并将在新版本发布后的3个月内废弃。4,096个tokens直到2021年9月
text-davinci-003可以完成任何语言任务,并具有比curie、babbage或ada模型更好的质量、更长的输出和一致的指令执行。还支持插入完成文本。4,097个tokens直到2021年6月
text-davinci-002text-davinci-003具有类似的功能,但是通过监督微调进行训练,而不是通过强化学习进行训练。4,097个tokens直到2021年6月
code-davinci-002针对代码完成任务进行了优化。8,001个tokens直到2021年6月

我们建议使用gpt-3.5-turbo,因为其成本较低。OpenAI模型是非确定性的,意味着相同的输入可以产生不同的输出。将温度(temperature) (opens in a new tab)设置为0会使输出基本上成为确定性的,但可能会留下一些变异性。

特定于功能的模型

虽然新的gpt-3.5-turbo模型针对聊天进行了优化,但在传统的完成任务方面也表现非常好。原始的GPT-3.5模型针对文本完成进行了优化。

我们为创建嵌入,以及编辑文本的端点(Completion)使用各自专用的模型集。

找到合适的模型

尝试使用gpt-3.5-turbo是了解API能够实现什么的好方法。一旦您对想要实现的内容有了想法,就可以继续使用gpt-3.5-turbo或另一个模型,并尝试优化其能力。

您可以使用GPT比较工具 (opens in a new tab),并行运行不同的模型以比较输出、设置和响应时间,然后将数据下载到Excel电子表格中。

DALL·E Beta


DALL·E是一种AI系统,可以根据自然语言描述创建逼真的图像和艺术品。我们目前支持能力,即在给定提示的情况下,创建具有特定大小的新图像,编辑现有图像或创建用户提供的图像的变体。

当前可通过我们的API获取的DALL·E模型是第二代DALL·E,具有比原始模型更逼真、准确并且分辨率高4倍的图像。您可以通过我们的Labs界面 (opens in a new tab)通过API试用它。

Whisper Beta


Whisper是一个通用的语音识别模型。它是在大量多样化的音频数据集上进行训练的,并且是一种多任务模型,可以执行多语言语音识别、语音翻译和语言识别。Whisper v2-large模型目前可以通过我们的API使用,其模型名称为whisper-1

目前,Whisper的开源版本 (opens in a new tab)和我们的API版本之间没有区别。然而,通过我们的API,我们提供了一个优化的推理过程,使得通过我们的API运行Whisper比通过其他方式运行Whisper要快得多。有关Whisper的更多技术细节,您可以阅读论文 (opens in a new tab)

嵌入 (Embeddings)


嵌入是文本的数值表示,可用于测量两个文本之间的相关性。我们的第二代嵌入模型text-embedding-ada-002旨在以较低的成本取代之前的16个第一代嵌入模型。嵌入对于搜索、聚类、推荐、异常检测和分类任务非常有用。您可以在公告博客文章 (opens in a new tab)中了解更多关于我们最新的嵌入模型的内容。


风险控制管理 (Moderation)

管理模型的设计目的是检查内容是否符合OpenAI的使用政策 (opens in a new tab)。这些模型提供分类功能,可查找以下类别的内容:仇恨、仇恨/威胁、自伤、性、性/未成年人、暴力和暴力/图形。您可以在我们的管理指南中了解更多信息。

管理模型接收任意大小的输入,自动分割以适应模型特定的上下文窗口。

模型描述
text-moderation-latest最具能力的管理模型。准确性比稳定模型稍高
text-moderation-stable几乎与最新模型具有相同的能力,但是旧些。

GPT-3

GPT-3模型可以理解和生成自然语言。这些模型已被更强大的GPT-3.5一代模型所取代。但是,原始的GPT-3基础模型(davincicurieadababbage)目前是唯一可以fine-tune的模型。

最新模型描述最大tokens数量训练数据
text-curie-001非常能干,比Davinci更快、成本更低。2,049个tokens直到2019年10月
text-babbage-001能够完成基本任务,速度很快,成本更低。2,049个tokens直到2019年10月
text-ada-001能够完成非常简单的任务,通常是GPT-3系列中速度最快、成本最低的模型。2,049个tokens直到2019年10月
davinci最有能力的GPT-3模型。可以完成其他模型能够完成的任何任务,通常具有更高的质量。2,049个tokens直到2019年10月
curie非常有能力,比Davinci更快、成本更低。2,049个tokens直到2019年10月
babbage能够完成基本任务,速度很快,成本更低。2,049个tokens直到2019年10月
ada能够完成非常简单的任务,通常是GPT-3系列中速度最快、成本最低的模型。2,049个tokens直到2019年10月

停用Codex模型 Codex Deprecated

Codex模型已停用。它们是我们的GPT-3模型的后代,可以理解和生成代码。它们的训练数据包含自然语言和来自GitHub的数十亿行公共代码。了解更多 (opens in a new tab)

它们在Python中最具能力,并精通包括JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL和甚至Shell在内的十多种语言。

以下Codex模型已停用:

最新模型描述最大tokens数量训练数据
code-davinci-002最有能力的Codex模型。特别擅长将自然语言翻译成代码。除了完成代码之外,还支持插入 (opens in a new tab)完成代码。8,001个tokens直到2021年6月
code-davinci-001code-davinci-002的早期版本8,001个tokens直到2021年6月
code-cushman-002几乎与Davinci Codex一样有能力,但稍微快一些。这种速度优势可能使它更适用于实时应用程序。最多2,048个tokens
code-cushman-001code-cushman-002的早期版本最多2,048个tokens

欲知详情,请参阅我们的Codex工作指南