GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

首页 > AI资讯 > 最新资讯 > GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

新火种 2024-11-07

OpenAI出了个新功能，直接让ChatGPT输出的速度原地起飞！

这个功能叫做“预测输出”（Predicted Outputs），在它的加持之下，GPT-4o可以比原先快至多5倍。

以编程为例，来感受一下这个feel：

为啥会这么快？用一句话来总结就是：

因此，“预测输出”就特别适合下面这些任务：

在文档中更新博客文章迭代先前的响应重写现有文件中的代码

而且与OpenAI合作开发这个功能的FactoryAI，也亮出了他们在编程任务上的数据：

从实验结果来看，“预测输出”加持下的GPT-4o响应时间比之前快了2-4倍，同时保持高精度。

并且官方还表示：

值得注意的是，目前“预测输出”功能仅支持GPT-4o和GPT-4o mini两个模型，且是以API的形式。

对于开发者而言，这可以说是个利好消息了。

网友们在线实测

消息一出，众多网友也是坐不住了，反手就是实测一波。

例如Firecrawl创始人Eric Ciarla就用“预测输出”体验了一把将博客文章转为SEO（搜索引擎优化）的内容，然后他表示：

另一位网友则是在已有的代码之上，“喂”了一句Prompt：

来感受一下这个速度：

也有网友晒出了自己实测的数据：

总而言之，快，是真的快。

怎么做到的？

对于“预测输出”的技术细节，OpenAI在官方文档中也有所介绍。

OpenAI认为，在某些情况下，LLM的大部分输出都是提前知道的。

如果你要求模型仅对某些文本或代码进行细微修改，就可以通过“预测输出”，将现有内容作为预测输入，让延迟明显降低。

例如，假设你想重构一段 C# 代码，将 Username 属性更改为 Email ：

///

/// Represents a user with a first name, last name, and username.///

public class User{ ///

/// Gets or sets the user's first name. ///

public string FirstName { get; set; } ///

/// Gets or sets the user's last name. ///

public string LastName { get; set; } ///

/// Gets or sets the user's username. ///

public string Username { get; set; }}

你可以合理地假设文件的大部分内容将不会被修改（例如类的文档字符串、一些现有的属性等）。

通过将现有的类文件作为预测文本传入，你可以更快地重新生成整个文件。

import OpenAI from "openai";const code = `///

/// Represents a user with a first name, last name, and username.///

public class User{ ///

/// Gets or sets the user's first name. ///

public string FirstName { get; set; } ///

/// Gets or sets the user's last name. ///

public string LastName { get; set; } ///

/// Gets or sets the user's username. ///

public string Username { get; set; }}`;const openai = new OpenAI();const completion = await openai.chat.completions.create({ model: "gpt-4o", messages: [ { role: "user", content: "Replace the Username property with an Email property. Respond only with code, and with no markdown formatting." }, { role: "user", content: code } ], prediction: { type: "content", content: code }});// Inspect returned dataconsole.log(completion);

使用“预测输出”生成tokens会大大降低这些类型请求的延迟。

不过对于“预测输出”的使用，OpenAI官方也给出了几点注意事项。

首先就是我们刚才提到的仅支持GPT-4o和GPT-4o-mini系列模型。

其次，以下API参数在使用预测输出时是不受支持的：

n values greater than 1logprobspresence_penalty greater than 0frequency_penalty greater than 0audio optionsmodalities other than textmax_completion_tokenstools – function calling is not supported

除此之外，在这份文档中，OpenAI还总结了除“预测输出”之外的几个延迟优化的方法。

包括“加速处理token”、“生成更少的token”、“使用更少的输入token”、“减少请求”、“并行化”等等。

One More Thing

虽然输出的速度变快了，但OpenAI还有一个注意事项引发了网友们的讨论：

有网友也晒出了他的测试结果：

未采用“预测输出”：5.2秒，0.1555美分采用了“预测输出”：3.3秒，0.2675美分 GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

嗯，快了，也贵了。

参考链接：[1]https://x.com/OpenAIDevs/status/1853564730872607229[2]https://x.com/romainhuet/status/1853586848641433834[3]https://x.com/GregKamradt/status/1853620167655481411

Tags:

新功能

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

OPPO文档AI新功能曝光！支持苹果文件格式转换、文档翻译

OpenAI发布新功能允许企业客户定制最强AI模型

微软AI新功能Recall将在10月开放测试

基于Gemini大模型！谷歌宣布为安卓引入新功能：AI检测诈骗电话

热门文章

0326东吴宏观股指每日观点|市场弱势震荡磷化工领涨

联想AIPC全家桶接入DeepSeek，本地跑70B大模型，离线也能写总结

AI图像生成平台「LiblibAI」获数亿元融资

L3上路倒计时？工信部加快推进智能网联车规划产业基建+商业化迎来关键节点

ChatGPT引爆“吉卜力”风格图像生成浪潮同时激发AI违法争议

AI战略锁定增长确定性，粉笔2024年净利润2.4亿元

山西今年将对农用无人驾驶航空器进行购置补贴

南方电网人工智能科技公司增资至4.4亿元

市场监管总局将加快推进人工智能领域国家标准研制工作