OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

OpenAI在首届开发者大会上公布了大改版的GPT,主要有3+1个大更新:从GPT-4升级到GPT-4 Turbo,根据不同目的创建多个GPT,新的API接口Assistant,以及收费标准的更新。
预计明年的开发者大会,OpenAI已经是个一两千亿美元估值的庞然大物。

2023年11月7日,OpenAI在首届开发者大会上公布了大改版的GPT。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

这次发布会主要有3+1个大更新。

1.从GPT-4升级到GPT-4 Turbo

2.根据不同目的创建多个GPT,OpenAI的首席执行官阿尔特曼称之为GPTs

3.新的API接口Assistant

1.首先是GPT-4 Turbo。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

1.1. GPT-4 Turbo支持128K的token。

可以简单的把它理解为上下文的长度。大约2个token合一个汉字,而老版本一般只支持8K,升级到企业版才有32K。

很多人觉得,长度增加没什么特别的。确实,如果你只是把它当作消遣娱乐的对聊工具,上下文长度增加确实没有什么影响,甚至连翻译的准确度也不会有质的提升。

因为文章的用词,前后关联的紧密度一般都比较高。一个翻译过程能参考前后4000字的内容来修正翻译细节,其实已经能把翻译水平做得很好了,没必要参考前后几万字。

但其实,这一点是GPT-4 Turbo后续一切复杂应用的基础。拿最简单的说,新版ChatGPT可以支持你任意把一个数据文件拽进对话框,然后根据这里的内容提问,可以是Excel表格,也可以是PDF,也可以是其他主流的数据文件。

比如,一篇你怎么看不懂的论文,有75页,如果只支持8K上下文的话,回答质量就不会太好,而128K就能轻松理解全部内容。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

1.2. GPT-4 Turbo更新了知识库,从2021年9月更新到了2023年4月。

由于训练数据几乎囊括了所有人类呈现过的文字,不只是故事、知识,还包括新闻,所以2023年4月版的知识库会新增很多关键知识,比如这两年间由于AI的爆发式增长带来的新信息。

当然,习惯网页浏览模式的人可能对这个更新不太感冒。但其实,在这次更新之后什么这模式那模式的会在2023年11月后全都融合在一起,连模式选项就取消了。该去网上核实的时候,GPT自然会去网上找,并给出出处;该用图片展示的,它会直接给你显示图。相当于之前几种模式共同发挥作用。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

1.3. 自定义模型。

这个功能就是把GPT-4模型的微调功能开放给开发者。我们知道,这种用无数语料训练出的大语言模型,拥有广博但不太专业的知识,大概能比业余爱好者的水平高一些,但更专业的问题就回答不好了。如果有人能在它不错的基础上再训练出专业能力,那就完美了。

而GPT-4模型又是不公开的,所以我们不能下载做微调。

现在开放给开发者,可以做微调。你可以按你希望的方向上传一些专业数据喂给它,比如让它成为一名数学作业辅导老师,一名法律顾问,一位营养师,或者一组熟悉自家产品细节的客服等等。自定义模型就可以实现这些功能。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

2.接下来再说第二大更新——GPTs。

这个功能通俗的说就是,ChatGPT刚刚上线后,在Github上有一些非常火爆的Agent(可以简单理解成为帮我们干活的机器人),而这个GPTs就是官方版的Agent。

从前ChatGPT的功能是一个高智能机器人的嘴和大脑的部分,唯独缺执行的部分。而之前那些爆火的插件,比如说AutoGPT或者GPT Agent全都是去执行ChatGPT给出的决策的。具体来说,就是指令的执行,脚本的运行,程序的操作,素材的阅读,等等。

发布会当场演示了3个Agent:

一个是CanvaGPT,是做海报用的。OpenAI首席执行官奥尔特曼亲自演示,他跟CanvaGPT说要为开发者大会准备一个海报。只要把海报中必须呈现的文字和元素用文字告诉Canva就可以了,它会自动生成几幅海报。

你不满意的话可以继续让它不断生成,直到遇到一个觉得还可以的,把它当作基础模板,再点编辑,调整由Canva为大家准备的各种可调选项,比如什么背景啊,风格化啊,文字位置和大小的微调等等。这样一个Agent就是Canva做出来的个性化的GPTs。

发布会上第2个Agent更具有代表性,是ZapierGPT。

Zapier本身是一个连接器软件。什么意思?大约一共有6000个左右的App和服务可以通过Zapier连接和交互。于是,这家公司做出来的ZapierGPT就可以只通过GPT消化理解人说的话,然后自动吩咐手机里的所有App执行具体动作。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

比如,发布会现场就演示了一个日程安排助手是怎么工作的,用的就是ZapierGPT。

当你的日历和聊天工具(咱们假设就是微信吧)都和ZapierGPT连接上以后,你根本不用来回切换日历和微信,只需要打开ChatGPT,然后找到ZapierGPT,和它对话,问它我今天的日程是怎么安排的,它会自动访问你的日历App,把一天的安排列出来。然后它还会自动发现有一个日程安排在时间上是冲突的,并提醒你。

然后你直接和它说,帮我和领导说我去不了了,我得去干嘛,它就会在后台自动在微信上和领导解释你去不了的理由,而且解释的内容还不一定是你的原话,会做一些礼仪上的润色。

整个过程你只打开了ChatGPT,中间不用做任何切换和比对。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

第3个例子由阿尔特曼亲自演示:不需要懂编程,只用自然语言就可以和ChatGPT沟通,然后生成个性化的Agent或者说个性化的GPTs。当然,这个Agent的功能比较简单。

阿尔特曼说,经常遇到一些开发者向他咨询商业想法,问他能不能给一些创业建议,于是他觉得,不如做一个创业咨询师的Agent。于是,阿尔特曼只说了几句话,这个Agent就建成了。

首先,进入GPT Builder界面,然后和它说:“我想做一个创业公司助手,帮公司创始人提供各种商业建议,并拷问他们为什么不能发展得更快”。当然,最后半句是用自嘲的方式给现场添加一些气氛。

不过,GPT Builder可是会认真对待后半句话的。然后,GPT Builder就针对必要信息做询问,比如名字起创业导师合适不合适?随着你在屏幕左侧不断确认,这个项目的名字、图标、说明文档就一点点的同步生成,而且生成的过程就在右半边的屏幕上,你随时都可以看到。

GPT Builder继续深入,问想怎么和创业者沟通,什么该做什么不该做之类的建议。阿尔特曼回复,就是之前我所做的关于初创企业的讲座内容吧。然后切换到设置界面,就可以看到GPT Builder已经为我们准备好知识上传按钮了。阿尔特曼把此前创业的演讲稿上传。

然后,可以在预览界面看看运行效果如何。比如提问“初创企业招聘员工需要注意哪3点?”这个时候,回答就自动出现了,而且这个回答内容就是那篇演讲中提到的要点。

最后把项目保存。保存后可以选择分享,分享给你的朋友、你的公司,更重要的是可以分享给OpenAI的GPT商店,然后就可以像苹果应用商店一样收入分成。

苹果的开发者把程序上传到App Store,至少需要懂编程。但阿尔特曼的演示证明了,起码有一些功能非常简单的程序直接用自然语言下命令就可以制作完成。它可以是某一个人带咨询功能的资料库、笔记本、日程表,这起码非常方便。

我看有些报道把这个功能说成是GPT-4 Turbo创造了一个新职业,不会编程的人也能开始搞开发了。我觉得这个说法还是有点过头了,哪怕GPT已经帮人完成一些简单的功能了,一个不懂编程的人也是没法抢走程序员的饭碗的,做几个方便自己和朋友用的功能,不懂编程倒是可以应付。真正能融到资的应用当然需要很多程序员。

以上这三个例子对于大部分用户来说都觉得挺新奇、挺期待的。但对当前的很多开发者和投资人来说,都是喜忧参半的。

因为之前半年多,确实有成批的开发者就是指着开发以上这些功能,外加入场早,开发出了好用的Agent,收获了大量用户,而且融到了资。现在OpenAI官方下场,这些创业者从前做的功能至少要大升级才能保证健康运营。

OpenAI官方给出这个功能其实也并不意外。早在2023年2月份,OpenAI的首席科学家就已经对AutoGPT这类Agent给出过评价,说它是“提示工程的下一个前沿领域”。既然评价如此高,干嘛不自己顺手做出来,方便广大用户呢?当初能听懂这句话的投资人,应该已经避开了这个坑。

OpenAI首届开发者大会揭晓:GPT-4 Turbo和多项重大更新

3.三大更新的第3个,就是新的API接口Assistant。

这完全是针对开发者的,可以帮助开发者在自己开发的软件上,内嵌GPT4-Turbo的各种能力。今后很多软件里都有高水准的AI功能,不必纠结于有没有OpenAI的账号。

当然,如果是OpenAI账号都不能注册的地方,也就意味着那个地方所有的软件都不能和OpenAI的API连接。

这个功能虽然之前也有像Spotify、Snap已经通过API嵌入到自己的APP中了,而且新功能的体验也很好,但那时候开发的难度不低,需要一组人搞上几个月,比如说搞定超长对话、历史记录检索、Python的解释器、多个函数功能同时调用、以及把模型外的数据植入到模型里。

现在这些功能全都是API Assistant来解决,大大加快了内嵌GPT-4 Turbo的进度。

而且,OpenAI提供的API接口里,还有一个是文本和语音互转的服务。现场展示了文本转语音的全部6种嗓音中的2种,那种语音语调和口吻是极其自然的。

再考虑到刚刚介绍的GPT-4 Turbo的各种超强属性,可能很多在这方面做创业或者创业刚刚成功的公司,现在都开始担忧了。

OpenAI的开发体验主管就演示了一个具体操作。他当时对着手机说,随机在现场挑5个人,并给他们的开发者账户充值500美元。几秒钟后,5个人就挑选出来了,而且500美元已经充好了。整个过程不需要哪个秘书或助理去亲自操作。

+1.发布会有3+1个更新,其中3个更新说完了,+1是什么呢?

就是收费标准也更新了。

我们知道,OpenAI是按计算过程消耗的token收费的。从2023年11月开始会执行新的收费标准:1000个token输入,花费1美分;1000个token的输出,花费3美分。这个价格分别是发布会之前的1/3和1/2,综合起来属于打了对折还拐弯。

看到这个消息后,很多人把几个工具里的API Key从GPT-3.5的那一串都改成了GPT-4的。因为之前价格高,使用起来有点心疼,不舍得用。

大约一年前,也就是2022年的11月30日,OpenAI发布了ChatGPT的研究预览版。3个月后,也就是2023年中国春节期间刷屏了的GPT-4发布了。2023年10月,又把GPT-4升级了语音功能和图像识别能力。到今天为止,利用GTP-4的API接口搞开发的人一共200万人左右,周活跃用户1亿,当前每月营收超过1亿美元。

我们可以预测的是明年也就是2024年的开发者大会,OpenAI已经是个一两千亿美元估值的庞然大物了。

原创文章,作者:Xaiat超级会员,如若转载,请注明出处:https://www.xaiat.com/openai%e9%a6%96%e5%b1%8a%e5%bc%80%e5%8f%91%e8%80%85%e5%a4%a7%e4%bc%9a%e6%8f%ad%e6%99%93gpt-4-turbo%e5%92%8c%e5%a4%9a%e9%a1%b9%e9%87%8d%e5%a4%a7%e6%9b%b4%e6%96%b0/

(1)
Xaiat的头像Xaiat超级会员管理员
上一篇 2023年12月27日 09:28
下一篇 2023年11月19日 18:49

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

评论列表(1条)

  • 一位WordPress评论者的头像
    一位WordPress评论者 2023年11月11日 11:43

    您好,这是一条评论。若需要审核、编辑或删除评论,请访问仪表盘的评论界面。评论者头像来自 Gravatar

    Xaiat 人工智能艾特 让人人更懂AI