文|自象限 程心
编辑|周游
OpenAI自横空出世那天起,就一直是创业者们头上的一把达摩克利斯之剑,如今这把剑终于落下了。
美东时间11月6日,OpenAI在镁光灯下举行了首次开发者大会,OpenAI接连放了几个大招,多模态、降价、GPTs、all tools,几乎把上半年的创业项目全都自己做了一遍,这一套连招也彻底把创业者们打懵了。
“不给第三方留后路”、“一夜回到解放前”、“搞了半年的东西在OpenAI的更新面前像个笑话”...
▲图源:即刻和朋友圈截图
与现场如春晚般的掌声和欢呼声不同的是,场外无数创业项目破碎和投资人心碎的声音。X上有网友自发组织了一场实时讨论,近百人实时讨论,当OpenAI献出“GPTs”和“all tools”时,惊现国粹“woc,这半年都白干了”。
▲图源:X截图
而随着演讲进程的推进,Altman说出的每一个英文单词,都一片一片地击碎众多创业项目,“这是一场1挑N的碾压式比赛。”有人愁云惨淡地说道。
事实上,这并不是创业者们完全猝不及防地被OpenAI“偷袭”。
就在前一天,11月5日,在奇绩创坛举办一场关于探索Agent新范式的线上活动中,不少人都对这项技术忧心忡忡,“明天就是OpenAI的开发者大会,不知道会不会一夜之间变天。”
如今,这句话一语成谶。投资人睡醒后的第一件事,就是询问相关创业者:“你们和OpenAI所做的差异性在哪?”。创业者回复:“差异性就是比他差。”
众所周知,大模型创业有一条铁律:做OpenAI不做的事。但是现在看来,OpenAI似乎没有边界,而这对整个大模型行业来说,是福还是祸?
OpenAI更新,降维打击了谁?
《三体》中,歌者文明向太阳系发射了一片二向箔,太阳系瞬间被二维化,所有的生命都变成了一幅画,地球也因此而毁灭。
降维打击由此而来,创业公司们的焦虑,也来源于一夜之间,被“二维展开”。
昨天的开发者大会,OpenAI的核心主要围绕两件事,一是工具箱all tools;二是GPT,这其中既包括对过去GPT-4的升级,也包括由GPT更迭演化而来的GPTs、Agents以及GPT Store。
▲图源:X作者FinanceYF5
工具这条线贯穿于大会始终,覆盖了从大模型训练推理到AI Agents构建的全链条,一言以蔽之:用OpenAI就够了。
在大模型基础能力方面,TurboGPT-4 Turbo上下文窗口达到128k,是GPT-4的四倍;知识库更新到2023年4月;多模态能力上,GPT-4 Turbo的API将集成了DALL-E3,以及文生语音模型TTS(text-to-speech),开发者通过API可直接调用。
在打造个人专属GPT和构建AI agents方面,OpenAI向开发者推出了GPT Builder助手,构建过程就是和GPT Builder聊天,告诉它你想要做什么即可;即将上线Assistant API,允许AI助手执行具体任务,包含代码解释器、知识库、函数调用等一些工具,并支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。
首当其冲的是国外以LangChain为代表的一批做工具链、中间层的公司,在国内这类公司又被称为“中间件”。
以LongChain为例,它是一个基于大语言模型建立起的框架,其本身并不开发大模型,而是通过把大模型相关开发组件封装打包、链接在一起,从而来降低开发大模型应用的难度。“便捷”、“易用”成为其最大的特点,也正是踩准了大模型应用开发的风口,才让LangChain摇身一变成为了硅谷VC的“座上宾”,甚至在没有任何收入和收入计划的情况下,连续拿下了1000万美元和2000多万美元的两轮融资。
正如硬币有两面性,LangChain等中间层公司所谓的“开箱即用”,也为OpenAI原子弹式的降维打击埋下了伏笔。
此前,已经有一些开发者告诉【自象限】,在实际开发过程中他们对LangChain的使用率并没有想象中那么高,“易用也意味着不够灵活,而对很多初创公司来说,他们更愿意根据自身的业务需求,从零开始构建工具链和框架。比起LangChain,Hugging Face上还有大把的开源工具可以随意调取”。
如今来看,LangChain等公司的热度已经趋于冷却,或许击碎他们不过是早晚的事情,不是OpenAI也会有其他人。反观国内,并没有形成像LangChain一样的完整工具链,国内也有创业公司们瞄准了一个个“散装”环节,有人只做数据清洗或者embedding的过程。“通用的交给OpenAI,创业公司做垂类”,如今这样的幻想也破灭了。
更令一众尚在襁褓的初创公司胆战心惊的是,OpenAI这头永远无法餍足的狮子,也垂涎上了“AI Agents”这块肥肉。
AI Agents可能是现在大模型赛道最热的方向,早在今年三、四月份,就有过一轮AI 智能体的大爆发,短短半个月内,Camel 、BabyAGI、AutoGPT 、斯坦福西部世界小镇如雨后春笋般冒出。
据【自象限】了解,在国内,AI Agents同样是许多初创公司埋头苦干的项目,比如近期面壁智能联合清华大学NLP 实验室推出了大模型「超级英雄」——XAgent,声称在真实复杂任务的处理能力已全面超越AutoGPT。
但现阶段真正能跑出来的AI Agents还寥寥无几,核心原因有两个,一是从数据清洗、Prompt指令设置、训练、输出等各个环节都困难重重;二是,价格成本过于高昂,动辄测试跑一次5美元、3美元,根本找不到能够落地的商业场景。
“你们中的很多人已经有了建立Agents的经验,但是这过程往往很难,可能需要花费数月、几十名工程师,而且很难控制定制化过程,所以我们今天试图将其变得更简单”,Altman在发布会现场说道。
显然,早已经在各个分任务跑AI Agents的OpenAI摸准了创业者的脉。
今年加入OpenAI的前特斯拉AI总监Karpathy,曾在一次开发者活动上表示:“AI智能体,代表了AI的一种未来!”
在近期的奇绩创坛分享会上,有专家更加明确化了这种“未来”。AI agents下一步大模型与真实世界产生互动、影响的关键,“现在的格局是人作为中介,连接起大模型和真实世界,大模型尚且无法与真实环境产生互动、反馈。而未来则是人-AI agents-真实世界这样的排布,真正迈向全自动化、智能化”。
▲图源:奇绩创坛AI agents分享会
由此可见,OpenAI的野心远不止于一场发布会,不仅想抓住现在,更想抓住未来。
OpenAI更普惠还是更垄断?
有人说OpenAI通过开放能力来完善生态,是更普惠的体现,更多人认为OpenAI并不给生态的其他玩家“留活路”,是垄断的象征。
想要搞明白OpenAI背后的大棋,还要从更宏观的视角来看这场发布会。
当我们把自己从OpenAI更新的震慑中抽离出来,冷静地去看待这场发布会,会发现OpenAI悄然间已经集齐了大模型(底层)+工具链(中间层)+Agents(应用层)的三件套,而当用户和开发者全方位依赖于OpenAI,OpenAI就做到了真正的“通吃”。
除了最引人注目的工具箱all tools和Agent,OpenAI还升级了GPT4的六大能力,包括128k长文本、全新的Assistants API以及视觉CV在内的多模态功能。这些围绕着模型层的能力让OpenAI在市场是具有了更强的竞争力,也让创业者们一直垂涎多模态能力走到台前。
▲图源:YouTube截图
更重要的是,从ChatGPT到GPT-4,OpenAI一直掌握着“卖方优势”,只因价格太贵,导致无法大规模普及。套用马斯克用在特斯拉身上的一句话“没有人不想拥有GPT-4,只要他足够便宜。”Altman也体察到了民意,升级后的GPT-4 Turbo,不仅将性能提升了一大截,还把价格“打了下来。
▲图源:OpenAI官网 降价后的GPT-4 Turbo 输入侧为GPT-4 的 1/3 价格,输出侧为 GPT-4 的 1/2 价格。据开发者对比过后,这个价格相比于开源生态的大模型和工具链,仍然贵了十倍级以上。
在绝对的能力差和溢价之间,企业和开发者往往会选择前者。社交平台上有人透露到:“泄露的all tools账号已经开始高价售卖了,这万众期待的阵仗就跟当年的Apple一样。”
▲图源:即刻截图
像苹果的可不止这万众期待的阵仗。在ChatGPT插件上线时,就有很多人将其比喻为安卓或者是APP Store,如今,OpenAI真的推出了GPT Store。
简单的说,就是开发者们通过OpenAI提供的工具,可以直接基于GPT-4的能力,构建一个智能化应用:GPTs。
从定制开发、收入变现到生态构建,OpenAI给出了一揽子的解决方案:在开发环节,提供GPT Builder、Assistants API生成工具,旨在让不懂编程语言的普通人也能开发出定制化GPT对话助手和AI agents分身,以此来降低开发的难度;在收入变现环节,OpenAI承诺将向建造最有用和最多使用GPTs的人支付收入,与创作者分享收入;在生态构建环节,OpenAI提出要打造类苹果的GPT商店,一旦开发者的GPT入驻,就能被更多人搜索到,并有机会跻身排行榜前列获得更多流量推荐。
▲图源:YouTube截图
也就是说,一个属于OpenAI的开发者生态真的来了。如同 App Store 一样,商店将收录验证用户创建的 GPT 作品,可以被用户搜索到。商店也会推荐生产力、教育和好玩等类别的优秀作品,而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。
从基础大模型,到工具到底层系统,OpenAI几乎一场发布会完成了乔布斯时代的几件惊天动地的大事。
OpenAI在整个AI时代,站在了食物链最顶端。让我们简单地回顾一下苹果的发展脉络:重新定义硬件(iPhone4)、重新定义软件(App)、重新定义系统(iOS、OS),从而建立起一个“无坚不摧”的生态。
苹果定义了App的设计规则、开发者的开发规则、分成规则,当年微信和苹果的几次拉锯才在iOS系统中上线赞赏功能,甚至当智能手机日益衰退之际,苹果依然凭借着强大的生态能力“豢养”着用户,利于不败之地。
参考苹果的结果,就很容易回答,是更普惠还是更垄断的问题。
当然,在这个新时代,一切瞬息万变。
“很期待接下来Meta等开源生态的反击,OpenAI再次打响了一场战争,接下来,可能更好玩了。”