Sora跳票这10个月,AI应用界翻天覆地...

未来每个人都可以拥有一个智能体

文|明晰野望 林森

这几天,你是否刷到过大火的各地博物馆让文物“舞动起来”的短视频?

又是否看到过让马斯克都直呼惊叹的,那些被“复活”的世界名画?

再或者,你一定看到过AI魔改过争议很多的老牌影视剧。

是的,这一切背后都是AI。

就在2024年最后一个月,国内外科技大厂更是集体炫技,AI应用正在以迅雷不及掩耳之势加速落地。

在人工智能时代,技术创新的速度让摩尔定律、新摩尔定律不断被打破。

我们此前就讨论过,随着这两年科技公司对算力和AI的史诗级投入,大模型底座技术渐成熟并由大厂开源后,AI界走向了更务实的道路——应用落地。狂欢背后的冷思考:Open AI“网红化”搅动AI圈

最新的权威数据统计:几乎每六个中国人中,就有一人正在使用AI产品。

更有从业者直言,“最快5年之内,中国人一周只需要工作4天”。

我们做好准备来迎接这个新时代了吗?

 用AI造世界:文生图、生视频、生3D大模型加速开源

12月10日,OpenAI旗下视频生成模型Sora,终于在首次亮相10个月后正式开放,新版工具Sora Turbo可以生成最长达20秒的视频。或许是由于等待的太久,用户火热的试用热情一度让OpenAI紧急关闭用户注册。

但是Sora姗姗来迟的这10个月的空档期内,AI圈已经翻天覆地。

比Sora早一周,12月3日,有着“AI教母”之称的李飞飞联合创立并担任CEO的AI公司World Labs官宣了首个成果——3D世界生成模型,可以让用户从单张图片生成3D世界的AI系统,并且用户可以与之互动。比如,通过键盘和鼠标在生成的3D场景里移动、转换视角。

紧随其后,12月4日,谷歌也发布了Genie 2,一个能把静态照片变成可玩游戏的AI系统,同样可以实现从静态照片到可交互3D场景的转换。

就在一个月前,著名游戏公司任天堂旗下宝可梦公司也宣布过一项类似的技术,用“大规模地理空间模型”,让用户距离空间智能更近了一步。简单说,用户可以自行上传图像,构建3D地图,能精确而真实地看到放置到物理环境中的数字内容,而且这些内容是持久的,还能与他人共享。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

大洋的另一端,中国AI技术同样突飞猛进,在Sora跳档的这10个月里加速赶超。

就在李飞飞官宣新技术的同一天,腾讯版Sora大模型面世,并免费开源!

12月3日,腾讯混元大模型官宣了最新的文生视频大模型HunYuan-Video,用户只需要输入一段描述,即可生成视频,该模型参数量达130亿,是当前最大的视频开源模型。从文本、到AI绘图到3D生成再到视频,腾讯混元大模型已经全系开源。

有参与测评的博主发布评论称,其生成的视频不仅语义理解精准,更是“最有电视剧质感的AI大模型”,甚至看不出一丝的AI味,对比以往文生视频模式,即使面面占比很小的人脸都不会糊。

半个多月前,字节跳动视频生成模型 PixelDance和Seaweed在即梦AI正式上线,并面向公众免费开放使用,仅需60秒即能生成时长5秒的高质量AI视频。

更早的半年之前,今年6月快手可灵文生视频APP发布,至今已经经历了十余次更新,包括发布图生视频功能以及1.5模型的上线等。

在文生图领域,AI技术也在快速迭代。例如,12月2日,字节即梦AI上线了最新的图片2.1模型,解决了AI图像无法生成中文字体的问题,让海报设计的效率再次大幅提升。

某种意义上,ChatGPT停止服务中国市场并不是坏事。

今年中国大模型厂家底层技术不断降价并开源,带动了更多中小创业者走上AI新牌桌。更重要的是,上述这些文生图、文生视频等以及文心一言、腾讯元宝、字节豆包、阿里千问等C端AI应用,在中国速度下都以免费的形式飞入了寻常百姓家。

QuestMobile数据显示,2024年10月,AI原生应用行业月活跃用户规模达到8976万,同比增长373.0%。

 AI+SaaS:智能体将是通往未来的新船票

视觉AI应用火,更火的是“智能体”。

在AI改变虚拟和真实世界视觉联系的同时,AI正在各式各类的SaaS应用中落地,各种形式的智能体已成为AI大模型落地的新载体,并且展现出强大的商业化前景。

所谓智能体,又叫AI Agent,是以AI大模型作为基础,构建的可以进行交互、完成特定任务、或提供专业知识的智能系统或应用程序。

通俗说,智能体可以体现为,装在传统软件App里的AI插件,也可以是一个独立的AI APP。

相比较传统的SaaS需要完全由人工来操作完成,智能体最大的特点是,接受互动对话指令,并直接产出结果,包括生成视频、图片、文章或完成一件工作。简言之,所有的AI 应用都可以称之为智能体。

OpenAI首席执行官Sam Altman曾提出,未来每个人都可以拥有一个智能体。

Salesforce首席执行官Marc Benioff更是直言,AI的未来发展不在于大语言模型,而在于开发AI自主代理,即智能体。

产品智能化已经是SaaS厂商在新时代下必须迎接的事实,在一些TO B场景内,许多传统SaaS应用在AI加持下获得了新的发展。

比如,做电商服务的有赞最新推出了“加我智能”功能,其智能体功能包括商机指引、智能托管、营销专家、智能经营报告、智能穿搭、智能销售等等。

正是有赞创始人白鸦预言,未来的生意,数字化是基础,客户运营是抓手,所有这些都可以交给智能技术完成。“我非常坚信,最多10年,最快5年之内,中国人一周只需要工作4天。用工具解决问题,数字化和智能化带来效率提升是必然的趋势。”

再比如,做教育的粉笔,最新升级了粉笔AI老师产品,这个智能体以对话形式存在,具备AI导练、学习规划、考情咨询、智能督学等在内的多项功能,可以帮用户规范的作答思路,形成标准化作答习惯,并详细解答答案,优化学习方向和可改进细节,主打一个专业、细心的教育陪伴。

互联网大厂中,百度、阿里、腾讯、字节跳动、华为等皆已布局智能体赛道,并推出一站式智能体开发平台,为开发者、创作者提供更为便捷的操作应用路径。

美国著名孵化器YCombinator最新一期圆桌讨论中提出观点:垂直AI智能体的规模可能是SaaS的十倍。

美国一线AI从业者提到,AI大模型技术正在重塑软件行业。如果说2004年在浏览器中可以增加XML HTTP请求这个功能,开启了互联网应用程序的新时代,带来了整个SaaS软件行业的20年繁荣;那么大型语言模型——LLM的出现,则是开启了智能体时代的新篇章。

这一切正在发生。

QuestMobile最新报告提到,当下LLM的落地应用在网页端、移动端都已比较成熟,正逐步拓展至智能硬件端,不断深入用户日常生活并提供更自然便捷的交互体验。

市场研究机构 Research and Market在11月11日发布的报告中指出,未来五年AI智能体的市场规模将增加420亿美元。

在腾讯研究院最新发布的《2025数字科技前沿应用趋势》中指出,AaaS催化AI原生应用落地将是明年大趋势之一。

AI的新时代已经势不可挡。

声明:本文内容仅代表该投稿文章作者观点,不代表蓝鲸号立场。 未经授权不得随意转载,蓝鲸号保留追究相应责任的权利