文|数智商业秀 郑久宇
编辑|杨肖若
去年此时,科技圈几乎都沉浸在AIGC元年带来的技术新浪潮之中,如今从AI技术当前发展阶段来看,AIGC的确给很多社交玩法以及商业模式带来了新的启发。
这一年,「商业秀」和旗下的视频栏目「一览弘观」也做了很多和数字化、智能化以及AI大模型相关的图文和视频,来记录这个被AI影响和推动变革的商业时代。
本期我们推出第一篇科技行业总结,主题是——激荡2023:数智化时代千帆竞发,未来何处发力?
“千帆竞发”,基本概括了2023年这一年来国内外科技企业的竞争态势;何处发力,主要指的是这些AI技术和大模型,到底能在哪些具体领域和场景落地、开花和结果。
如果展望2024年及未来科技行业发展的十年,数字化和智能化依然是很重要的主线。数字化层面,我们应该更关注数据要素全产业链,公共数据及企业数据的价值显现,以及数据交易对数据价值的提振;智能化层面,应该关注 AI 视频,以及AI赋能端侧带来的产业机遇。
01 挖掘数据的乘数价值
在我国,数字经济已经成为发展最快、创新最活跃、辐射最广的经济活动。根据中国信通院统计,2022年我国数字经济规模达到了50.2万亿元,同比增加约4.7万亿元占到GDP比重的41.5%,可见它对咱们国家经济的重要。
2023年3月,中共中央、国务院印发《党和国家机构改革方案》,部署组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,由国家发展和改革委员会管理。
10月25日,国家数据局正式揭牌。国家数据局局长刘烈宏提出“数据要素×”行动,推动数据在不同场景中发挥出千姿百态的乘数效应。
随后的2023年下半年,上海、福建、广西、广东、无锡、海南等多地区密集出台数据要素市场发展的相关政策,进一步明确数据要素产业的发展目标,完善当地数据要素市场基础制度体系建设。
而就在2024年1月初,国家数据局等17部门联合正式印发《“数据要素×”三年行动计划(2024—2026年)》,正是为了推动数据在不同场景中发挥乘数效应。
来源:国家数据局
众所周知,数据要素作为生产要素之一,其投入生产的途径可以概括为三次价值释放的过程。其中,数据要素的第三次价值释放是流通赋能,也就是让数据流通到更需要的地方,让不同来源的优质数据在新的业务需求和场景中汇聚融合,实现双赢、甚至多赢的价值利用。
此外,数据流通可以打破“数据孤岛”,满足数据供需双方的价值需求,而数据交易是实现数据要素三次价值的重要手段。
数据要素的三次价值释放。来源:中国信通院
未来,如果想要实现数据要素的三次价值,就必须通过数据交易。毕竟,数据的交易流通能进一步释放数据要素的价值。
在政策的推动下,全国多地加入数据交易链,启动“可信通”计划,实现“一地挂牌、全网互认”,推动全国多层次数据要素市场实现互联互通。而随着国际数据产品挂牌数交所,我国数据交易也进一步迈向国际化。
如今政策已经提供了足够多的支持,接下来就要看各行各业如何去加速数据价值的释放。
对于企业而言,在利用数据进行商业价值的进一步挖掘层面依然面临着一些挑战。
首先,企业应用大数据分析最大的挑战是存储、分析和数据的维护,这需要专业的团队;其次,数据整合仍是当今企业面临的挑战,一是数据收集的来源多,很难整合到同一个数据库中,二是数据具有时效性、变化快,这就要求企业要有一个强大的收集系统;再次,大数据的安全性一直是不可避开的挑战。尤其是在AI时代,数据安全成为一个更复杂的课题。
02 全球AI大模型“千帆竞发”
自2023年3月以来,随着以ChatGPT为代表的生成式AI引发新一轮科技浪潮,国内有超过20家的互联网企业竞相推出大模型。据不完全统计,国内10亿以上参数规模的大模型已发布了79个。
到7月6日的2023世界人工智能大会,更可谓“百模争流”,甚至形成了“千模大战”之势,可与当年互联网发展时期的“千团大战”相媲美。
同时,国内监管也跟上发展的步伐。2023年5月23日,国家互联网信息办公室2023年第12次室务会会议审议通过《生成式人工智能服务管理暂行办法》。2023年7月,国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》(下称“暂行办法”),自2023年8月15日起施行。
《暂行办法》提出对生成式人工智能服务实行包容审慎和分类分级监管,明确了提供和使用生成式人工智能服务的总体要求,提出了促进生成式人工智能技术发展的具体措施,还规定了安全评估、算法备案、投诉举报等制度,明确了法律责任。
《暂行办法》的出台,有利于规范AI大模型的商用环境,推进AI大模型在各领域的应用落地。通过审批上线、向全社会开放后的大模型将在更严格的监管环境下运行,同时也需要满足更多的合规性和安全性要求。
截止2023年11月底,我国有20余家AI大模型已备案,多家宣布要面向全社会开放部分功能的服务。其中8月31日,首批8家通过备案的AI大模型包括百度的“文心一言”、百川智能的大模型、商汤科技的“商汤商量SenseChat”、抖音的“云雀大模型”、智谱AI的“GLM大模型”、中科院的“紫东太初大模型”等。9月20日,360公司的“360 智脑”也获批开放。
自2023年11月4日以来,国内共11家公司的AI大模型产品获批,包括网易有道的“子曰”教育大模型、面壁智能的“面壁露卡 Luca”、昆仑万维的“天工”大模型、美团的“美团模型”、知乎的“知海图AI”模型、金山办公的“WPS AI”、蚂蚁集团的“百灵大模型”以及360公司的“奇元大模型”等。
随着国内各大厂商的AI大模型完成备案,我国的AI大模型应用有望进入加速落地期。这也意味着,整个行业卷到了落地应用阶段。尤其是首批向公众开放的大模型产品,会在用户拉新方面占据一定先发优势,同时随着To C落地场景的开放,大模型产品在商业化想象空间上也被放大。
麦肯锡《生成式人工智能的经济潜力:下一波生产力浪潮》报告显示,如果将分析的63种生成式AI应用于各行各业,将为全球经济每年带来2.6万亿至4.4万亿美元的增长,而且这一预测还未将所有的生成式AI应用计算在内。有分析称,如果将尚未研究的应用计算在内,生成式AI所产生的经济影响可能会翻倍。对于中国的大模型而言,在经历了备案合规后,2024年也将迎来落地应用、百花齐放的最好时代。
放眼海外,2023年11月7日,OpenAI召开了首届开发者大会,数据显示,ChatGPT目前每周有超过1亿活跃用户,有约200万开发者使用API等进行开发,与超过92%的财富500强公司合作。
OpenAI 与谷歌相继推出新品,GPT-4 Turbo提速减价,降低使用成本。与GPT-4相比,GPT-4 Turbo输入token价格降低了3倍,输出token价格降低了2倍,综合费率比GPT-4便宜了超过2.75倍。同时,GPT3.5 Turbo在16k的成本也降低了。推出GPT-4 Turbo,六大方面实现更新。
在开发者大会上,OpenAI推出了全新的GPT-4 Turbo模型,并在上下文长度、新模态等六个方面实现了更新,让OpenAI的产品在性能大幅提升的同时降低了使用门槛,版权盾的引入还提升了用户使用产品的安全性。
2023年12月6日,谷歌CEO官宣了Gemini 1.0版的正式上线。Gemini大模型是原生多模态大模型,目前Gemini1.0有三个不同的版本:Gemini Ultra:规模最大、能力最强,用于处理高度复杂的任务;Gemini Pro:在各种任务上扩展的最佳模型,适用于多任务;Gemini Nano:用于端侧(on-device)任务的最高效模型,适用于特定任务。
此外,根据谷歌自身对Gemini Ultra版本的测试,Gemini Ultra的测试结果大幅提升,其中在MMLU(大规模多任务语言理解数据集)中的得分率高达90.0%,首次超越了人类专家。
在开放模态中,国产大模型在自然语言处理、机器翻译、智能客服、智能推荐等各领域得到了广泛应用。但大多数模型依然聚焦在对话、问答、写作、代码和图片的生成层面上。如果说,过去的一年,国产大模型一直处于追赶ChatGPT的状态。那么接下来,追赶的节奏恐怕要加快一些,并且还需要针对不同场景进行定制化开发和应用。因为,2024年也是国内大模型走向商业落地的关键一年。
03 AI+视频领域竞争加剧
如今,AI视频领域竞争正在进入白热化阶段。Runway在不到一年的时间内相继推出了Gen-1。近期,RunwayGen-2也发布更新,生成视频的清晰度可达到4K,视频质量明显提升。
而Meta在2023年11月,Meta就一连解锁两个重磅研究Emu Video和Emu Edit,为此前发布的多模态模型Emu的变体。其中,Emu Video是一种基于扩散模型的文本到视频生成方法,能够基于文本生成512x512的4秒高分辨率视频,在生成质量和文本忠实度上表现较好。
经过Emu Video处理过的视频,具有高度的风格化,当图像动起来、添加运动之后,一切变得如此栩栩如生;Emu Edit可以仅仅基于文本指令就对图像进行编辑,通过识别和生成任务,编辑得格外精确。Emu Edit对于指令遵循得如此精准,以至于能确保输入图像中与指令无关的像素保持不变。
这两个新研究的发布,让Meta的多模态模型性能大幅提升,在AI视频领域刻下新的里程碑。
2023年11月29日,美国AI初创公司PikaLabs发布了重磅产品Pika1。在Pika1.0中,通过文字就能够生成非常贴近且生动的视频。不仅如此,使用图片、视频还可以对它们进行“再加工”,可以根据已有的素材直接扩展视频,生成不同高宽比的内容,还能够支持对于视频的实时编辑和修改等,几乎对标Runway家族现有的所有功能,现已开启申请试用。
Pika1.0核心功能首先包括文生视频,即语意理解能力、生成视频的连贯性和清晰度表现较好。时长方面,目前生成视频的时长为3s,暂落后于竞品Runway,Runway在8月的更新中将生成视频最高时长从4秒延长至18秒。
回到国内,多个AI视频工具也取得了重要进展。比如字节团队推出视频生成新方法PixelDance,可在生成视频中实现较好的动态性;并计划在未来数个月内推出产品;Stablilityai推出视频生成工具StableVideoDiffusion,支持文本到视频、图像到视频生成;2023年12月5日,美图发布了MiracleVision4.0版本,将于今年1月开始逐渐支持美图旗下各产品,主推AI设计与AI视频两大能力。
可见,AI生成内容竞争已经开始从文本和图片生成,转向了视频生成。随着技术突破,AI视频生成技术将在短视频、短剧等行业带来更多新的可能性。
04 AI+PC及智能驾驶成重要的落地场景
随着AI大模型面向行业应用多点开花,金融、交通、医疗等重点领域厂商纷纷发布行业大模型,推进 了AI 大模型在行业端的赋能落地。而AI 赋能终端,端侧应用遍地开花,AIPC及智能驾驶也成为重要场景。
比如多家手机厂商将AI大模型引入端侧,AI+PC多方面适配。相较于云侧,AI大模型在端侧的应用具有较低的时延性,且本地部署还能够更好地保障数据的安全性。在手机端,各大智能手机厂商纷纷将大模型引入智能手机,AI端侧应用也遍地开花。
比如荣耀Magic6官宣搭载自研的7B端侧AI大模型;小米升级小爱大模型,表示目前手机端侧已经初步跑通;华为宣布手机系统接入盘古大模型,开启内置大模型的语音助手小艺的众测,vivo、oppo也纷纷官宣自研大模型,表示推进自研大模型在端侧的应用。
电脑端,在2023年度Tech World大会上,联想集团展示了首款AI PC,并表示AI PC将是能够创建本地知识库,运行个人大模型,支持人工智能计算,运用自然交互的更强大、更具创造能力的智能生产力工具。联想集团与英特尔公司、爱奇艺三方还签署了合作备忘录,将在AIPC领域展开深度合作。PC与AI大模型在多方面都具有很好的适配性,将会是AI大模型在端侧应用的核心落地成果。智能驾驶是AI大模型在端侧应用的重要场景。比如特斯拉推出全新的端到端AI自动驾驶系统,并在2023年11月提出已开始向员工推出全自动驾驶(FSD)V12版本。马斯克在此前的试驾直播中表示,FSD Beta V12是有史以来第一个端到端AI自动驾驶系统(Full AI End-to-End),从头到尾都是通过AI实现,没有编程,没有程序员写一行代码来识别道路、行人等概念,全部交给了神经网络自己思考。而且,V12的C++代码只有2000行,而V11有30万行。
2023年11月底,鸿蒙智行首款轿车智界S7正式发布。智界S7率先实现HarmonyOS 4上车,在个性玩法、高效性、智慧能力、流畅性、安全隐私等各方面再次突破;车载智慧助手小艺拥有华为盘古大模型加持,成为可靠的私人用车顾问;智界S7搭载持续进化的HUAWEI ADS 2.0高阶智能驾驶系统,还在业界首发泊车代驾功能,解决用户多处痛点难点。如今,很多车企都把精力放在了智能驾驶上,智能化成为一家车企最核心的竞争力之一,而智能驾驶的成熟和落地,不仅依赖高效的算力、完善的算法模型和大量高质量、安全无偏差的数据,还需要科技企业的跨界助力。
2023年,随着汽车圈+科技圈的组合不断增加,接下来合作共赢才是智能驾驶规模性落地的最佳出路。
结语:数智化是未来发展的主线
进入2024年以及接下来的五年,科技行业依然要把握数字化和智能化主线。数字化层面,要挖掘数据要素全产业链、公共数据运营、企业数据价值显性、数据交易所互联互通以及国际数据产品挂牌带来的机遇;而智能化层面,要关注新模型推出对 AI 产业链需求的整体提振、AI 视频领域的突破对AIGC带来的影响、国内 AI 大模型的加速落地,以及 AIPC和智能驾驶产业链的机遇等。