可生成政治人物图像,马斯克旗下xAI发布Grok-2“手撕”OpenAI

①Grok-2对生成图像的限制似乎并没有那么严格,特别是在政治人物或真实公众人物方面。 ②OpenAI明确规定,其文生图模型设有护栏拒绝要求生成真人包括候选人图像的请求。

图片来源:视觉中国

蓝鲸新闻8月15日讯(记者 朱俊熹)当地时间8月14日,埃隆·马斯克预告已久的新一代AI大模型Grok-2终于面世。马斯克对该模型寄予厚望,并且未对其生成内容范围过多限制,希望能借此进一步追赶OpenAI的领先地位。

马斯克旗下人工智能初创公司xAI本次共推出两款型号的产品,包括Grok-2早期预览版及Grok-2 mini。据xAI介绍,Grok-2相较于上一代大模型Grok-1.5取得了“重大进步”,在推理检索到的内容和工具使用能力方面表现突出。

在官方博客文章中,xAI公布了Grok-2的各项评测结果。大语言模型评测平台LMSYS将Grok-2的早期版本列为全球排名前五的聊天机器人模型,位列OpenAI的ChatGPT-4o、谷歌的Gemini 1.5 Pro之后。此外,Grok-2在多个推理、阅读理解等评测集上的表现都能比肩其他前沿模型,但在代码生成、数学等方面仍略微落后于GPT-4o。

xAI还与一家8月1日刚刚成立的AI图像和视频创企Black Forest Labs达成合作,在Grok-2中引入其FLUX.1模型,为用户提供图像生成服务。其他竞争对手也在类似的AI聊天助手中推出了生图功能,ChatGPT基于OpenAI文生图模型DALL·E 3,谷歌Gemini曾支持调用Imagen 2模型创建图像,但上线不久就因生成错误的历史人物图像,涉嫌种族歧视而被迫撤下,至今仍未重新推出。

不同于现有聊天机器人,Grok-2对生成图像的限制似乎并没有那么严格,特别是在政治人物或真实公众人物方面。不少用户在社交媒体上晒出了使用Grok-2生成的图像,包括美国前总统、共和党总统候选人特朗普举着两把手枪发射,或是特朗普坐着SpaceX火箭飞向天空等图片。

OpenAI今年1月曾明确规定,为更好地应对大选年,将致力于防止滥用其AI工具的行为,包括误导性的“深度伪造”、规模性的影响行动或冒充候选人的聊天机器人。以其生图模型DALL·E为例,OpenAI称设有护栏拒绝要求生成真人包括候选人图像的请求。在其开发者论坛中,一些用户讨论他们在使用DALL·E过程中发现的限制:该模型不允许创建政治家或其他公众人物的图像,不能包含特定真人或名人的姓名,也不支持生成受版权保护的角色。

Grok-2和Grok-2 mini已率先在社交平台X上开启测试,向付费用户开放使用。xAI表示,本月晚些时候将推出这两个型号的企业API。

与马斯克的“X宇宙”联动一直是xAI对外营销的招牌。该公司的宣传资料指出,xAI可以利用全球最大的社交媒体平台之一X的高质量数据进行训练。在马斯克的推动下,特斯拉的人才、芯片、资金都正在向xAI传输。7月底,马斯克还在X上发起投票,询问网友是否支持特斯拉向xAI投资50亿美元。在获得多数投票后,他表示特斯拉董事会将对该事宜进行讨论。

但马斯克的愿景或将面临监管机构的审查。8月,爱尔兰数据保护委员会对X平台提起诉讼,指控其在未经用户同意的情况下,擅自抓取用户数据用于Grok模型的训练。之后X同意暂缓使用欧盟用户的个人数据来训练其AI系统。

xAI成立于2023年7月,马斯克直言对标OpenAI竞争。今年5月,xAI完成了新一轮60亿美元融资,推高公司估值达240亿美元。马斯克自夸Grok模型的推进速度就像火箭,下一代Grok-3模型也正在加紧训练中,预计将在年底推出,能够达到与GPT-5相当甚至超越的水准。为此,xAI在建造一台连接10万块英伟达H100 GPU的超级计算机,为Grok-3提供算力支持。

与此同时,OpenAI却迟迟未披露GPT-5的最新进展。上周OpenAI表示,在10月即将举办的开发者大会上,不打算发布下一个旗舰模型,而是专注于更新其API和开发者服务。