据CNBC当地时间14日报道,Alibaba、ByteDance、Kuaishou等中国企业近期接连推出AI新模型,产品布局从机器人感知延伸至视频生成等多个方向。
其中,Alibaba旗下DAMO Academy发布了面向机器人环境感知和物体识别的模型RynnBrain。演示视频显示,搭载该模型的机器人能够抓取橙子并放入篮中,也可以从冰箱中取出牛奶。
Alibaba介绍称,RynnBrain提升了模型对时间与空间的理解能力,在处理复杂任务时也能保持较稳定的表现。Hugging Face研究员Adina Yakefu评价称,RynnBrain不只是对指令作出即时反应,还能记住事件发生的时间和位置,并持续完成后续任务。
ByteDance则发布了文生视频模型Seedance 2.0。该模型仅凭文本即可生成写实视频,也支持基于用户提供的视频或图片进行生成。AI内容创作者Billy Boman表示,在2023年前后,AI视频普遍时长较短、质量也相对有限,而现在生成更接近现实的画面已变得更加容易。Seedance 2.0也因可基于人物照片生成配音的功能引发争议,部分功能目前已被暂停。
Kuaishou方面推出了Kling 3.0,可生成最长15秒的写实视频及多语种音频,被视为Seedance 2.0的直接竞争对手。受相关业务进展带动,Kuaishou股价近期累计涨幅已超过50%。
除上述公司外,Zhipu AI近期还发布了强化编码能力的开源大语言模型GLM-5;Minimax则推出了强化AI智能体能力的开源模型M2.5。
记者信息