搜索关键词 混合专家架构
AI & Enterprise
TechRadar:大模型竞争重心转向多语言能力与本土语境理解
TechRadar指出,大模型下一阶段的竞争力将更多取决于多语言能力和对本土语境的理解,而非单纯比拼模型规模或算力。随着AI在全球加速落地,以英语为中心构建的基础模型正日益显现瓶颈,不少模型仍停留在将英语知识转译为其他语言的层面。面向金融、医疗、公共服务等场景,业界认为,模型需要直接基于不同语言体系开展推理,并完善数据、架构和评测体系,以支撑主权AI建设。
AI & Enterprise
Alibaba旗下Qwen·Tongyi Lab发布Qwen3.5-Omni:主打实时交互的全模态模型亮相
Alibaba旗下Qwen·Tongyi Lab发布全新全模态模型Qwen3.5-Omni,支持文本、图像、音频、视频理解及语音生成,强调实时交互与长序列处理能力。该模型最大序列长度达25.6 万,可处理最长10小时音频或400秒音视频输入,并提供Plus、Flash、Light三款版本及离线API、实时API接入。
AI & Enterprise
iPhone本地运行近400B参数大模型迎来新进展
AI研究员 Dan Woods 采用“LLM in a Flash”方案,将模型权重存储在外部闪存中,并在需要时调入内存,在一台配备209GB存储、48GB内存的 MacBook Pro 上运行约3970亿参数的模型。随后,ANEMLL 又在 iPhone 17 Pro 上完成类似实验。业内认为,这一进展或成为AI能力由云端向端侧延伸的一个信号。