搜索关键词 100万token上下文
Industry
NVIDIA发布RTX Spark:瞄准Windows笔记本本地大模型运行
NVIDIA发布面向Windows笔记本的新款AI SoC“RTX Spark”,主打端侧大模型运行。该芯片由NVIDIA与MediaTek联合开发,采用Arm架构,最高支持128GB LPDDR5X统一内存和600GB/s内存带宽,可在本地运行最高1200亿参数的大模型。Microsoft及多家PC厂商计划于今秋推出搭载该芯片的终端设备。
AI & Enterprise
DeepSeek发布V4:主打高性能低成本,并适配华为Ascend
DeepSeek发布新一代模型V4,并同步推出V4-Pro和V4-Flash两个版本。新模型主打长上下文处理能力和低成本优势,最高支持100万Token上下文。公司同时称,V4已完成对华为Ascend芯片的优化适配,被认为将进一步促进开源AI生态与国产算力的协同。
AI & Enterprise
DeepSeek发布V4系列模型:开源低价,对标Opus 4.7和GPT-5.5
中国AI公司DeepSeek推出V4系列模型,主打开源和低价。其中,V4 Pro采用1.6万亿参数MoE架构,支持100万token上下文;V4 Pro和V4 Flash均基于约33万亿token完成训练,多项基准测试表现接近Opus 4.7和GPT-5.5。市场分析认为,其性价比优势或推动企业采用,但地缘政治和使用依赖风险仍需关注。