搜索关键词 合成数据集
Industry
NVIDIA在韩开放700万条合成人物画像数据,加速复制“CUDA式”生态路径
NVIDIA近期在韩国持续加码AI资源布局,先后在Hugging Face发布并开放包含700万条韩语合成人物画像的Nemotron-Personas-Korea数据集,并追加发布多模态推理模型Nemotron3 Nano Omni。业界认为,NVIDIA正通过模型、数据、框架和硬件四个层面同步推进生态布局,在降低开发门槛的同时,进一步把训练和推理的最优环境引向自家GPU技术栈。
Industry
NVIDIA:AI芯片竞争转向端到端效率,Blackwell在MoE推理中较上一代Hopper快55倍
NVIDIA在首尔举行的开发者活动上表示,AI竞争重心正从单一芯片参数比拼转向覆盖预训练、后训练、推理及Agent应用的端到端效率。公司首次披露实测数据称,Blackwell GPU在混合专家(MoE)推理中的速度较上一代Hopper提升55倍,并介绍了NDFP4、PivotLM、NemoTron Cascade等多项提升训练与后训练效率的新进展。
AI & Enterprise
Cloudera:合成数据可帮助企业降低LLM隐私风险
Cloudera表示,随着大语言模型(LLM)和AI代理加快进入企业业务,训练、测试和评估所用数据越来越多地涉及个人可识别信息(PII)、受监管数据及企业专有业务内容,隐私与合规风险随之上升。该公司认为,合成数据能够在不暴露真实记录的情况下支持AI开发与测试,并将SFT、模型评估以及RAG与AI代理相关数据治理列为三大重点应用方向。