简体中文 < 文章列表 - 数字今日 (DigitalToday)

搜索关键词合成数据集

Industry

NVIDIA在韩开放700万条合成人物画像数据，加速复制“CUDA式”生态路径

NVIDIA近期在韩国持续加码AI资源布局，先后在Hugging Face发布并开放包含700万条韩语合成人物画像的Nemotron-Personas-Korea数据集，并追加发布多模态推理模型Nemotron3 Nano Omni。业界认为，NVIDIA正通过模型、数据、框架和硬件四个层面同步推进生态布局，在降低开发门槛的同时，进一步把训练和推理的最优环境引向自家GPU技术栈。

Industry

NVIDIA：AI芯片竞争转向端到端效率，Blackwell在MoE推理中较上一代Hopper快55倍

NVIDIA在首尔举行的开发者活动上表示，AI竞争重心正从单一芯片参数比拼转向覆盖预训练、后训练、推理及Agent应用的端到端效率。公司首次披露实测数据称，Blackwell GPU在混合专家（MoE）推理中的速度较上一代Hopper提升55倍，并介绍了NDFP4、PivotLM、NemoTron Cascade等多项提升训练与后训练效率的新进展。

AI & Enterprise

Cloudera：合成数据可帮助企业降低LLM隐私风险

Cloudera表示，随着大语言模型（LLM）和AI代理加快进入企业业务，训练、测试和评估所用数据越来越多地涉及个人可识别信息（PII）、受监管数据及企业专有业务内容，隐私与合规风险随之上升。该公司认为，合成数据能够在不暴露真实记录的情况下支持AI开发与测试，并将SFT、模型评估以及RAG与AI代理相关数据治理列为三大重点应用方向。