搜索关键词 语音识别
AI & Enterprise
Hudson AI亮相NAB Show 2026,推出Agentic Localization功能
Hudson AI在NAB Show 2026发布用于媒体制作和配音的语音AI方案“Hudson Studio”,并展示Agentic Localization功能。该功能由智能体贯穿媒体本地化从策划、执行到质量控制(QC)的全流程,重点推动QC环节自动化。公司称,目标是将人工QC时间缩短至1小时以内。
AI & Enterprise
Google DeepMind发布Gemma 4,性能升级并转向Apache 2.0开源许可
Google DeepMind正式推出开源模型Gemma 4,覆盖E2B、E4B等端侧版本,以及26B MoE、31B Dense等大模型,最高支持25.6万token上下文窗口。多项基准测试成绩较前代明显提升,其中AIME、Codeforces ELO和GPQA Diamond表现尤为突出:Gemma 4 31B在GPQA Diamond上取得84.3%,26B MoE取得82.3%。与此同时,Gemma 4改用Apache 2.0许可,进一步降低了商业化应用和二次开发门槛。
AI & Enterprise
韩国铁路技术研究院完成智能疏散引导系统物流中心实测
韩国铁路技术研究院近日在Lotte Global Logistics中部Megahub Terminal完成“智能疏散引导系统”现场测试。该系统可通过磁吸方式安装在货架上,并以激光在地面连续投射疏散箭头;同时与疏散控制系统通过无线通信联动,配备环境传感器和AI语音识别功能,旨在提升大空间复杂环境下的疏散效率。
-
AI & Enterprise
Google面向iPhone推出Google AI Edge Eloquent:支持离线转写并实时整理口语
-
AI & Enterprise
Google在iOS平台推出离线AI听写应用“Google AI Edge Eloquent”
-
Telecommunications & Media
The Verge:Amazon为Alexa与Echo历经多年试错与打磨
-
AI & Enterprise
微软发布3款自研AI模型,以更激进的定价抢占市场
-
AI & Enterprise
MISO Information Technology新增7项AI、XR等领域专利
-
AI & Enterprise
Alibaba旗下Qwen·Tongyi Lab发布Qwen3.5-Omni:主打实时交互的全模态模型亮相
-
AI & Enterprise
ETRI成立50周年:累计产业经济带动效应约494万亿韩元
-
AI & Enterprise
OpenAI与Anthropic加速布局AI代理,下一代模型竞争升温
-
AI & Enterprise
Cohere推出开源ASR模型Transcribe:2亿参数,可在消费级GPU运行
-
AI & Enterprise
Selvas AI加码车载语音识别中间件,拓展Mobility AI业务
-
Games & Commerce
韩国游戏公司加码反外挂:AI识别、刑事追责齐发力,治理仍存瓶颈
-
AI & Enterprise
KT中标韩国消防厅下一代119综合系统总体规划项目
-
AI & Enterprise
Clion取得基于RAG的实时AI口译专利,布局公共服务市场
-
Industry
Arduino发布边缘AI平台Ventuno Q,搭载Qualcomm Dragonwing IQ-8
-
AI & Enterprise
ElevenLabs与WITZ启动PoC,测试Bae Hanseong声音在AI语音中的应用