搜索关键词 图像识别
AI & Enterprise
NVIDIA发布目标检测模型LocateAnything:支持图片、界面截图和文档定位
NVIDIA发布高速目标检测视觉语言模型LocateAnything,可在照片、应用界面截图和文档中快速定位物体、UI元素及文本区域。该公司称,模型在重复目标的细粒度区分和文本识别方面优于Qwen3-VL和REX-Omni,并已在Hugging Face发布开源版本,同时提供演示应用。
Industry
Galaxy S26 Ultra飞行模式下连续测试72小时:本地AI响应快,温升普遍不足1℃
媒体在飞行模式下对Galaxy S26 Ultra进行了连续72小时测试,模拟日常办公、海外出差和内容创作三类场景,考察Snapdragon 8 Elite 5代在完全离线条件下运行本地AI的表现。结果显示,语音转写、翻译、摘要等任务大多可在数秒内完成,机身表面温升普遍不超过1℃;APV 8K编码带来的温升最明显,但最高温升场景下也可在约30分钟内回落,设备总耗电不足10%。
AI & Enterprise
SenseTime推SenseNova U1,主打成本效率应对AI竞争
SenseTime近日发布多模态模型SenseNova U1,可在同一系统内统一处理文本、语音和图像信息。面对美国制裁及中国AI市场竞争升温,公司强调成本效率优势,而非单纯追求极致性能,并将业务重心进一步转向企业客户及“模型+服务+基础设施”一体化布局。业绩方面,公司去年净亏损同比收窄58.6%,并于下半年实现自上市以来首次EBITDA转正。