KAIST融合人才学院康复AI研究室Hyunwook Ka教授团队开发出新一代盲文点译引擎K-Braille,并完成大规模性能评测。图片来源:KAIST

KAIST于13日表示,融合人才学院康复AI研究室Hyunwook Ka教授团队开发出新一代盲文点译引擎K-Braille,并完成大规模性能评测。

所谓点译,是指将书籍、文档、网页等普通文本信息转换为盲文的过程。不过,韩语盲文规范在空格、符号、外语标记等方面存在多种例外规则,因此要实现高精度自动点译并不容易。

目前,视障人士使用的点译程序大多仍以简单规则为基础,对文字或符号进行直接转换。在英语等外语与韩语混排、复合单位符号、括号及空格等复杂规范的处理上,现有程序曾出现误译情况。

KAIST介绍,K-Braille的核心在于“先理解句意,再进行点译”。与现有程序仅对字符或符号进行替换不同,该系统通过形态素分析和句法结构分析解析句子结构与语境,在理解语义后再转换为盲文,因此能够更准确地处理外语与韩语混排、复杂符号组合、单位标记等新版盲文规范中的多种例外情况。

为验证系统准确性,研究团队采用了韩国国立国语院构建的韩国国内最大规模盲文数据集“墨字-盲文并行语料库(NLPAK)”。该数据集收录了普通文本与盲文一一对应的句子。团队从中抽取1.7943万句,针对K-Braille输出结果与语料标准答案之间的一致性进行了全量评测。

评测结果显示,用于衡量系统对盲文规范实际遵循程度的点译规则实际遵循率达到100.0%;反映点译句子结构与标准答案接近程度的点译形态素结构相似度平均值为99.81%。在与韩国国立国语院官方点译程序“Jumsarang 6.3.5.8”基于同一语句集进行的对比测试中,K-Braille也表现出更高的一致率。

Hyunwook Ka表示,对视障人士而言,盲文并不只是简单的符号,而是“阅读世界的语言”。他还称,希望这一技术进一步提升视障人士的信息获取可及性,并为韩国盲文翻译AI领域提供新的技术标尺。

关键词

#KAIST #K-Braille #盲文点译 #形态素分析 #句法结构分析 #NLPAK #韩国国立国语院 #无障碍
版权所有 © DigitalToday。未经授权禁止转载或传播。