写真=KAIST。キム・ヒョヌク教授の研究チームが次世代点字翻訳エンジン「K-Braille」を開発した。

KAISTは3月13日、融合人材学部リハビリ人工知能研究室のキム・ヒョヌク教授の研究チームが、次世代点字翻訳エンジン「K-Braille」を開発し、大規模な性能検証を終えたと発表した。

点字翻訳は、書籍や文書、Webページなどの墨字情報を点字体系に変換する技術を指す。もっとも、韓国語の点字規定には分かち書きや記号、外来語表記などに多くの例外規則があり、自動化の難しさが課題となってきた。

従来の点字翻訳プログラムは、文字や記号を個別の規則に沿って変換する方式が中心だった。このため、英語などの外国語と韓国語が混在する表記や、複合的な単位記号、かっこ周辺の分かち書きといった複雑な規定への対応で誤りが生じるケースがあったという。

KAISTによると、K-Brailleは文の構造を踏まえて点字に変換するシステムだ。単純な文字置換ではなく、形態素解析と構文木(AST)解析を通じて文の構造や文脈を把握し、意味に即した変換を行う。

これにより、外来語と韓国語が混在する文章や複雑な記号の組み合わせ、単位表記など、改定後の点字規定に含まれるさまざまな例外的な表記にも、より正確に対応できるとしている。

精度検証には、韓国国立国語院が構築した国内最大規模の点字データセット「墨字―点字並列コーパス(NLPAK)」を用いた。一般文字と点字を対にした文が整理されたデータセットで、この中から1万7943文を抽出し、K-Brailleの変換結果と実際の点字を照合した。

その結果、点字規定への適合度を示す「実質点字翻訳規定準拠率」は100.0%を記録した。あわせて、正解データとの構造的な近さを示す形態素構造類似度の平均は99.81%だった。

韓国国立国語院の公式点字翻訳プログラム「点サラン 6.3.5.8」と同一の文セットで比較した検証でも、K-Brailleの方が高い翻訳一致率を示したという。

研究を主導したキム・ヒョヌク教授は、先天性の重度視覚障害がある研究者でもある。教授は「点字は視覚障害者にとって単なる記号ではなく、世界を読むための言語だ。この技術が情報アクセシビリティをさらに高め、韓国の点字翻訳AI分野における新たな技術基準を示す契機になることを期待している」とコメントした。

キーワード

#KAIST #K-Braille #点字 #点字翻訳 #人工知能 #形態素解析 #構文木 #韓国国立国語院 #NLPAK
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.