凸版印刷(株)(金子眞吾社長)は、くずし字で書かれた歴史的資料の利活用を促進するビューア「ふみのは」を開発。5月から同ビューアを用いた公開用データ制作サービスの提供を開始する。同社は、江戸期以前のくずし字で記されている古典籍の文字を判別し、テキストデータに変換する光学文字認識(OCR)技術を2015年に確立。大学や研究機関と共同で実証実験を行っている。今回開発したビューアは、一般的なWebブラウザで、歴史的資料の原本画像の上に翻刻や多言語翻訳文を重ねて表示することが可能。従来の原本画像と翻刻文の画像を重ねて表示する方法とは異なり、翻刻文をテキストとして扱えるため、全文検索やインターネット上の横断検索などにも対応している。同開発により、くずし字で書かれた歴史的資料がテキストデータとして容易に扱えるようになり、全国各地に眠る貴重な歴史的資料の利活用推進が可能になった。
くずし字翻刻を手軽に公開
PJ web newsより