Skip to Main Content

九コレで学ぶ「くずし字」の世界: 五:くずし字とテクノロジー

古い時代の資料に書かれた、読めそうで読めない「くずし字」。九大コレクション(九コレ)で九大所蔵の資料を眺めながら、「くずし字」の世界に触れてみましょう。

くずし字×テクノロジー

くずし字の世界にも、ICT技術の波が押し寄せています。
くずし字を学習するためのアプリがリリースされ、オンラインでくずし字を読むコミュニティができ、くずし字を高精度で識別するAIが開発されつつあります。
ここでは、ICT技術によって広がったくずし字の世界について、その一端を紹介します。

※本ガイドは2020年10月に執筆されました。

くずし字×アプリ

くずし字学習支援アプリKuLA

スマートフォンでくずし字を学習できるアプリです。
Android版iOS版があります。

  • クイズ形式でくずし字の字形を覚えられる「まなぶ」機能
  • 『方丈記』などの古典籍を読みながら実力を確かめられる「よむ」機能
  • SNSに接続して他の学習者と情報を交換できる「つながる」機能

の三つの機能があり、スマホで手軽にくずし字を学べます。

くずし字×ソーシャルネットワーク

活字化されていない歴史資料は、現代にもまだたくさん残されています。個々人で解読できる資料の量は、物理的にどうしても限界がありますが、インターネットを活用し多くの人が関わることで、膨大な資料の解読が一挙に進むことがあります。

その最たる例が、「みんなで翻刻」プロジェクトです。

みんなで翻刻 MINNA DE HONKOKU

京都大学古地震研究会により、地震史料の翻刻プロジェクトとして始動しました。
プロ・アマ問わず多数の人が資料の翻刻に関わり、難しい箇所は互いに修正しあうなどして翻刻を進めた結果、これまで(2020年現在)に5000人により600万字の史料が翻刻されたとのことです。
その後、国立歴史民俗博物館、東京大学地震研究所も加わり、現在進行形で開発が進められているプロジェクトです。

くずし字×AI

AIを利用したくずし字解読の研究も盛んに行われています。
画像からくずし字を自動で判別・判読するAIの開発が進められているのです。

くずし字チャレンジ!

「くずし字チャレンジ!」は、人文学オープンデータ共同利用センターが展開する、くずし字認識の研究開発を促進する取り組みです。以下のような活動が展開されています。

  • 日本古典籍くずし字データセット国文学研究資料館や関係機関が公開する古典籍の画像データから文字データを抽出して提供。その規模は、2019年11月現在、約4000文字種10万字にも及びます。(詳しくはこちら
  • KuroNetくずし字認識サービス:センター長(2020年現在)の北本朝展氏らにより開発された文字認識システム。センターのウェブサイトにて利用することができます。(詳しくはこちら
  • 各種コンペ・コンテスト:研究開発を促すため、国際的なコンペも開催しています。2019年度は第23回PRMUアルゴリズムコンテスト「くずし字認識チャレンジ2019」Kaggleコンペティション「くずし字認識」が行われ、多数の開発者が参加しました。

こうした動きは各種メディアでも取り上げられています。
(NHK)Web特集「くずし字」AIが解読 ラーメン判別法も応用!

今後の技術の進歩にも注目です。

【追記】くずし字読解アプリ みを 登場

2021年8月、人文学オープンデータ共同利用センターがついに、くずし字を読めるアプリをリリースしました。

AIくずし字認識アプリ みを miwo

AIが画像を分析し、くずし字を認識して表示するアプリです。
Android版iOS版があります。
源氏物語「澪標(みをつくし)」にちなんでの命名です。澪標は、水辺を行く舟の案内のために立てる杭のこと。そんな澪標のように、くずし字資料を読む人の案内になることを目指して名づけられました。

下記の動画のように、持っている画像を読み込ませたり、カメラで資料を撮ったりして、その場でくずし字を読み、現代の活字に変換させることができます。

ROIS-DS CODH. (2021.8.27).
4分でわかる「みを」アプリの使い方.

ROIS-DS CODH. (2021.4.19).
「みを(miwo)」デモ @ 慶應義塾ミュージアム・コモンズ.

「100%完璧な精度」というわけにはいきませんが、くずし字が読めない人にとっては、資料の内容を推測する手がかりを示してくれますし、くずし字が読める専門家にとっても、実際の調査を効率化する手助けを与えてくれるアプリです。

開発にあたっては、「くずし字×AI」で紹介したKuroNetや、Kaggleくずし字認識コンペで1位となったtascj氏が開発したくずし字認識モデルが使用され、また日本古典籍くずし字データセットが活用されているとのことです。

まさに、くずし字に関するAI技術を結集して作られたアプリ、と言えるでしょう。

(参考)みを(miwo)とは?人文学オープンデータ共同利用センター(2021.9.8参照)

次は…