昨今は歴史ブームで、その証拠に刀剣女子や歴女(歴史好きの女性)なるマニアの人達が現れ、脚光を浴びている。
一口に歴史といえども、さらにその中に様々な分野に枝分かれするのだが、古文書を読み解くのが好きな歴史マニアもわずかながら存在する。
漢字を崩した変体仮名、くずし字で記述されている古文書は現代人にとっては馴染みが薄過ぎて、ほぼ解読することが不可能だ。
ところが、古文書を読み解く歴史マニアの手にかかれば、スラスラと読み進めてしまうのだ。
もちろん、彼らもすぐに古文書を解読できるようになったのではない。
変体仮名・くずし字による記述の古文書を何度も反復して読み込んだりという、かなりの努力の末に現在、彼らは古文書を解読できるようになったわけだ。
ちなみに、彼らのようにくずし字をしっかりと読める人は数千人程度(人口の0.01%程度)といわれている。
これくらいしか古文書を解読できる人がいないとなると、歴史的価値のある文献が埋もれたままということを意味する。
そこで、もう少し変体仮名・くずし字を読むことのできる人達を増やすことができないか、変体仮名・くずし字を学習しやすくできないかとの目的でスマホアプリ「みを(miwo)」が開発された。
「みを」という名称は『源氏物語』第14帖「みをつくし」にちなんだ名前とのことで、「みをつくし」が人々の水先案内となっているのと同じように、「みを」アプリがくずし字資料の海を旅する案内となることを目指しているのだそうだ。
「みを」では、CODHが開発したくずし字認識モデルKuroNet、およびKaggleくずし字認識コンペで1位となったtascj氏が開発したくずし字認識モデルを用いており、これらのAIモデルの学習には、国文学研究資料館が作成しCODHが公開する日本古典籍くずし字データセットを活用しているとのこと。
■4分でわかる「みを」アプリの使い方
なお、「みを」のAIくずし字認識は決して完璧ではなく、くずし字認識結果には誤りが含まれることがあるので、そこのところはユーザ自身が正確な字を調べたり、確認したりが必要になってくる。
そんな不完全さがある「みを」ではあるが、全く変体仮名・くずし字を読めず、1から学習しようとしている人にとっては、まさに大海原に向かう際の航海図であることは誰の目にも疑いの余地がない。
■みを(miwo) – AIくずし字認識アプリ | ROIS-DS人文学オープンデータ共同利用センター(CODH)
http://codh.rois.ac.jp/miwo/