●AIでくずし字を翻刻
個人的にも「面白い」と思ったのが、「くずし字」を自動的に読みって現代語に翻刻(翻訳ではないらしい)するAIだ。その昔、古文の授業でくずし字を読み解くのが難しくて本当に嫌いだったが、AIを使うことで、くずし字を現代語にすぐに変換してくれるという。
情報・システム研究機構データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員であり国立情報学研究所のタリン・カラーヌワット氏は「日本では1000年以上、くずし字が使われてきたが、1900年に教科書からくずし字が消えた。いまでは人口の0.01%以下の人しか読むことができない。しかも、今では図書館などで古い書物がデジタルデータ化されているが、画像が多くてアクセスできない。すべても書物を書き起こすと研究者一人当たり500年かかってしまう」と語る。
そこで、国文学研究資料館が持つくずし字のデータを学習させるとともに、1文字ずつくずし字を認識。これにより、1ページあたり2秒でくずし字を現代語として置き換えることに成功。書物にもよるが、1時間あれば1冊の翻刻が可能になったという。
精度としては85%ほどなのだが「16冊の書物で試したデータに過ぎない。将来的に、学習が増えれば正確性も上がってくるはずだ」(タリン氏)とのことだ。
この連載の記事
-
第196回
トピックス
F1の裏に“レノボ”あり 500TBのレースデータを高速処理 -
第195回
トピックス
格安スマホ、キャリアより「シンプルで安い」とふたたび注目 -
第194回
トピックス
中国スマホメーカー、日本への攻勢強める 格安折りたたみスマホで勝負 -
第193回
トピックス
ドコモが狙う“スマホの次“ iPhoneから「Vision」の時代へ -
第192回
トピックス
KDDI「povo」世界進出へ “黒子に徹する”新ビジネスとは -
第191回
トピックス
スマホ基地局を安くする ドコモとNECが世界展開する「オープンRAN」とは -
第190回
トピックス
KDDI対ソフトバンク “快適な5G”競争に本気出す -
第189回
トピックス
ドコモはユーザーの期待を裏切らないよう、品質改善に資金をつぎ込んでいくべきだ -
第188回
トピックス
楽天・三木谷氏、モバイルの次は“AI” アマゾンとの違い強調 -
第187回
トピックス
能登半島地震、携帯キャリア“異例”の共同会見 ライバル同士が手を取り合い、復旧活動する時代に? -
第186回
トピックス
ソニーのXRは圧倒的に解像度が高かった アップルと違い、クリエイターに特化した作りに - この連載の一覧へ