●AIでくずし字を翻刻
個人的にも「面白い」と思ったのが、「くずし字」を自動的に読みって現代語に翻刻(翻訳ではないらしい)するAIだ。その昔、古文の授業でくずし字を読み解くのが難しくて本当に嫌いだったが、AIを使うことで、くずし字を現代語にすぐに変換してくれるという。
情報・システム研究機構データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員であり国立情報学研究所のタリン・カラーヌワット氏は「日本では1000年以上、くずし字が使われてきたが、1900年に教科書からくずし字が消えた。いまでは人口の0.01%以下の人しか読むことができない。しかも、今では図書館などで古い書物がデジタルデータ化されているが、画像が多くてアクセスできない。すべても書物を書き起こすと研究者一人当たり500年かかってしまう」と語る。
そこで、国文学研究資料館が持つくずし字のデータを学習させるとともに、1文字ずつくずし字を認識。これにより、1ページあたり2秒でくずし字を現代語として置き換えることに成功。書物にもよるが、1時間あれば1冊の翻刻が可能になったという。
精度としては85%ほどなのだが「16冊の書物で試したデータに過ぎない。将来的に、学習が増えれば正確性も上がってくるはずだ」(タリン氏)とのことだ。
この連載の記事
-
第219回
トピックス
「ドコモ銀行」どう実現? 住信SBIネット銀買収の観測も -
第218回
トピックス
みずほ、楽天に助け船 ドコモは三菱UFJとタッグの可能性も -
第218回
トピックス
なぜグーグル「Pixel」はカメラが横並びなのか -
第217回
トピックス
シャオミ台数急増 理由は安くても品質に自信大 -
第216回
トピックス
総務省の“アップルつぶし”か スマホ下取り価格規制 -
第215回
トピックス
クアルコム、経済圏拡大に“邪魔者” アームとの対立深まる -
第214回
トピックス
ドコモよりauとソフトバンクの体感品質が上がっている事実 -
第213回
トピックス
総務省がソフトバンクを刺しに来た? もう割引規制なんて撤廃すべきだ -
第212回
トピックス
「折りたたみスマホ」いまだに低調 欲しいと思える「何か」が足りない -
第211回
トピックス
KDDIローソン、狙いは“学生” 「無料ギガ」と「吊るし」でアピール -
第210回
iPhone
アップル「iPhone 16」シリーズ、オススメはこの2つ - この連載の一覧へ