●AIでくずし字を翻刻
個人的にも「面白い」と思ったのが、「くずし字」を自動的に読みって現代語に翻刻(翻訳ではないらしい)するAIだ。その昔、古文の授業でくずし字を読み解くのが難しくて本当に嫌いだったが、AIを使うことで、くずし字を現代語にすぐに変換してくれるという。
情報・システム研究機構データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員であり国立情報学研究所のタリン・カラーヌワット氏は「日本では1000年以上、くずし字が使われてきたが、1900年に教科書からくずし字が消えた。いまでは人口の0.01%以下の人しか読むことができない。しかも、今では図書館などで古い書物がデジタルデータ化されているが、画像が多くてアクセスできない。すべても書物を書き起こすと研究者一人当たり500年かかってしまう」と語る。
そこで、国文学研究資料館が持つくずし字のデータを学習させるとともに、1文字ずつくずし字を認識。これにより、1ページあたり2秒でくずし字を現代語として置き換えることに成功。書物にもよるが、1時間あれば1冊の翻刻が可能になったという。
精度としては85%ほどなのだが「16冊の書物で試したデータに過ぎない。将来的に、学習が増えれば正確性も上がってくるはずだ」(タリン氏)とのことだ。
この連載の記事
-
第217回
トピックス
シャオミ台数急増 理由は安くても品質に自信大 -
第216回
トピックス
総務省の“アップルつぶし”か スマホ下取り価格規制 -
第215回
トピックス
クアルコム、経済圏拡大に“邪魔者” アームとの対立深まる -
第214回
トピックス
ドコモよりauとソフトバンクの体感品質が上がっている事実 -
第213回
トピックス
総務省がソフトバンクを刺しに来た? もう割引規制なんて撤廃すべきだ -
第212回
トピックス
「折りたたみスマホ」いまだに低調 欲しいと思える「何か」が足りない -
第211回
トピックス
KDDIローソン、狙いは“学生” 「無料ギガ」と「吊るし」でアピール -
第210回
iPhone
アップル「iPhone 16」シリーズ、オススメはこの2つ -
第209回
トピックス
スマホがどこでも買える今、ソフトバンクの“英断”は理にかなっている -
第208回
トピックス
通信品質の低下が指摘されるドコモ、大規模イベントで驚きの対策 -
第207回
トピックス
楽天モバイル好調のワケ 「三木谷キャンペーン」が金脈に - この連載の一覧へ