- HOME
- 2013 Jul. Vol.60
インターネットの世界では、日々、 膨大な情報 1 が蓄積されています。一見、どんどん便利になっているように見えますが、実はそれらの情報は、内容の検証や整理がされないままネット上に「置きっぱなし」にされているようなもの。増えれば増えるほど、内容の精査や正しい情報へたどり着くことが困難になっていきます。SNSなどの発達により情報発信の手段ばかりが進展する一方で、「信頼できる情報を選別する手段」はほとんど開発が進んでいない、というのが現状です。この状況を改善するために、「次世代検索技術」の開発を研究のテーマとしました。
- 1 解説:
- 2012年に世界で生産されたデータは2.8ZB(1テラのHDD約28億個分)になるという。
皆さんは、グーグルやヤフーで検索すれば「最も信頼性が高い情報」が上位に表示されると思っていませんか?実際には、それは内容の検証に基づく順位ではなく、サイトへのリンクの数などに基づいているのです。つまり、「いろんなサイトで参照されているから、この情報は信頼性が高そう」という考え方ですね。これに対して、情報の中身までシステムでチェックできないかというのが私の考えです。そこで、初心者にはすぐに出来上がりを想像しにくい料理のレシピに着目し、「 味コレ! 2 」というレシピを分析するシステムの開発に取り組みました。自分の好みのレシピを「基準」として登録し、未知のレシピの材料構成と比較することで、理想の味よりも「濃い味」か「薄い味」かを予測し表示する仕組みです。料理初心者をはじめ、減塩や糖質制限を行う人へのサポートとして有用と考えられますが、表記方法が人によって違うこと、手順や温度など味を決める要因が複雑であることなど、実用化に向けた課題を解決していく必要があります。さらに現在は研究範囲を広げ、TV番組で使用された図表などをデータベース化し、景気動向などについてのブログ記事と照合して、その記述の真偽を検証するシステムの開発にも取り組んでいます。このような一歩進んだ検索技術の追究を通して実現したいのが、「意味を理解するコンピュータ」の開発です。今は機械の高機能化が取り沙汰されますが、あくまで「主役は人間、機械はパートナーであるべき」というのが私の持論。機械の方が人間に気を利かせてくれるレベルまで、コンピュータを進化させたい。情報検索の際、コンシェルジュのように意図を汲み、情報を整理して適切なものを提示するシステムが実現すれば、膨大な情報を資源として有効活用する手助けになるでしょう。
- 2 解説:
- 「味コレ!」では、NHKの料理サイトやクックパッドなどに掲載されている約40万件のレシピを分析できる。
授業では、こうした研究の基礎になる、データの扱い方について教えています。なかでも統計解析の手法については、これからさらに注目の高まる ビッグ・データ 3 を扱う基礎として、幅広い分野で役立っていくことでしょう。とはいえ、大量のデータを扱う研究には非常に根気が必要です。「このシステムが完成したら絶対面白い!」「自分でも使いたい!」とワクワクできるような目標をしっかりと持ち、それを完成させる喜びを目指して、学生には地道に努力を重ねてほしいと思います。
- 3 解説:
- 位置情報やショッピングの履歴など、蓄積されたデータを活用して有用な情報を抽出することが、今後期待されている。