ツイート

このエントリーをはてなブックマークに追加

↑PAGE TOP

オプトと大阪大学、アクセスログ構造化に関する産学共同研究開始

2012.12.5

オプトは、大阪大学 産業科学研究所 古崎晃司准教授らの研究グループとの共同研究を開始する。インターネットユーザーのアクセスログからオントロジー工学(※1)を用いた意味付けを行い、URLの内容及びユーザーの行動を判別できる仕組みの構築を目指す。

 様々なURLについて共通の意味付けを行うことによって、これまで十分に活用されてこなかったアクセスログの羅列を、誰でも容易に分類・分析することが可能になる。

 アクセスログはネット上での消費者の行動を表す指標として、Webサイトを保有する企業や個人をはじめとして、様々な場所で収集・取得されており、いわゆるビックデータの代表例として、多くの事業者で活用が試みられている。

 しかしながら、秒単位で収集されるアクセスログは理解不能な文字データであることから、分析には高度なノウハウが要求され、大部分のデータが活用できていない状態にある。一般的にはURLの内容を把握する手法として、テキストマイニング(※2)が主流となっているが、この方法では分析対象サイトの深い意味的関係を適切に捉えることが困難であり、ユーザーの行動そのものを定量的に把握するには限界があると考えられている。

 本共同研究の成果を活用することで、複雑かつ多様な情報を系統立った形で整理することができ、アクセスログに含まれる非構造情報(※3)であるURLを構造化することができる。

 これにより、一人ひとりのインターネットユーザーのサイバー空間における行動履歴からユーザー全体の行動特性を見ることが可能に。また、これとは反対に、行動特性の違いに応じたマーケティング戦略の立案を行うなど、企業や事業体の経営戦略の極めて有力な検討材料として活用できるようになると期待される。

(※1)オントロジー工学とはコンピューターにデータの意味を理解させ、知識として処理させるための情報工学の分野のこと。
(※2)テキストマイニングとは、テキストを対象としたデータマイニングのこと。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度・相関、出現傾向、時系列などを解析することで有用な情報を取り出すテキストデータの分析方法。
(※3)非構造情報とは、データ構造の定義がなされておらず、リレーショナルモデルに上手く適合しない情報を指す。文書や画像、音声、動画といったWebサイトのコンテンツは非構造情報に該当する。


  • このエントリーをはてなブックマークに追加