AGRAフィロソフィー なぜAGRAは生まれたのか。なぜ仮想データ統合なのか。「データを経営資源に」という言葉にこめた想いは何か。AGRAの想いをお伝えいたします。

注目されてきた《仮想統合データベースの可能性と問題》

様々な課題を克服し、バラバラなデータを物理的に完全に統合した情報系データベースは、“使えるデータ”の宝庫であり、誰もが使ってみたいと願う情報系システムになります。しかし、これまでの取り組みを振り返ってもわかる通り、決して容易なことではありません。
そこで、データを物理統合するのではなくデータへのアクセスパスをメタデータとして管理し、仮想的にデータが統合されたように見せる“仮想統合データベース”が注目されてきました。仮想統合データベース環境は、分散している複数の業務システムのデータベースのデータに対するビューを定義し、リアルタイムにそのビューを介してデータアクセスを行います。
物理的な情報系データベースの構築ではETLツールによるバッチ処理を出力するファイル数に応じて開発を行うために時間がかかりますが、仮想統合データベースでは、それらの開発工数がビュー定義の工数に代わるため、多様なユーザーからのデータ要求をより多く満たすことができるのです。

しかし、仮想統合データベース環境を導入しても、“使えるデータ”が簡単に手に入るわけではありません。
これには二つの理由があります。一つは複数のデータベースの異なる形(構造、モデル、フォーマット等)のテーブルをどのような単一の仮想テーブルとするかは、ユーザーの個々の判断であるということです。自由に作成ができる反面、軸となる指針がないためアウトプットが多くなればなるほど複雑な構造となり、結果的にETLプログラムのスパゲッティ化と同じ結果に陥りやすくなります。そういう状態になると、データを企業の全体最適による経営資源として取得するという理想に近づくことは困難です。
もう一つは「ゴミが入ればゴミがでる」と言われる問題は解決しないということです。主キーだけをとっても、コード体系の違い、フォーマットの表現の揺れ、注釈的追記、多重などを解決し、データを統合する必要があります。そのための処理であるデータクレンジグ(データスクラビング)の実施もしくは名寄せ処理の組み込みは対象外であり、多くの仮想統合データベース環境は、データを統合する機能ではなく、統合されたデータを保存し、仮想的にアクセスする手段として提供されています。

関連情報

資料請求/お問い合わせ
上へ戻る