データウェアハウス(DWH)を具体的な活用事例を元に解説 | ビッグデータ | DataVehicle

コラム

データウェアハウス(DWH)を具体的な活用事例を元に解説

「勘と経験だけにもとづいた意思決定から、データにもとづいた意思決定にシフトしたい」。そう考える人の中には、データウェアハウスという言葉を聞いたことがある人も少なくないでしょう。データウェアハウスを活用することで、どんなことができるのでしょうか。よく耳にするデータベースとはどう違うのでしょうか。

データウェアハウス(DWH)とは

データウェアハウス(DWH=Data Ware House)の「ウェアハウス」とは「倉庫」という意味です。データウェアハウスはデータベースの一種です。

社内にはCRMや会計システム、人事管理システムなどさまざまな基幹系システムがありますが、データウェアハウスは、それらのデータを1ヶ所に集約し、データ分析をスムーズにするための仕組みです。

社内のさまざまなシステムに蓄積された膨大なデータの中から必要なデータを探すには、時間がかかります。また、システムごとにデータが格納されているために、システムを横断してのデータ分析が困難です。

データが見つけにくいこと、横断しにくいことでデータ活用へのハードルが上がり、企業でのデータドリブンな意思決定が進まない一因になっていました。

データウェアハウスとデータベースの違い

データウェアハウスとデータベースは混同されやすい概念です。両者にはどんな違いがあるのでしょうか。

「データの処理」をするデータベース

多くの会社では、データベースはデータの保存や編集といった「データの処理」をする役割を担っています。読み取り・書き込みのアクセスに最適化されており、情報のすばやい記録と検索が可能です。

たとえば、ECサイトなどで注文があった場合、注文内容にもとづいて商品をピックアップしたり、住所と名前にもとづいて発送をしたりといったオペレーションが発生します。データベースはこうした日々の業務オペレーションを回すために活用されています。

「データの分析」に最適化されたデータウェアハウス

データベースに対して、データウェアハウスは「データの分析」に最適化されています。

データウェアハウスには、過去のデータが蓄積されています。その中から必要なデータを参照して分析することができます。

日々の業務オペレーションを回すために用いられるというよりは、データ分析など過去のデータが必要になったときに取り出して使う、まさに「倉庫」の役割をしています。

データウェアハウスの要件とは

データウェアハウスを構築する際には、あとからデータを取り出して分析することを前提に構築します。

具体的には、次の4つの要件を満たすことを心がけましょう。

サブジェクトごとに整理する

サブジェクトとは、データ分析の軸となる「内容」のことをいいます。サブジェクトには「顧客」や「商品」といった項目があります。

CRMや会計システムといった社内のさまざまなシステムから集約されたデータは、サブジェクトごとに格納されていません。

そこでシステムごとに散在しているデータを再編成して、サブジェクトごとにデータを整理します。そうすることで、各システムを横断してまとまった顧客データを出力することができます。

データが統合されていること

データの保存形式や内容はシステムによって異なるため、1つの同じデータでもシステムによって表現が同じとは限りません。

たとえば、CRMでは文字列になっているユーザーIDが、会計システムでは整数になっているような場合です。一人の同じユーザーでも、CRM上ではIDが文字列になっていて、会計システム上では整数になっていると、データウェアハウスにデータを移行した時点で重複が生じてしまいます。

データ統合ではこうした問題を解決します。ユーザーIDを文字列または整数に統一したり、重複を削除したりすることによって、データの整合性を高めます。

データが時系列で整理されていること

通常、データベースでは最新の情報が重視されますが、データウェアハウスでは、過去からのデータを時系列で記録していることが求められます。

たとえば、銀行口座を管理するデータベースでは、現在の口座残高が即座にわかるようにしています。入出金があるたびに、現在の口座残高から値が更新されるためです。

データウェアハウスでは、口座開設以来の入出金がすべて記録されます。

データウェアハウス上でデータを時系列に整理しておくことで、現在の値だけでなく、それまでの大局的な流れを把握することができます。

データが消えないこと

データウェアハウスでは過去のデータをすべて記録するため、原則、更新したり消したりすることはありません。なぜなら、過去に発生した取引は変えようがないためです。

データウェアハウスを利用するうえで注意すること

せっかくデータウェアハウスを構築するのであれば、それぞれのデータの関係性を可視化して、データドリブンな意思決定に役立てたいものです。

たとえば、コールセンター、実店舗、ECサイトで顧客IDを統一すれば、顧客IDを検索するだけでどの販売形態を最も利用しているかをリサーチするのがスムーズです。

また、社員IDも各システムで統一しデータウェアハウスに移行することで、販売金額が多いスタッフはどういう人なのか、採用の際どんなことに注意すればいいかがわかります。

データウェアハウスの活用事例

データウェアハウスは、膨大なデータを分析するのに向いています。たとえば、小売店のPOSシステムのデータ分析などです。

スーパーやドラッグストアといった小売店では、数千、数万点の商品を取り扱うことも珍しくありません。店舗には毎日さまざまな属性の顧客が訪れ、膨大な量のPOSデータが蓄積していきます。

こうして蓄積したPOSデータをもとに、商品の仕入れや顧客動向の確認のためにデータ分析をする際、データウェアハウスは役に立ちます。

データベースからデータを抽出し、Excelなどで加工することはできますが、この方法は非常に時間がかかります。データウェアハウスは過去から蓄積された膨大なデータを瞬時に分析、表示することができるため、スピーディーな経営判断につながります。

また、データベースに対して直接集計処理をした場合、うっかりミスで業務を止めてしまう可能性があります。こうしたミスを防ぐためにも、データベースでは日々の業務を処理し、データウェアハウスではデータ分析をしたり、経営の指標を閲覧したりといった使い分けを推奨します。

データドリブン経営をするためにデータウェアハウスを活用しよう

社内には、顧客データ、商品データ、社員データなど、膨大なデータが蓄積しています。これらのデータを経営に活かすことで生産性を向上させ、企業の競争力を高めましょう。データウェアハウスを活用すれば、社内のさまざまなシステムにまたがるデータを集約し、整理して分析に活かすことができます。データドリブン経営の第一歩として、データウェアハウスの導入を検討してみてはいかがでしょうか。

データ分析や活用、DX推進に関するお悩み、弊社製品の機能についてご興味のある方は、お気軽にお問い合わせください。