COLUMN誰でもわかる!お役立ちコラム

AWS活用支援コラム

AWSでビジネスインテリジェンス(BI)は実現できる?

企業におけるデータ活用の重要性

DX(デジタルトランスフォーメーション)が近年様々な企業で進んでいる中、「データドリブン」という言葉が様々な場面で登場するようになりました。「データドリブン」とは、Data Driven(データにより駆動する)の言葉通り、データに基づいて様々な判断を下し、アクションを実施することです。

経営層にとっては、マーケティング戦略や短期~中長期的な経営計画の判断をデータをもとに実施することであり、セールスの現場であれば見込み顧客の段階の判定にデータを使う、というような形です。ビジネスの様々な現場でデータ活用が重要性を増しています。データ分析を行い、ビジネスに適用していくためのツールの1つが、本記事で紹介する「ビジネスインテリジェンス(BI)」です。

ビジネスインテリジェンス(BI)とは?

ビジネスインテリジェンス(BI)というワード自体は、1989年に世界的大手ITコンサル企業であるGartnerのアナリストだったHoward Dresner氏が、企業の業績や行動、戦略を改善するための意思決定の質を分析する概念として用いたことが始まりとされています。

具体的には、特定のツールや手法を指すのではなく、ビジネスの運営や活動から得られるデータを収集、保存、分析、意思決定プロセスや方法の総称です。これらのすべてが一緒になることで、より優れた実用的な意思決定や、ビジネス上の洞察を得られるようになります。

ビジネスインテリジェンス(BI)が重要である理由

いままでの日本企業は、データがなくても適切な経営判断を行い、発展を続けてきました。したがって、データによる経営判断がなくても一見問題ないように思われます。しかしながら、近年は下記の要因でビジネスインテリジェンス(BI)の重要性が増しています。

  • グローバル化
  • 様々な媒体のデジタル化

具体的にどういうことなのか、見ていきましょう。

グローバル化

いままでの日本においては、競合相手は日本国内の企業である場合が大半であり、海外の企業は法規制や言語の壁などで日本への参入が厳しい事情がありました。しかし、今日においては、法規制は緩和され、海外のサービスやアプリケーションの日本市場への流入が加速しています。

これらの外資系企業は適切にデータを使い、少ない経営資源でも効率的に利益を伸ばせるような仕組みを導入しています。このような企業と競争を進めていくためには、どうしてもBIなどを駆使してデータドリブンな意思決定の助けを得ることで、生産性を向上させていく必要があります。

様々な媒体のデジタル化

現在は、データを収集する機器や、データを保存する機器の性能向上により、様々な情報がデータとして保存できるようになっています。例えば、顧客の購買情報や、Webサイト上でのクッキーによる閲覧情報、クリック時のデータ、顧客が入店した際の位置情報などです。

このように、従来と比べて様々な種類の情報をデジタル化し、データとして保存できるようになりました。これらの情報から相関関係や傾向を分析することで、今後の売り上げや取るべきアクションの方向性を論理的に予測することができるようになります。データを一種の企業の資産として活用しない手はなくなっているのが現状です。

高速、低コストで実現するスタイルズのAWSによるBI・DWH・データレイク構築サービスはこちら→

ビジネスインテリジェンス(BI)を構成する要素

BIはプロセスの総称である、と定義しましたが、具体的にBIを構成するプロセスは下記のとおりです。

  • データの準備
  • 加工・クエリ(ETL)
  • 統計的な分析
  • データの可視化

具体的にどのようなプロセスなのか、記載していきます。

データの準備

様々なデータの生成元(データソース)をまとめ、どこに何があるかを把握・取りまとめを行うことでデータ分析の準備をします。多くの場合、企業内には様々なシステムやツールが点在しており、それぞれに活用すべきデータが蓄積されています。例えばシステムであればデータベースやサーバー内のログであり、ツールであればエクセルなどの業務データです。それらのシステム・ツールに保存されたデータを統合してひとまとめにしていく作業が必要です。

加工・クエリ(ETL)

データを分析しやすい形式に加工します。Extract (抽出)、Transform (変換)、Load (書き出し)の頭文字をとって、ETL処理とも言います。データが保存されている形式には、構造化データ(構造化データとは、エクセルのように「列」「行」があり、「列」「行」にそれぞれ関係性を持っているデータ)と、非構造化データ(メールやPDFファイル、エクセルやワードで作った書類、動画や音楽データなどそれぞれのデータ間に関係性が薄いデータ)があります。これらの構造化データ、非構造化データを分析しやすいように加工します。

統計的な分析

分析とは、物事の関係性や要素・側面を抽出することを言います。BIでは、統計学的な技法を駆使して、データの分析を行います。例えば、あるデータとあるデータの相関分析や平均値を取得する、回帰分析により傾向を予測する、といった手法が考えられます。

データの可視化

データそのものや、データを分析したあとに出力される結果は単なる文字列でしかありません。その文字列を意思決定や判断に使用するためには、データを可視化するプロセスが必要不可欠です。具体的には、データ分析をチャートやグラフ、ヒストグラムなど視覚的な資料に変えます。場合によってはそれらをひとまとめにしてダッシュボードを作成します。

ビジネスインテリジェンス(BI)に必要な機能とは?

BIを進めていくにあたり、必要な機能について解説していきます。『BIを構成する要素』の各プロセスでどのような機能が必要なのでしょうか。

データの準備に必要な機能は?

複数のシステムやツールから、データを収集してとりあえず保存しておくためのストレージ機能であるデータレイク機能があるといいでしょう。加えて、データレイクから必要なデータを収集し、構造化テータとして蓄積する統合データベースとして、DWH(データウェアハウス)の機能が必要です。

このようにDWHやデータレイクに収集したデータは、どのようなデータなのか、どのように取集されたのか、といった情報がないと活用できません。したがって、そのようにデータを説明するためのドキュメントを用意する、メタデータ(データを説明するためのデータ)機能も必要です。

加工・クエリ(ETL)に必要な機能は?

構造化データであればSQLなどの処理を双方向的に実行する機能が必要です。また、非構造化データであればデータ内の文字列などのデータを抽出する機能も必要でしょう。次に、機能一括で大量のデータを処理するバッチ機能・連続的にデータを処理できるパイプライン機能があると、多様な要件に合致します。

企業内にプログラミングスキルを持ったエンジニアが確保しにくい場合は、GUIによりデータを加工する機能があると便利です。

統計的な分析に必要な機能は?

平均や分散、回帰分析といった基本的な統計手法を駆使してデータを出力できる機能があるといいでしょう。また重回帰分析等、統計的な分析には複雑な計算が必要な場合があります。そのため複雑な計算に耐える演算機能があるといいでしょう。要件によっては、リアルタイムにデータを分析する必要性がある場合があります。例えば施設などの来場者数をリアルタイムに表示したい場合です。このような場合には、オンライン分析処理機能(Online Analytical Processing:OLAP機能)があると便利です。

データの可視化に必要な機能は?

データ分析の結果から、本当に必要なデータだけを確認できるダッシュボード機能があるといいでしょう。ダッシュボードを特定の人に見せる・見せないといった認証・認可などの権限管理機能も必要です。また、月次の報告書など、同じフォーマットのレポートを自動で作成するレポーティング機能があるといいでしょう。

高速、低コストで実現するスタイルズのAWSによるBI・DWH・データレイク構築サービスはこちら→

AWSで利用できるBIサービスは?

AWS(Amazon Web Services)では、データ分析のための以下のような様々なサービスが用意されています。

  • Amazon S3
    S3はスケーラビリティのあるオブジェクトストレージです。非構造化データ、構造化データを問わずS3に保存しておき、データレイクを構築します。
  • Amazon Redshift
    Amazon Redshift は最も人気のある高速なクラウドデータウェアハウスです。Amazon Redshift は他のどのクラウドデータウェアハウスよりも最大75%低いコストを実現できます。
  • Amazon QuickSight
    AWSが提供するBIツールです。ダッシュボードおよびレポートを簡単かつ迅速に作成して可視化したり、分析結果のレポートをメールで配信することも可能です。
  • Amazon Athena
    Amazon S3 内のデータを標準 SQL を使用して簡単に分析できるサービスとなります。データレイクにおいてはAmazon RedshiftやAmazon RDSにデータを移行する必要がなくS3自体にSQLで解析をすることが可能となります。
  • AWS Glue
    AWS Glueは、フルマネージドのETLツールです。導入にあたってインストールするサーバーなどを用意する必要はなく、動作環境はすべてAWS Glue側から提供されます。
  • AWS Lake Formation
    AWS Lake Formationは安全なデータレイクを比較的簡単にセットアップできるサービスのことです。データの変換や重複排除などを自動化できます。

まとめ

各サービスに関する詳細な機能については別記事で記載しますが、AWSを活用すれば、様々なアプリケーションやサービスと連携して、ビジネスインテリジェンス(BI)を素早く実現することができます。