前回の記事では、分析するデータを「使いやすい形で、大事に保管することの重要性」をご紹介しました。
データ分析をする際、データの分析結果は正確でなければならないし、データの保管方法も厳密でなければ、企業としての信頼性を失うリスクがあります。
そこで、この記事では、具体的にどのようなサービスやツールを活用できるのかをご紹介します。
なお、この記事は「データ活用を成功させるために抑えるべき6つのポイント」というコンテンツの4つ目の記事で、当コンテンツは以下の記事で構成されています。
データ活用とAI
データ活用を成功させるために抑えるべきポイントのシリーズでは、ここまでデータ活用に必要な考え方や推進の方法をご紹介してきました。
次のセクションでは、データ活用で必要な技術基盤について解説しますが、その前に、大きな前提をここでお伝えします。
データ活用で、AIは切っても切り離せない関係にあります。理由は、AIを活用しないと分析速度が遅く、分析できるデータ量は少なく、精度も低いからです。
具体的には、「AIを活用したデータ分析」と「AIがないデータ分析」を比較したテーブルでご確認ください。
AIがあるデータ分析 | AIがないデータ分析 | |
---|---|---|
分析速度 | 1万件のデータを数秒~数分で処理可能 | 1万件のデータを人力または基本的なツールで処理する場合、1時間以上かかることが一般的 |
分析できるデータ量 | 数百万~数十億件のデータも処理可能 例:ビッグデータ解析やリアルタイム処理に対応 | 人が処理できるのは1回あたり数千~数万件が限界 例:エクセルでの分析で50万件を超えると処理困難 |
分析精度 | 大量のデータを用いて機械学習モデルが相関や因果関係を発見 例:売上の変動要因を詳細に予測可能 | 経験や仮説に基づく分析が多く 未知の相関関係や複雑なパターンは見落とされやすい |
例えば、ERPなどの業務システムでため込んだデータを分析したい!と思っても、AIがないと1時間以上かかるケースもあるんです。
営業・マーケティングや会社・組織単位での分析を行うことが目的であれば、複数のテーブルを使って、数百万件以上のデータを処理する必要があることがほとんど。つまり、データ活用をするのであれば、AIの設備もあわせて整える必要があるんです。
データ活用に必要な技術的な基盤を整える
一つ前のセクションでは、データ分析をする上でAIは切っても切り離せない関係であることをご紹介しました。では、データ分析をする際は、どのようなAIを選んで使えば良いのでしょうか?
企業でAIを活用する場合、大きく分けるとクラウド、オンプレミス、SaaSという3つの方法が考えられます。
このうち、SaaSは「サービスに付属してAI機能がついている」程度のことが多いので、今持っているデータベースとの接続やそのカスタマイズ性に制限があることが多いので、一旦考えなくても良いでしょう。
クラウドとオンプレミスであれば、貴社の用途やセキュリティ要件、予算などで選ぶことになります。
ただ、これからデータとAIの活用を始めるのであれば、クラウドAIを活用することがおすすめです。
そもそも、クラウドAIとは、マイクロソフトやAWSなどが提供するクラウドコンピューティングサービスを使ってAIを活用するケースです。初期コストが低かったり、必要に応じてシステム規模を柔軟に変えられるメリットがあります。
一方で、オンプレミスAIとは、自社内もしくは自社管理の倉庫などでサーバーやインフラ設備を設置して運用するAIシステムの形を指します。情報を好きに管理できるセキュリティの高さと柔軟なカスタマイズ性を誇るので、人員と予算に余裕があればこちらを選択することも考えて良いでしょう。
以下の表では、具体的にクラウドAIとオンプレミスAIのメリット・デメリット・用途を比較しています。
メリットとデメリットを比較した上で、用途例と貴社で検討している用途を照らし合わせて、どちらを活用すべきかを検討しましょう。
クラウドAI | オンプレミスAI | |
---|---|---|
メリット | 低い初期コスト スケーラビリティ 運用・保守の負担軽減 最新技術へのアクセス | セキュリティの高さ カスタマイズの自由度 安定した通信速度 長期的なコスト削減 |
デメリット | セキュリティリスク 通信速度の変動 長期的なコスト増加 カスタマイズの制限 | 高い初期導入コスト メンテナンスの手間 サーバー設置スペースの確保 |
適した用途 | スタートアップや中小企業 変動の大きい需要に対応する業務 最新のAI技術をすぐに利用したい場合 IT人材が不足している企業 | セキュリティ要件が厳しい業界 大量のデータを扱う業務 カスタマイズ性が重要な業務 |
以上のテーブルでご紹介している通り、オンプレミスは柔軟性とセキュリティはピカイチですが、いかんせんコストが大きく、簡単に数億円程度の予算が飛んでしまいます。
特に「これから少しずつ使っていこうかな」と考える場合、まずはクラウドで小さく始めて、徐々に大きくしていくことで、最小限のコストで最大限の成果を得られます。
さて、これからデータデータを活用する上で活用できるツールをご紹介します。
データ活用は一般的に、以下の流れで行います。
- ビジネスデータの保存
- 非構造化/生データの保存
- 分析データの保存
- データ収集
- 分析
- データの可視化
以下のテーブルでは、各データ活用の工程で、活用できるサービスをご紹介しています。
用途に対して活用可能なサービス一覧(クリックして開く)
データ活用の工程 | 対応サービス | 説明 |
---|---|---|
ビジネスデータの保存 | Dataverse | Dynamics や PowerApps などのビジネスアプリケーション用にデータテーブルを保存 |
Azure Purview | 統合データガバナンスサービスで、オンプレミス、マルチクラウド、SaaS データを管理。自動データ発見や機密データ分類、エンドツーエンドのデータリネージを提供。 | |
非構造化/生データの保存 | Azure Data Lake | 大規模なファイルストレージで、多量のデータをギガビット単位のスループットで処理。データウェアハウスのステージングエリアやデータサイエンティストのソースとして機能する。 |
Cosmo DB | 非構造化データをデータベース形式で保存し、データサイエンティストのソースとして機能する。 | |
分析データの保存 | Azure Synapse Analytics | スタースキーマでデータを保存し、BI やレポートに使用されるデータウェアハウス。 |
Azure Data Factory / SSIS | データ統合(コピー/同期)および変換層として機能。 | |
データ収集 | Power Automate | 自動化全般をサポートし、データ移動やレコード作成のために300 以上のデータソースや API と接続できる事前定義されたワークフローを提供。 |
Power Apps | カスタムアプリを構築するためのアプリ、サービス、コネクタを提供する開発環境。 | |
Power Virtual Agent | Power Automate と連携できるチャットボットを作成する。 | |
分析 | Azure Analysis Service | ビジネスユーザー向けに大規模データのセルフサービスを可能にする多次元モデルを提供。 |
Stream Analytics | 複数のソースからの高速ストリーミングデータを同時に処理・分析する。 | |
Customer Insights | 複数のソースから顧客データを統合し、単一の顧客ビューを作成。 | |
Cognitive Service | 事前構築された AI モデル(ビジョン、音声、言語、意思決定)。 | |
Azure Machine Learning Service | 機械学習モデル開発プラットフォーム。 | |
データ可視化 | Azure Data Bricks | データサイエンティスト向けのコラボレーションプラットフォーム。 |
Power BI | データ可視化ツールで、インサイトを生成します。 |
ここまで、最初にデータ活用とAIを活用する必要性とAIの選び方、実際に活用できるAIに必要な設備をご紹介しました。
活用すべきAIと必要な設備が分かったら、最後に必要なのはデータ活用までの地図、つまりロードマップです。
次のページからは、データ活用を進める上で設定すべきロードマップについてご紹介します。
社内のデータ活用を確実に推進したい方は、ぜひ次のページにも目を通してみてください。