相関分析とは? 業務に活用できる基本的な使い方をわかりやすく解説

現代のビジネス環境では、企業は膨大な量のデータにアクセスできるようになりました。しかし、データの蓄積そのものが価値を生むわけではありません。重要なのは、そのデータをどのように活用し、経営判断に活かすか?ということです。ここでは、相関分析とは何かをわかりやすく解説し、実際の業務改善へ活かせる相関分析の活用方法を検討します。

まずは、相関分析とは何かから始めていきましょう。

相関分析とは?基本をわかりやすく解説

相関分析は、2つ以上の変数間の関係性を明らかにする統計手法です。

データ間の関係を数値で表現し、その関係がどの程度強いのかを理解することができます。

相関の種類を紹介(正・負・無)

相関分析では、データ間の関係を「関数」と表現します。関数の種類は、3種類あります。

・正の関数

・負の関数

・無関数

正の相関が強い場合、ある要因の増加が別の要因の増加につながることを示します。

負の相関が強い場合、ある要因の増加が別の要因の減少につながることを示します。

無相関とは、二つのデータの間に明確な関係が見られないことを意味します。

相関係数の意味と使い方

相関係数は-1から1の範囲で示されます。1に近づくほど強い正の相関を示し、-1に近づくほど強い負の相関を示します。0に近い場合は、無相関であることを意味します。

因果関係との違い

因果関係は、一方の変数がもう一方の変数に直接的な影響を与える関係なのに対し、相関関係は、2つの変数が一緒に変化する関係を指します。

因果関係の具体例:

A. 納期短縮により、納品が早くなった結果 B. 顧客満足度のアンケート結果が明確に向上した。

つまり、AによってBが引き起こされた。

 

相関関係の具体例:

A. 在庫が多い月に B. 売上が高い傾向になる。

AとBは相関関係にあるものの、在庫が売上を直接的に増やしているこという解釈が正しいとは限りません。

相関分析は、データのパターンを理解し、潜在的な関連性を見つけるための強力なツールですが、その結果を解釈する際には注意が必要です。

回帰分析との違い

回帰分析は変数間の因果関係を推定し、特定の変数の変化が他の変数に与える影響をモデル化する手法です。

つまり、回帰分析は相関分析の結果をさらに深く掘り下げ、特定の要因がどの程度他の要因に影響を与えているかを定量的に把握することができます。

相関分析の手順とは

相関分析は、分析目的の明確化から始まり、活用・提案フェーズに至るまで、いくつかの重要な手順があります。

【手順】

  1. 分析の目的の明確化
  2. データの収集・整理
  3. 可視化による関係性の確認
  4. 相関係数の算出
  5. 結果の解釈
  6. 活用・提案

分析の目的の明確化

最初のステップは、相関分析の目的の明確化です。これは、相関分析を行う上で最も重要な部分の一つです。具体的なビジネス課題や知りたい情報を明らかにしていきます。

具体例:

  • 在庫の最適化と販売機会の最大化
  • 従業員数と生産量の相関分析
  • 納期遵守率と顧客満足度の相関分析
  • 販売価格と返品率の相関分析

 

分析に使用するデータの収集・整理

次に、データの収集と前処理です。ここでは、分析対象となるデータセットを収集し、欠損値の補完や異常値の除去などの前処理を行います。データの品質が相関分析の結果に大きく影響するため、細心の注意が必要です。

可視化による関係性の確認

続いて、データの可視化です。データをグラフや図表で視覚的に表示することで、パターンや傾向を直感的に理解できるようにします。散布図やヒストグラムを使ってデータの分布や相関の有無を視覚的に確認します。

相関係数の算出

その後、相関係数の計算に進みます。これにより、変数間の関係の強さと方向を定量的に評価します。一般的な手法として、ピアソンの積率相関係数やスピアマンの順位相関係数が用いられます。計算結果を基に、仮説検定を行い、相関が統計的に有意であるかを判断します。

【ピアソンの積率相関係数の式】

【スピアマンの順位相関係数の式】

結果の解釈

ここでは、算出された相関係数がどの程度の関係性を示しているのかを慎重に評価します。相関係数が1に近い場合、強い正の相関を示し、-1に近い場合は強い負の相関を示します。0に近い値は、ほとんど相関がないことを意味します。

解釈を行う上での注意点

解釈をする際に注意が必要なのは、相関係数が高いからといって必ずしも因果関係があるわけではないということに注意が必要です。そのため、結果の解釈には十分に注意を行い、必要であれば因果関係の検証を行うことを検討する必要があります。

活用・提案

ビジネス上の意思決定に役立てるために、結果を活用します。この際、相関分析の結果だけでなく、析の背景や手法、データの制約についても説明することが重要です。

相関分析の結果を活用して、具体的なアクションプランを策定します。

例えば、顧客の購買行動と売上の相関が高い場合、その情報を基にマーケティング戦略を見直したり、商品開発に活用したりすることができます。

 

相関分析の具体例を紹介

ここではより業務に近い具体例をいくつか紹介していきます。

  • 売上と在庫回転率の関係
  • 顧客対応時間と満足度の関係
  • 生産効率と不良率の関係

売上と在庫回転率の関係

例えば、業務から得られる売上データと在庫データを基に、各商品の売上高とその在庫回転率の相関を調査します。相関が高い場合、売上が増加するにつれて在庫回転率も上昇していることが考えられます。これにより、売れ筋商品の在庫補充を迅速に行うことで売上機会を逃さないようにするなど、在庫管理の改善策を講じることができます。

顧客対応時間と満足度の関係

顧客体験の向上に役立つ具体例として、収集したデータを用い、顧客対応時間と顧客満足度の関係を調査することで、迅速な対応が顧客満足度にどの程度影響を与えるかを理解することが可能です。もし強い正の相関が確認できる場合、対応時間の短縮が顧客満足度向上に直結することが示唆されるため、カスタマーサポートのプロセス改善やスタッフ増員の判断材料となります。

生産効率と不良率の関係

生産工程における設備稼働率と製品不良率の相関を分析することで、製造プロセスの改善を図ることもできます。稼働率が高まるにつれ不良率が上昇する場合、設備のメンテナンスやプロセスの見直しが必要であることが示されるため、効率的な生産管理や品質管理が可能になります。

エクセル・BIツールでの相関分析の基本的なやり方

ExcelやPower BIツールを活用した相関分析は、データサイエンスの専門知識がなくても手軽に実施できるため、多くの企業で採用されています。

エクセルによるデータの整理のやり方

それでは実際にエクセルを使用してデータの整理を行ってみましょう。

  1. データの準備
  2. 欠損値の補完欠損値の補完
  3. 異常値の検出と除去
  4. 相関係数の計算

データの準備

エクセルファイルを開き、図のような形式でデータを整理する

【顧客納期遵守・顧客満足度データのイメージ】

欠損値の補完欠損値の補完

手動で補完する方法と関数で補完する方法があります。

1. 手動:空白のセルを表示して平均値や中央値を入力

2. 関数:IF関数とISBLANKを使って自動に補完入力

=IF(ISBLANK(B2), AVERAGE(B$2:B$11), B2)

異常値の検出と除去

Zスコアまたは四分位範囲(IQR)で検出する方法があります。

Zスコアの場合

  • 平均と標準偏差を関数で計算
    平均:=AVERAGE(B2:B11) 標準偏差:=STDEV.P(B2:B11)
  • Zスコアを計算
    =(B2 – 平均セル) / 標準偏差セル
  • Zスコアが ±3 を超える値を異常値として除去または修正

 

四分位範囲(IQR)の場合

  • Q1:=QUARTILE(B2:B11, 1)
  • Q3:=QUARTILE(B2:B11, 3)
  • IQR = Q3 – Q1
  • 下限 = Q1 – 1.5×IQR
  • 上限 = Q3 + 1.5×IQR
  • 範囲外の値を異常値として除去または修正

相関係数の計算

CORREL関数にて算出し、結果が+1に近ければ強い正の相関となり、結果が-1に近ければ強い負の相関になります。また、結果が0に近い場合は、相関がないと考えられます。

Power BIでの相関分析の可視化

まず、分析したいデータセットをPower BIにインポートします。次に、データモデルを作成し、適切な視覚化を選択します。Power BIでは、特に散布図やバブルチャートが相関分析に適しており、これらを利用することでデータ間の関係性を直感的に把握できます。さらに、データポイントにフィルターをかけたり、スライサー機能を使うことで、特定の条件下での相関関係をより詳細に分析することが可能です。

生成AIを使った基本的な相関分析のやり方

生成AIと自動化技術の進展により、相関分析を含むデータ分析のプロセスが飛躍的に効率化されています。従来は専門的なスキルが必要とされていたデータの前処理や統計解析も、生成AIが自動で行えるようになり、データサイエンティストでなくとも扱いやすい環境が整いつつあります。具体的な利用例を見ていきましょう。

  • データを準備
  • プロンプトを入力
  • 結果の出力

 

プロンプト設計と出力例

データを生成AIに読み込ませて、欠損値の補完欠損値の補完、異常値の検出と除去、相関係数の計算、散布図の作成までを指示した結果がこちらになります。

プロンプト例:

  • このデータの欠損値の補完欠損値の補完、異常値の検出と除去、相関係数の計算してください。
  • 散布図やヒートマップを作成してExcelファイルで出力してほしい。

【①生成AIにデータをアップロードする】


【②生成AIにプロンプトを指示する】

【③エクセル出力例】

まとめ: 相関分析で業務を進化させる

ここまで相関分析について解説し、相関分析の手順と具体例について確認してきました。また、エクセル、Power BIといったツールを使用した分析方法や生成AIを活用した分析方法をご紹介しました。相関分析について理解を深めていただくことで、データがどのように関連し合っているのかを見つけ出し、ご自身の業務に役立てることができると思います。

テクトラでは、日々の業務の基盤となるシステムの導入をサポートしています。また、システムから得られる膨大なデータをただ蓄積・管理するだけではなく、AIを使用したデータ分析基盤の導入支援も行っています。相関分析ができるようになりたい方や日々の業務に相関分析を活用されたい方は、無料相談を行っておりますので、お気軽にご相談ください。

Index