クラスター分析とは?

目次
クラスター分析とは?
クラスター分析とは、異なる多くのデータを近似したもの同士で分類するための方法です。マーケティングでしばしば用いられ、顧客情報分析や市場調査に応用されています。巨大なデータの特徴を把握するのに有効な分析方法です。
クラスター分析には、階層型分析と非階層型分析の2種類があります。階層型分析とは、クラスターの分類を最も近似したもの同士から始め、徐々に類似度が低いものへと進む方法です。
たとえば、A、B、C、D、Eという5つの要素があるとしましょう。このうちAとBの類似度が最も高いため、最初に同じクラスターとして分類されます。CとDも同じように類似度が高いもの同士として、一つのクラスターとしてまとめられます。
次に、AとB、CとDのそれぞれのクラスターを大きな一つのクラスターとして分類します。Eだけが一つ遠く離れているため、別の分類です。全体を一つのクラスターとした時に、Eもようやく分類されるというやり方です。
階層型分析では、クラスターにまとめるプロセスにおいて、樹形図(デンドログラム)がよく用いられます。この図を見ながら、クラスターをいくつに分類するのかを決められるのがメリットです。この場合なら、「ABCDとE」と2つに分けることも、「ABとCDとE」と3つに分けることもできます。
しかし、階層型分析ではすべての要素の類似度を計算しなければならないため、計算量が非常に大きくなってしまいます。そのため、データが多数の場合は、次の非階層型分析を用いるのが一般的です。
非階層型分析には、階層型のように総当りですべての要素の類似度を計算することはなく、簡略な計算で分析するという特徴があります。計算する前に分類するクラスターの数を決める必要があるため、適正な結果を得るためには、何度も計算し直すなど試行錯誤は必要です。
クラスター分析の活用事例
クラスター分析は、顧客アンケートや顧客情報、市場調査の分類などで活用されています。顧客の住所、年齢、性別を分析することによって、顧客を興味や関心ごとにクラスターとしてまとめることが可能です。その分類したクラスターに応じて、適切なDMを送付するといった活用が考えられます。
まとめ
クラスター分析は、顧客を興味や関心に応じて詳細に分類するのに便利な分析方法です。顧客ごとに有効なアプローチを検討することにもつながります。明確な目的を持って分析することで、マーケティングに大きな成果が期待できるようになるでしょう。