KS法クラスター分析

　KS法クラスター分析は，所属クラスター内部の類似度が高いだけではなく，全クラスターを構成する全オブジェクトの配分が，オブジェクト全体をみて最適となるという特徴をもっています。そのために，オブジェクト間の差異に敏感に反応して，多数のクラスターを析出するという特徴を併せもちます。この多数のクラスターを解釈可能な数にまとめあげるために，第2次クラスター分析を行うことがあります。

　第2次クラスター分析は，第1次クラスター分析により析出されたクラスターを分析単位として，クラスター間の相関係数を算出し，それをデータマトリックスとして用い，再度KS法クラスター分析を行うことによって実行します。以下に，その手続きについて具体的に説明します。

　第1次クラスター分析の結果，Log.txtというファイルが生成されています。このファイルの最下部にある，

i, kob, mab, fit, toc0, toc1, toc2・・・

0・・・

1・・・

2・・・

という部分をテキストデータとして保存します（ここでは，toc.txtと命名しておきます）。データの行数は，KS法クラスター分析の第1ステップで析出されたクラスター数に相当します。「toc」は第2ステップで析出されたクラスター数と同じ数，生成されます。例えば，417ケースについて分析した結果，第1ステップで93クラスター，第2ステップで17クラスターが析出された場合，上記のデータ行数は93行，tocは17個生成されます。

　次に，toc.txtを，固定長データとしてエクセルで読み込みます。このエクセルデータを用いて，相関マトリックスを作ります。その方法について，以下で説明します。

(1)相関係数の算出

　エクセル2007について説明します。MS-Officeボタン→Excelのオプション→アドイン→管理：Excelアドイン，設定→有効なアドイン，と進み，分析ツールの前のチェックボタンをチェックし，OKをクリックします。

　メニューバーから，データ→分析→データ分析→相関，と進みOKをクリックします。これで，相関係数の算出ができるようになりました。

(2)相関マトリックスに整形する

　エクセルが算出した相関係数は，対角線の半分のみに記載されています。これをマトリックスの形に整形します。

　まず，r=1をNull（空白）に変換します。次に，「コピー」→「形式を選択して貼付け」→「値」「行列を入れ替える」を繰り返し，手作業で対角線上の空白の半分を埋めます。

(3)KS法クラスター分析　第2次クラスター分析

　ケース数が22以下の場合，現在のプログラムではエラーを起こしてしまいます。その場合，データをコピー貼付けで，単純に2倍に増やして分析を行ってください。析出されたクラスターには，各ケースが2個ずつ（オリジナルとコピー）含まれているので，これをオリジナルのみにすると，分析が完了します。

(4)第1次クラスター分析の結果と，第2次クラスター分析の結果を結合する

　両方の分析結果を結合するためには，エクセルの関数である「VLOOKUP()」を使います。例えば，下の式は次の内容を示しています。

=VLOOKUP(V3,W$3:X$19,2)

これを入力したY3セルには， V3のセルに入力されていた値を， W$3:X$19をデータベースとして変換した値が入ります。例えば，V3に5が入力されていた場合，データベースによると5は2なので，Y3には2が入力されることになります。Vの列に第1次クラスター分析の結果が入力されているとすると，データベースを利用して，Y列に第2次クラスター分析の結果を入力できることになります。つまり，ここでいう「データベース」とは，第2次クラスター分析の，NoとKob2の組み合わせなのです。

　これらの手続きによって，クラスター数を解釈可能な数にまとめあげることができます。

KS法クラスター分析は，オブジェクト間の差異に敏感に反応して，多数のクラスターを析出するという特徴をもっています。そのために，第2次クラスター分析を行う場合があります。ここでは，その方法について説明します。

11) 第2次クラスター分析の方法

2012年2月7日火曜日