実践統計学入門 コレスポンデンス分析 数量化Ⅲ類

はじめに

χ2乗検定では二次元分割表(クロス集計表)の行と列に関連があるかどうかを検定した。

krtan.com

コレスポンデンス分析では、二次元分割表(クロス集計表)の行と列の似たものどうしを近づけて、散布図で表現する手法である。

数量化Ⅲ類は0,1のダミー変数を用いるだけであり、やることはコレスポンデンス分析とおなじである。

いい方を変えれば、データの構造(クロス集計表かダミー変数か)が違うだけで結果は同じになる。

問題1 データの構造の違いと分析結果

おい、うちのブランドA,B,C,Dを女性の年代別に仕分けしてくれ

データの構造が違っているようですが

構造だけでなく、データ自身も違っているんだ

別の時期にデータをとったんですか?

そうらしいな。なるべく共通なものがあればいいんだが。できるよな?

はあ、まあやってみますわ

左がコレスポンデンス分析用のデータ。右が数量化Ⅲ類用のデータ 内容は変えてある
コレスポンデンス分析
左がコレスポンデンス分析。右が散布図

この結果から寄与率が85%あり、10代はA,20代はD、30代はBを好む傾向があることがわかった。また原点付近にあるCは10代~30代まで、まんべんなく好まれていることを示している。

数量化Ⅲ類
左が数量化Ⅲ類の固有値と寄与率。右は散布図

これをみると第2次元までの累積寄与率が82%あることがわかる。また、10代はA,20代はB、30代はCを好む傾向があることがわかった。また原点付近にあるDは10代~30代まで、まんべんなく好まれていることを示している。

この二つの結果より、共通はAの10代、のみという結果になった。

問題2 数量化Ⅲ類

問題文

問題文のデータ
解答 数量化Ⅲ類

固有値と寄与率のデータ
カテゴリウェイト(左)と個体ウェイト(右)の散布図

第2次元までで累積寄与率が74%あり、第一象限のそばに対して14、15が相当し、第四象限に対して8、13、2が相当し、第三象限に対して7、10が相当し、残りが第二象限に相当する。

問題3 数量化Ⅲ類

問題3の問題文

問題3のデータ

解答

1)

固有値と寄与率のデータ

2)

第2次元までのカテゴリウェイト

3)

問題3)のカテゴリウェイトの散布図

高校生:C  大学生:B  会社員:A

4)

問題4)の個体ウェイトの結果

個体ウェイトの結果から、上から3番目までの数値を書けばよい。

5)カテゴリウェイトの結果より、なっている。

問題4 コレスポンデンス分析

問題4の問題文とデータ
解答
コレスポンデンス分析の結果と散布図

中学生:B  高校生:D  大学生:A

問題5 コレスポンデンス分析

問題5の問題文 データは割愛 問題を解くときは解答の1)を使用すること
解答

1)

2次元分割表

2)

固有値と寄与率のデータ

3)

問題3)の解答

4)

コレスポンデンス分析の散布図

地域1:商品4  地域2:商品3  地域3:商品1と商品2

5)

地域1:商品4  地域2:商品1  地域3:商品1

サイトご利用方法

次のページ・前のページを利用するよりも、グローバルメニュー(ヘッダー部分にある項目)をクリックしていただければ、その項目の全体像が一目でみることができ、クリックすればそのサイトへ飛びます。

google、yahoo、Bingなどで検索する場合、検索ワードは先頭に、孤立じじい、と入力しその後に、ダッシュボード or インテリア or 統計 or 談話室、とどれかひとつを入力すると、その検索サイトが上位表示されます。