定性的データ分析(シリーズ Useful R 5)

金 明哲 編, 金 明哲 著

4,180円(税込)

共立出版

 「定量的データ」は体重、身長、車の速度、売り上げなどを数値で記録したことを指す。これに対し、性別、血液型、政党に対する支持・不支持のような名義尺度(nominal scale)データ、成績の5段階評価(A、 B、 C、 D、 F)、商品の使いやすさ(非常に使いやすい、使いやすい、どちらともいえない、使いにくい、非常に使いにくい)のような順序尺度(ordinal scale)データを本書では「定性的データ」と呼ぶ。つまり本書の定性的データは質的データ、あるいはカテゴリカルデータを指す。
 「定性的データ分析」に関しては、林の数量化理論がよく知られている。海外において「定性的データ分析」に対応付けられるのは「カテゴリカルデータ分析」である。本書ではカテゴリカルデータ解析の主な内容に、数量化理論の基本的な考え方を必要となる項目に織り交ぜながら、カテゴリカルデータ分析の基本的手法と機械学習法を紹介する。本書は大きく3つの部から構成されている。

第?部:第1章から第6章まではカテゴリカルデータの操作と推測統計の基礎について比率検定、分割表の独立性分析などを扱っている。
第?部:第7章から第14章まではカテゴリカルデータのモデリング方法について対数線形モデル、重回帰分析と数量化?類、一般化線形モデル、ツリーモデルとアンサンブル学習によるモデリング法を扱っている。
第?部:第15章から第19章まではカテゴリカルデータの記述的分析方法として対応分析、カテゴリカルデータの類似度あるいは非類似度を用いた分析方法としての主成分分析、因子分析、クラスター分析などの方法と人文社会科学に多く用いられるようになったネットワーク分析、アソシエーション分析方法を扱っている。

 本書は、人文社会系でも理解できるように配慮している。数式が理解しにくい部分については、Rでデータを分析することでその意味を理解できるように工夫している。本書で用いたコードは出版社Webからダウンロードできる。誤りを避けるように努力しているが少なからず残っていることは否めない。それらに関しては見つかり次第、追ってWebで知らせる。