「誰も教えてくれなかった因子分析」
松尾 太加志, 中村 知靖
○この本で少し因子分析がわかってきた。感謝!
(・引用/要約 ○関根の独り言)
============================
●はじめに
・一度自分が正しく理解してしまうと、わかっていることが当たり前になって
しまい、分からない人の立場に立てない。
○これはあるよなー。
それでも分からない人の立場にたって考えて説明できるのが、本当の
教え上手なんだろうな。
・ちょっと統計に詳しい人 というのがミソ。詳しすぎると、説明下手になる。
============================
●因子分析の結果を見る
・因子分析とは、質問項目に共通している因子をいくつか見つけ出す分析。
・結果だけを知りたいのであれば、分からなくてよいものまで無理に理解
しようとする努力は必要ない。
○これは新鮮。言われてみればそうだよな。全部細かく知っている必要はない。
・「因子負荷」はわからないといけない。因子分析の手法は分からなくてよい。
・論文を読む側にとってはどうでもよいこと。
・因子分析の手法は、適当に決めている。
データに上手くマッチした手法を使っていると好意的に受け止めよう。
・たくさんのデータをできる限り少ない値で、分かりやすく説明しようとすることが
目的。
・因子の名前は、独断で「えいや!」とつけている。極めて主観的。
その関連の度合いを計算することが、因子分析をするということ。
・因子分析は、複数の質問項目が共通に関連している潜在的な因子を見つける
分析手法。問題になるのは、どの程度、その潜在的な因子と関連しているかだ。
・因子負荷を通して、各質問項目と因子との関わりの度合いが出てくる。
・関連があるのかないのかの判断基準は、分析をした人が適当に決める。
・質問項目を作る段階で、どのような因子が出てくるかを頭に描いている。
○どんな質問項目を作るのかの準備段階が大事なんだろうなー。
自分が示したい結果を示せるような質問を作る? ちょっと恣意的なのかなー。
・因子分析は、一回限り行うものではなく、質問項目を取捨選択しながら、
何度も因子分析を行って上手く解釈できるようにするためのもの。
・因子分析は、ある観測変数(質問に対する回答)が、どのような潜在因子から
影響を受けているかを探るもの。
・因子が見つかるということは、因子と項目との関係が成立しているということ。
・因子寄与とか共通性を産出することで、どの程度うまく因子を見つけることが
できたかが分かる。
・質問の回答(観測変数)に影響を与えるのは、共通因子と独自因子しかないと
考える。そのため、それぞれの影響を合わせると 1 になる。
・研究は、先行研究の問題点を見つけ出して、新たな研究に発展させるということ。
○ここだよなー。まずは何をおいても先行研究(巨人)を知ること。
自分が知りたい、明らかにしたいことはある。
それは既に誰かが明らかにしているかもしれない。まずはそれをはっきりさせること。
ここに時間と労力がかかるんだろうなー。
============================
●因子分析を自分でする
・質問項目=観測変数
・因子分析は、項目間の相関関係をもとに、共通因子を探る分析。
・直線的な相関関係である必要
・相関係数は、-1に近いほど、負の相関があり、+1に近いほど、正の相関がある。
・自分が調べたいと思っている事柄について観測されたデータであれば良い。
・因子に関連する質問項目は、3~4は必要。したがって、あらかじめ因子の数の
目安がある場合は、その3~4倍以上の質問項目を準備すればよい。
・質問を作る時は「心理学マニュアル質問紙法」が役立つ。
○この本は、既に読んだ!
https://www.learn-well.com/blog/2009/04/post_229.html
・質問項目ができあがり、回答が集まってきたら、因子分析を行う。
因子分析は、統計パッケージ(SPSS、SAS)を使って行う。
・因子分析は、答えが一つであるといった分析ではない。色々な答えを
出してみないといけない分析。どの答えが自分のデータに最もあうのかは、
自分で見つけ出さないといけない。
・自分に都合のよいように因子軸を回転して、うまく自分のデータをその因子軸で
説明できるようにする。
・自分のデータにあった因子抽出法を選ぶが、最尤法を使うのがベストと言われる。
・結果として重要なのは「因子負荷」
・何を基準としてうまくいったと判断すればよいのでしょうか。
-計算自体が上手くいったのか? -因子数はいくつでたのか?
・上手くいかないケース
-データの数が少ない -データの入力がおかしい -因子抽出法があってない
・因子数は、ある基準に従って決められている。その基準は2つ。
1)固有値という言われる値を基準にする
2)こっちの都合(解釈の可能性)で決める
・固有値とは、因子のなりやすさと考えるとよい。
・因子数をいくつにするか。それを決める際に最も重要なのは「解釈の可能性」
自分のデータをいかに上手く解釈できるかどうかが決め手。
・上手く解釈するために、別々の次元(軸)で考える。
・回転とは、ただ見る方向を変えているにすぎない。
・自分の解釈に都合のよい回転を見つける。
○なるほどねー。「都合のよい回転」かー。説明しやすくするために。
・自分の判断でこうしたいと皆が納得してくれるのであれば。
・出てきた結果が自分の解釈に都合がよい回転を選べばよい。
○なんか俺でもできそうな気がしてきた。
データの解釈はあとでできそうだから、どんなデータをとるか、
どんな質問をするかが重要そう。
データをとってしまった後「あ、これ聞いとけばよかった」だと大変そう。
・各因子の名称は、主観的につける。
・出てきた因子がはたして妥当であるのかどうかを検討する必要がある。
・バリマックス回転=直交回転 解釈が比較的簡単。因子負荷と相関係数は同じ値。
・プロマックス回転=斜交回転 因子負荷だけでなく、相関係数まで出力される
・斜交とは、因子の間に関係性(相関)があるということ。
直交とは、因子の間に相関なし。
相関が低い場合は、まったく違った概念の因子だと考えて解釈する。
・因子分析は、自分のデータを上手く説明できる解を求めればよいので、色々な
回転を試してみ、一番合っているものを見つけ出せばよい。
・因子分析の結果の見方は、かなり主観的なもの。
分散分析とは違う。
・ただ漠然と見るだけでは、データの関係性を上手く説明できない。
色々な角度から見ることで、上手くデータを説明できるところが見つかる。
そのデータを見る角度を探そうというのが、軸の回転である。
○そういうことかー。これ分かりやすいなー。
・因子寄与は、因子が質問項目に対してどの程度寄与しているのかという指標。
因子分析では、質問の回答が潜在的因子の影響を受けていると仮定している。
・因子間の相関は、持ちつ持たれつの関係。
「持ちつ持たれつ」の部分を捨ててしまうのが「影響を除去した」
「持ちつ持たれつ」の部分まで組み入れてしまうのが「影響を無視した」
・因子分析の計算をするときは、4つの要素を考える必要がある。
1)質問紙などで得られたデータ 2)因子の抽出法
3)因子数の決め方 4)共通性の値
・まず、十分な数のデータを集めることが第一。
・質問に回答した人は、いったいそれらの因子をどの程度強くもっているのか。
・パス図において、因子は○、質問項目のような観測変数は□で表現される。
・統計とは、確率的な手法であるから、確率的に最も近いようなところで
値を決めているだけ。
・因子得点は、とりあえず適当な値を勝手に決めただけと考えてよい。
因子分析とは、因子得点がどの程度であるのかを探るのが目的。
・因子分析とは、質問の回答が、2つの部分(共通因子と独自因子)から構成されて
いると考える。
・因子分析の利用目的の中でかなり多いのが、新しく質問紙を構成する場合。
因子分析をすることによって、質問紙尺度の中にどのような因子が存在するかが
分かり、そのためにどのような質問項目を設ければよいかが分かる。
○ここ、よく分からないな。
因子分析をした後に、質問項目を作る?
質問項目でデータを集めた後、因子分析をするのではないの?
・因子分析を行った時に、どのような形で論文に書けばよいか
-因子抽出法に何を使ったか
-因子数をどうやって決めたか
最小固有値で決める スクリープロットによる
因子寄与で決める 解釈可能性で決める
-回転法は何を使ったか
-因子名はどうやって決めたか
-項目の削除など
因子負荷や共通性の基準など
-因子負荷の表や因子間の相関の表
・因子抽出法と回転法について、何故その方法を選択したかの説明は不要。
・因子として成立するかどうか
============================
●因子分析の正しい使い方
・因子分析は、多変量解析の一つにすぎない
・多数の変量(観測変数)でのデータは、多変量解析の対象となるので、
多変量データともいわれる。
・因子分析は、多変量データに共通な潜在的な因子を探るもの
・主成分分析は、多変量データに共通な成分を探って、一種の合成変数を作りだすもの
因子をできるだけ少なくすることを目的とする。
・主成分分析では、より少ない次元で説明することが目的。
そのため第一成分でほとんどが説明できるというのは喜ばしい状態。
・主成分分析では、質問項目から主成分という合成成分を作るという仮定をもとに
分析をしていく。
○「合成成分」って?
・主成分分析は、因子分析の中のある一つの計算の仕方にすぎない。
・主成分分析で用いる「主因子法」という計算方法は、第一因子にできるだけ
因子寄与率を高くしようというもの。
・重回帰分析では、予測される変数のことを従属変数(予測変数)、予測に使う
変数のことを独立変数(説明変数)と呼ぶ。
・重回帰分析の場合、関係ない項目は捨て去りたいと考える。目は外の予測したい
変数の方を向いている。
・因子分析は、質問項目をクラスターにわけるような分析ともいえる。
・因子分析=第一世代の多変量解析 共分散構造分析=第二世代の多変量解析
・共分散構造分析では、変数間の関係性(構造)をあらかじめ決めておいて分析する
・因子分析は、「探索的」因子分析
共分散構造分析は、「検証的」「確認的」因子分析
・因子分析の神髄は、探索的因子分析にある。何か分からないところから潜在的な
因子を見つけてくれるという所に魅力がある。
・因子分析は、他の多変量解析と違って「構造方程式」によって限定されていない。
・因子分析は、意図的にやろうとすると、自分の思い通りの結果を出してしまうのが
たやすい。
したがって質問項目の内容の妥当性を十分に吟味する必要がある。
○これは気をつけないとなー。
・一番きれいにみえたところ、そこが最適の場所。
他の人が見ても納得できればいいのです。
○こういわれると気が楽になるなー。
・統計分析とは、たくさんのデータを少ない情報にまとめあげる作業
因子分析に乗らない多くの情報を捨てている。
・因子分析をどの程度厳密に行ったかよりも、どのような観測変数や質問項目を
準備したかの方が圧倒的に結果を左右する。
・因子分析を行う時に最も大事なのは、いかにデータをとるか。
○この本のあと「質問紙法」を読むといいのかも。
============================
コメントフォーム