社会科学研究所セミナー「回帰で斬る！」に参加しました。

授業

2012年3月5日（月）～6日（火）10時～17時　社会科学研究所＠東大
「回帰で斬る！」セミナーに参加しました。
昨年は、同じく社研主催の「二次分析入門」「二次分析道場」に参加しました。
https://www.learn-well.com/blog/2011/03/
今年も、楽しく学ぶことができました。
あくまで私の理解の範囲で、学んだことを記録に残しておきます。
（間違って理解している点があれば、ご教示ください）

＝＝＝
●イントロダクション
・従属変数Y＝β0＋β1＋βk＋u（誤差項）
　我々の仕事は、独立変数のパラメータ（βk）を推定し
　１）影響の有無（統計的有意性）を確認し
　２）効果の大きさ（限界効果）を求めること
・計量分析は、仮説を確認する作業にすぎない
　
・因果関係は、分析者が決める　根拠となるモデル（分析の枠組み）が重要
・実証論文には、平均、標準偏差、最大、最小値を「基本統計量」として示す
●相関分析
・相関分析　散布図で、視覚的に２変数の関係を捉える　
・相関係数を二乗　＝　単回帰分析の決定係数（説明力）
・相関係数は、直線的な関係を表している　
　　直線以外の関係もあるかもしれないので、散布図による確認が必要
・第三の要因を取り除いた後の相関の強さ＝偏相関
●単回帰分析
・コントロールしたい要因を変数として分析の枠組みに入れた上で、
　　一番見たい変数の影響の大きさを見る
・実社会で完全な直線関係を持つことはまれであり、ある程度ばらつくはず。
　　そのばらつき（直線からのずれ＝誤差項u）を組み込む
　もっともよさそうな直線をひく
・回帰分析　では、「係数」を見る
・有意確率　母集団にも言えそうか　Yes　
　　まちがえる確率は　低いほど良い　0.1%水準～
・非標準化係数　βは、β1のこと
　　標準化係数　ベータは、ベータコエッション？のこと
・（定数）＝切片　β0の結果　Xがゼロの時の、Yの値
・決定係数R二乗が大きいほど、モデルとしての説明力が高い
・有意水準　＊％（０．０＊）を下回っているかどうかがポイント
　　０．１％（０．００１）
　　　　１％（０．０１）
　　　　５％（０．０５）
　　　１０％（０．１０）
・限界効果　Xが一単位上がることに、Yがどのくらい上がるのか
・対数ｌｎ（Log?）で見た方が、バラつきが見やすくなる
●重回帰分析　Multiple regression（多重回帰分析）
・調整済みR二乗：
　「変数を増やし過ぎているよねー。ちょっとペナルティをあげるよ」
・推定結果の見方
　
　１）「係数」の有意確率：母集団でも言えそう
　２）βの限界効果：Xが一つ変わると、Yはどう変わる
　３）調整済みR二乗：説明力
　４）F値・有意確率：この分析に意味があったか
　５）ベータ：どれが効いているか？
・ｔ値は、２以上ならOK
・重回帰分析のやっかいな問題　多重共線性：
　　独立変数間の高い相関により有意な係数が得られにくくなる
・不偏推定量：「いいとこついてる」？
・過少定式化：必要な独立変数が、モデルに含まれていない
・計量は身体で覚えるもの、分析しながら数年かけてじっくり本を読む
●非線形関数の回帰
・対数（変換→変数の計算→算術→Lｎ（　））
　　を使った方が、モデルの適合度が高くなる
　(linear-logモデル　ｘ：対数）
　ｘが１％変化→ｙは（β１／100）変化
　ただ、βは％変化なので、係数を１００で割ること。
　(log-linearモデル　ｙ：対数）
　ｘが１単位変化→ｙは（β1*100%）１００をかける。
・２次関数を使った推定　ｙ＝ax2+bx+C
　　２乗項を入れると、モデルの適合度（R二乗）があがる
○関数や微分　こうやって必要性が分かってから、
　　高校の授業をうけたら、違ってたんだろうなー。
　「関数、微分、わかってますよね」という前提で進むけど、
　ちょっとしか覚えてないし、よく理解できていない。
・交差項（交互作用項）を使ったモデル
　
　例）高学歴（ｘ１）なほど、勤続年数（ｘ２）による
　　　　昇給幅（ｙ）が大きいかどうか　
●ダミー変数を使った回帰
・質的変数（性別、学歴、人種、地域)を、
　１，０の値をもつ「定数項ダミー」（切片？）に変えて、独立変数として使う。
・独立変数としてのダミー変数の使用は、政策の効果をはかる
　　ひとつの方法。
　例）助成金をうけた（Yes＝１　No＝０）
●特殊なデータの分析
・回答にゼロが多いデータでは、OLS（最小二乗法）は使わない
　打ち切り、切断、カウントデータ（子供の人数など）では、
　　OLSは使わない。順序ロジットを使う。
●まとめ
・研究は人のあらを探して攻撃し、その穴を埋めていく。
　　次は自分が屍となって、科学が進展していく。
・論文にする
　１．はじめに　問題意識、研究意義
　２．先行研究　既存知見、残された課題
　３．分析の枠組み　理論モデル、仮説の提示
　　　　　　　　　　　　　推定モデル、推定方法
　４．推定　基本統計量の提示、推定結果の提示と解釈
　５．結論　問題意識と結論　残された課題
　６．謝辞
＝＝＝
どうもありがとうございました。

投稿者：関根雅泰

投稿日：2012年03月07日 06:09

社会科学研究所セミナー「回帰で斬る！」に参加しました。

コメントフォーム コメントをキャンセル

コメントフォームコメントをキャンセル