2010-10-18

教育におけるジェンダーの不平等

　分析がうまくいかないので（？）、Annual Review of Sociology の論文（Buchmann et al. 2008）を読む。幼少期から青年期にかけての学習パフォーマンスの性差や大学進学率における性差とその変動についてコンパクトな記述でまとめられている。階級や人種と性差とのインタラクションについてもうすこし詳しく知りたかったけれど、それは今後、探求していくべき研究課題のようである。ただ、本文中で性別と進学率との関係に見られる階級ごとのちがいなどについて触れられている箇所があり（1960年代のアメリカでは階級が低いと女性の教育達成が低くなっていたが、現在は関係が逆転して、階級が低い男性がもっとも不利らしい）、それなりに勉強になった。文献リストも参考になるし。分析をやめて、しばらく関連論文を読んでみるか。Buchmannらも指摘しているようにOECD諸国のなかで日本、韓国、トルコ、スイスは進学率の性差に関して特殊だから、最終的には日本の様子をうまく説明できるオリジナルな仮説をつくる必要は出てくるが。

2010-06-27

ロジスティック回帰分析

統計; 計量モデル R

人文・社会科学のためのカテゴリカル・データ解析入門

作者: 太郎丸博
出版社/メーカー: ナカニシヤ出版
発売日: 2005/07/01
メディア: 単行本
購入: 1人クリック: 26回
この商品を含むブログ (12件) を見る

　統計学の教科書に載っている女性の年齢と未婚率の関係の分析（太郎丸 2005: 173）を再現してみる。まずは個票データに対してロジスティック回帰分析を適用するやり方から。

Y	<- c(rep(0,  1), rep(1, 20),		# 0＝既婚，1＝未婚
             rep(0, 29), rep(1, 25),
             rep(0, 56), rep(1, 10),
             rep(0, 49), rep(1,  3),
             rep(0, 59), rep(1,  2),
             rep(0, 70), rep(1,  3),
             rep(0, 76), rep(1,  3))
X	<- c(rep(22, 21), 			# 年齢カテゴリの階級値
	     rep(27, 54), 
	     rep(32, 66), 
	     rep(37, 52),
             rep(42, 61), 
	     rep(47, 73), 
	     rep(52, 79))
d1	<- data.frame(Y, X)

　未婚か既婚かをあらわす変数Yを年齢Xに回帰させるロジスティック回帰式を立てて、最尤推定法をつかって推定する。

l1	<- glm(Y~ X, data = d1, family = binomial)
summary(l1)

Call:
glm(formula = Y ~ X, family = binomial, data = d1)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.5388  -0.4826  -0.1876  -0.1158   3.1648  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  5.08655    0.78789   6.456 1.08e-10 ***
X           -0.19400    0.02472  -7.848 4.23e-15 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 360.44  on 405  degrees of freedom
Residual deviance: 251.52  on 404  degrees of freedom
AIC: 255.52

Number of Fisher Scoring iterations: 6

　推定結果を見ると $\mathrm{logit}(\hat{p}) = 5.08655 - 0.19400 X$ となっている。切片と年齢の回帰係数の推定値はいずれも1％水準で統計的に有意である。

　次にクロス集計された結果に対してロジスティック回帰分析を適用する方法を実行してみる。この場合、あらかじめクロス表形式の集計データを用意しておく必要がある。

X1	<- c(22, 27, 32, 37, 42, 47, 52)
Y1	<- c(1, 29, 56, 49, 59, 70, 76)
Y2	<- c(20, 25, 10, 3, 2, 3, 3)

d2	<- data.frame(X1, Y1, Y2)
d2						# データを確認

  X1 Y1 Y2
1 22  1 20
2 27 29 25
3 32 56 10
4 37 49  3
5 42 59  2
6 47 70  3
7 52 76  3

　結婚状態のカテゴリのうち、未婚（Y2）を1、既婚（Y1）を0として年齢×結婚状態のクロス表にロジスティック回帰モデルを当てはめる。

l2	<- glm(cbind(Y2,Y1)~ X1, data = d2, family = binomial)
summary(l2)

Call:
glm(formula = cbind(Y2, Y1) ~ X1, family = binomial, data = d2)

Deviance Residuals: 
       1         2         3         4         5         6         7  
 2.99032   0.01082  -1.87446  -1.31202  -0.47296   1.31558   2.35751  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  5.08655    0.78789   6.456 1.08e-10 ***
X1          -0.19400    0.02472  -7.848 4.23e-15 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 130.614  on 6  degrees of freedom
Residual deviance:  21.689  on 5  degrees of freedom
AIC: 47.495

Number of Fisher Scoring iterations: 5

　ロジスティック回帰式の推定結果は個票データを分析したときと同じだが、Null devianceとResidual devianceの数値が先ほどの結果と異なっている。このResidual devianceの値が教科書の $G^2$ の値と一致するから、ロジスティック回帰式から推定される未婚者の期待度数と実際のセル度数との乖離の程度をあらわしているのだと思う。期待度数 $\hat{\mu}_{ij}$ と観測度数 $n_{ij}$ から尤度比統計量 $G^2$ を、次の式

$G^2 = 2 \sum_{\mathrm{cells}} n_{ij} \log_e \frac{n_{ij}}{\hat{\mu}}_{ij}$

によって計算することができるので、一応、計算結果を確認しておく。

P1	<- 1 - fitted(l2)
P2	<- fitted(l2)
M	<- Y1 + Y2
E1	<- P1 * M
E2	<- P2 * M
LR1	<- sum(Y1 * log(Y1 / E1))
LR2	<- sum(Y2 * log(Y2 / E2))
G2	<- 2 * (LR1 + LR2)

G2
[1] 21.6894

　後者のやり方だとモデルの適合度がただちにもとまるから便利。ロジスティック回帰分析について、もっときちんと勉強しないと。

2010-05-25

一般線形混合モデル

統計; 計量モデル SPSS

基礎から学ぶマルチレベルモデル―入り組んだ文脈から新たな理論を創出するための統計手法

作者: Ita Kreft,Jan de Leeuw,小野寺孝義,菱村豊,村山航,岩田昇,長谷川孝治
出版社/メーカー: ナカニシヤ出版
発売日: 2006/11
メディア: 単行本
購入: 3人クリック: 40回
この商品を含むブログ (4件) を見る

　Rで推定したマルチレベル分析の結果を、SPSS（PASW）で確認してみる。分析はKreft and de Leeuw（1998＝2006）を見ながら。ただしデータの管理はRでおこなっているので、データの作成や加工（Kreft and de Leeuw 1998＝2006: 166-74）は省略（実行済み）。

/* 切片のみのモデル */
MIXED Y1
  /CRITERIA = CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR 
   (0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) 
   PCONVERGE(0.000001, ABSOLUTE)
  /FIXED = | SSTYPE(3)
  /METHOD = ML
  /PRINT = G SOLUTION TESTCOV
  /RANDOM = INTERCEPT | SUBJECT(G) COVTYPE(VC).

/* 切片＋レベル1変数 */
MIXED Y1 WITH X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
  /CRITERIA=CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR
   (0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) 
   PCONVERGE(0.000001, ABSOLUTE)
  /FIXED = X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 | SSTYPE(3)
  /METHOD = ML
  /PRINT = G SOLUTION TESTCOV
  /RANDOM = INTERCEPT | SUBJECT(G) COVTYPE(VC).

/* 切片＋レベル1変数＋レベル2変数 */
MIXED Y1 WITH X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 W1 W2
  /CRITERIA=CIN(95) MXITER(100) MXSTEP(5) SCORING(1) SINGULAR
   (0.000000000001) HCONVERGE(0, ABSOLUTE) LCONVERGE(0, ABSOLUTE) 
   PCONVERGE(0.000001, ABSOLUTE)
  /FIXED = X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 W1 W2 | SSTYPE(3)
  /METHOD = ML
  /PRINT = G SOLUTION TESTCOV
  /RANDOM = INTERCEPT | SUBJECT(G) COVTYPE(UN).

　変数の構成や推定方法（ML）が同じなので、当然、結果はRで推定したものと一致する。こうして見ると、Rのスクリプトは本当にシンプルなんだなと実感。SPSSの混合モデルのシンタックスは、ちょっと覚えられそうにない。

2010-05-14

なぜ容認可能な収入格差の水準が異なるのか

読書; 社会意識

@article{hdlr2005,
author  = {Hadler, Markus},
title   = {Why Do People Accept Different Income Ratios? 
A Multi-level Comparison of Thirty Countries},
journal = {Acta Sociologica},
volume  = {48},
number  = {2},
pages   = {131-154},
year    = {2005},
}

　ISSPのデータを用いて収入格差についての態度を分析したもの。従属変数は“Differences in income in (country) are too large”という主張への賛否をたずねたもので、日本の社会調査でもときどき見かけるワーディングである。意外だったのはISSPに参加した30ヵ国の回答分布を見ると、明らかに回答は賛成寄りに偏っていて、“Strongly agree”も少なくないということ。日本ではもちろん賛成する人が多いが、30ヵ国の平均で82％の人が賛成側の選択肢に回答しているので、収入格差が大きすぎると考えている人の割合はかなり多いということになる。不平等主義への信奉が篤いとされるアメリカでさえ収入格差が大きすぎるという意見が多数派になっている（66％）。大きすぎると考えている人が少ないのは北アイルランドやオランダ、キプロスといった国だが、それでもやはり過半数の人は、社会における収入の格差は大きすぎると回答している。

　収入格差に対するこのような国ごとの評価のちがいを生み出している要因を、マルチレベルモデルをつかって探索するというのがこの論文の要点である。たくさん仮説が出てくるが、仮説はシンプルなものばかりである。この論文が検討対象としているような意識を分析した先行研究では、「社会主義の歴史は今なお平等への志向といった形で、人々の心のなかに残り続けている（それゆえ、旧社会主義国に居住している人は、他地域に居住している人よりも平等志向が強い）」といった主張がしばしばなされている。意識の国ごとの傾向のちがいを生じさせうるこのような国レベルのファクターを実際にモデルに組み込むことで、従来の研究で議論されてきた関係をより直接的な手続きで検討しようという意図からマルチレベルロジスティック回帰分析を、30ヵ国をプールしたデータに適用している。分析結果を見ると、収入格差の客観的指標であるジニ係数ではなく、経済的発展度をあらわすGNPの水準のほうが、収入格差評価に対して有意な影響をもつことが読み取れる（経済的に豊かな国であるほど、収入の格差が大きすぎると回答する人が平均して少なくなる）。イングルハートの脱物質主義論やベックの「古い」不平等への関心低下に関する議論を引きながら、この結果を解釈している。検討モデル中、国レベルの変数でもっとも大きな影響力をもっていたのは、支配的イデオロギーにかかわる変数であった。支配的イデオロギーは社会に不平等（収入格差）が存在することの意義・理由について聞いた質問の国ごとの平均値と標準偏差から操作化している。効果の向きとしては、不平等を許容する考え方への国レベルでの支持率が高く、また国のなかで人々が多様な意見をもっているよりは意見が均質的なほど、収入格差が大きすぎるとは考えにくくなるというものであった。

　このほかにも社会主義の歴史の影響や宗教的伝統の効果が検討されている。また、もちろん個人レベルの変数もモデル内で統制されている。自分の関心に引き付けると、不平等度（ジニ係数）よりも豊かさ（GNP）のほうが有意な効果をもっているという結果が興味深い。仮説をつくるときの参考にできそう。この論文がおこなっているような支配的イデオロギーの操作化も、やり方の1つではあると思う。個人レベルの意識に対する文化・構造的要因の影響を見ることの必要性と有効性はかなり以前からいわれていたが、文化的要因のほうはどうやって操作化したらよいのか、よくわかっていなかった。公開されているデータから操作的定義をもってくるのが難しい場合、この論文のようにデータセット内の情報を利用するというのもありだと思う。

2010-05-12

東西における収入分配の公正評価

読書; 社会意識

@incollection{ahvw1995,
 author    = " Arts, Wil and Hermkens, Piet and {van Wijck}, Peter",
 title     = "Justice Evaluation of Income Distribution in East and West",
 booktitle = "Social Justice and Political Change: Public Opinion
 in Capitalist and Post-Communist States",
 publisher = "Aldine de Gruyter",
 year      = "1995",
 editor    = "Kluegel, James R. and Mason, David S. and Wegener, Bernd",
 pages     = "131-149",
 address   = "New York",
}

Social Justice and Political Change: Public Opinion in Capitalist and Post-communist States (Social Institutions and Social Change)

作者: David Mason
出版社/メーカー: Routledge
発売日: 1995/12/31
メディア: ペーパーバック
この商品を含むブログ (1件) を見る

　この前の論文と同じ本に収録されている別の論文。前半の公正評価モデルの定式化のところがけっこうややこしい。以下に、たぶんこういうことだろうと思うまとめ（誤解している部分があるかも）。

　個人 $i$ の受け取る報酬と報酬総和との比が、個人 $i$ がなした貢献と貢献総和との比に等しいとき、個人 $i$ は公正な報酬を受け取っていると仮定する。すなわち、

$O^e_i/O^e_{\mathrm{tot}} = I^e_i/I^e_{\mathrm{tot}}$

式を整理して、上のような意味での公正という観点から個人が受け取るべき報酬額について、次の定義をえる。

$O^e_i = \left(O^e_{\mathrm{tot}}/I^e_{\mathrm{tot}}\right)I^e_i$

　一方、個人 $i$ の貢献は報酬との関連が予想される $m$ 個の特性について個人 $i$ がもつ値の重み付けの合計によってとらえる。つまり、

$I^e_i = \sum^m_{k = 1}\alpha^e_k K_{ki}$

ここで $\alpha^e_k$ は個人 $i$ の貢献度を考える際に特性 $K$ をどのくらい重視するべきかという問題に関して、それぞれの特性 $K$ がもつ重みをあらわしていると見なす。ここで、話を単純にするために、次のような2人の個人が受け取るべき公正な収入がいくらくらいになるのかを考える。考慮すべき特性は2つしかなく、個人1はそれぞれについて $K_{11} = 1$ 、 $K_{21} = 0$ の値を、個人2はそれぞれについて $K_{12} = 0$ 、 $K_{22} = 1$ の値をもつ。したがって個人1の貢献は $I^e_1 = \alpha^e_1 \times 1 + \alpha^e_2 \times 0 = \alpha^e_1$ 、個人2の貢献は $I^e_2 = \alpha^e_1 \times 0 + \alpha^e_2 \times 1 = \alpha^e_2$ である。ゆえに個人1の公正収入は $O^e_1 = I^e_1/\left(I^e_1 + I^e_2\right)O^e_{\mathrm{tot}}$ 、個人2の公正収入は $O^e_2 = I^e_2/\left(I^e_1 + I^e_2\right)O^e_{\mathrm{tot}}$ 、すなわち、それぞれ $O^e_1 = \alpha^e_1/\left(\alpha^e_1 + \alpha^e_2\right)O^e_{\mathrm{tot}}$ および $O^e_2 = \alpha^e_2/\left(\alpha^e_1 + \alpha^e_2\right)O^e_{\mathrm{tot}}$ になる。これを一般化して、この状況のもとで個人 $i$ が受け取る公正収入の定義について、

$O^e_i = \alpha^e_i / \left(\alpha^e_1 + \alpha^e_2\right)O^e_{\mathrm{tot}}$

をえる。ここで、

$\beta^e_i = \alpha^e_i / \left(\alpha^e_1 + \alpha^e_2\right)$

とおくことによって、個人 $i$ の公正収入は

$O^e_i = \beta^e_i O^e_{\mathrm{tot}}$

となる。 $\beta^e_i$ について整理することで、次の式をえる。

$\beta^e_i = O^e_i / O^e_{\mathrm{tot}}$

　ところで、以上の定式化は個人 $i$ の公正収入について適用されるものだが、個人 $i$ が実際に受け取っている収入の場合も同じように考えることができる。そのとき収入の総和における個人 $i$ のシェアは $\beta^a_i = \alpha^a_i / \left(\alpha^a_1 + \alpha^a_2\right)$ で、やはり $\beta^a_i = O^a_i / O^a_{\mathrm{tot}}$ の関係がえられる。一般的に個人 $i$ について、実際の収入と公正な収入とが一致しているとき、公正な配分状況が成立していると評価することができる。これは次式の左辺が0になる状況に一致する。

$E_i = \mathrm{ln}\left[\left(O^a_i / O^a_{\mathrm{tot}}\right) / \left(O^e_i / O^e_{\mathrm{tot}}\right)\right]$

なお、これまでの議論から上式が次の式と等価であることは明らかである。

$E_i = \mathrm{ln}\left(\beta^a_i / \beta^e_i\right)$

　この論文の従属変数は $\beta^e_i$ で、大企業の社長と非熟練労働者が受け取るべき正当な収入についてたずねた質問から操作化している。 $\beta^e_i$ の規定要因としてもっとも重要と予想されるのは大企業の社長（あるいは非熟練労働者）が実際に受け取っている収入のシェア、すなわち $\beta^a_i$ だが、それ以外にも回答者の世帯収入がどれくらいだとか、平等主義的な価値観をもっているかとかいった事柄も、 $\beta^e_i$ の水準を左右すると考えられる（例：平等主義的な人は大きな収入格差を生むような分配原理を否定するので、大企業の社長の取り分があまり大きくなりすぎるのを嫌う）。そこで $\beta^a_i$ 以外に学歴主義や平等主義といった価値観、政治的イデオロギー、回答者の世帯収入（国平均で除）を独立変数に含む下記のモデルを東西別の国グループに対して推定している。

$\beta^e_i = \xi_b\beta^a_i + \xi_pP + \xi_nN + \xi_cC + \xi_mM + \xi_yY$

　 $\xi_b$ の推定結果を見ると、体制の東西を問わず $\beta^e_i$ に対する実質的な影響力をもち、ここから公正評価のプロセスにおいてあるていど普遍的と考えてもよいような何らかの心理学的規則性が働いていると推察できる。しかしながら $\xi_b$ の推定値は西側でより大きな値になっている（非標準化係数）。これは“What is”が“What ought to be”を判断する際の規範的なルールとして確立するためにはそれなりに長い時間を要するというHomansの観察結果と一致する。変動期にある東側諸国では、まだ現実の状況が公正な配分状態を体現していると評価できる段階にはいたっていないということだろう。現段階では東西において収入における公正性を判断するメカニズムがまったく同一のものと結論することはできない。

　 $\xi_b$ 以外の推定値についてはさらっとした記述しかないけれど、やはり東西で異なった傾向があるようだ。平等主義的な人ほど大企業の社長の収入を少なくすべきと考える傾向は東側でより顕著だし、西側では上位の収入階層に位置する人や右寄りの人は大企業の社長の正当な収入を高めに設定している。やはり西側において功績や貢献の原理がより浸透している証拠かもしれない。概念と変数操作の対応関係についてところどころついていけていないところがあるけれど、だいたいの内容はつかめた（と思う）。でも、もっとオーソドックスな社会学系の論文も読んでおかないと。それと、もっと最近の論文も。

2010-05-10

社会構造、システムの正当性、公正感

読書; 社会意識

@incollection{agk1995,
 author    = "Alwin, Duane F. and Gornev, Galin and Khakhulina, Ludmila",
 title     = "Comparative Referential Structures, System Legitimacy,
 and Justice Sentiments: An International Comparison",
 booktitle = "Social Justice and Political Change: Public Opinion 
in Capitalist and Post-Communist States",
 publisher = "Aldine de Gruyter",
 year      = "1995",
 editor    = "Kluegel, James R. and Mason, David S. and Wegener, Bernd",
 pages     = "109-130",
 address   = "New York",
}

　International Social Justice Projectの論文集の一編。かなり久しぶりにこの種のトピックを扱った論文を読む。社会主義の体制をとっていた東ヨーロッパや中央ヨーロッパの国々では、旧ソビエト連邦の崩壊後、経済や政治のシステムが大きく変動したにもかかわらず、人々は新しい体制にそれなりにうまく適応しているように見える。こうした動きはマルクス主義や機能主義の理論によってはうまく説明できないので、人々の意識やイデオロギーを実証的に調べることで、社会体制が正当性を獲得するメカニズムを探っていこうというもの。

　旧東側の国々と旧西側の国々とでは依然として大きな意識のちがいがあり、東側の国々では多くの人が現状では収入の格差が大きすぎると評価していたり、報酬の配分がその人の貢献をきちんと反映したものになっていないと考えていたりと、経済システムの働きに対する信頼が低い。とはいえ、東側の国々でも市場経済を支持する人はかなりたくさんいるし、社会主義には圧倒的多数の人が反対しているので、体制のちがいを分断線として人々の意識がまったく異なっているというわけでもない。多くの人は資本主義の価値観を受け入れようとしているが、実際の社会がまだそれをじゅうぶんに達成できていないので、経済や政治のシステムの振る舞いに対する評価はあまり高くないということであろう。

　回答者が考えている望ましい収入の水準を従属変数とした重回帰分析では、望ましい収入の水準が実質的に回答者の収入実額で決まっている国と、そうではない国がある。後者のグループにはもっぱら旧東側諸国の国が入り、これらの国々では望ましい収入の水準は、回答者の世帯にとって「これだけは必要」という収入の水準がどの程度かによって決まっている。つまり、世帯収入が必要と思う水準に達していないので、もっと多くの収入が欲しいと考える人ほど、望ましい収入水準を多めに答える傾向がある。このような「必要原理」は旧西側の国々でも望ましい収入の水準をある程度規定しているが、標準化係数の値は旧東側の国々に比べてずっと低いものになっている。

　論文のメインの分析は望ましい収入の水準を規定している要因の国による変動を探ることで、それによって社会体制への評価プロセスが、国の制度や歴史によって異なりうる可能性を検証しようとしている。社会の正当性に対する人々の評価を議論する題材として望ましい収入水準をとりあげるという手続きには違和感があるが、社会心理学系の公正評価研究ではそれなりの理論的背景があるのかもしれない。収入実額と望ましい収入水準の相関が高い場合、それだけ人々が現状を肯定的にとらえている証拠だといわれれば、そうかという気もするし。それよりもこの分析結果が、結局、社会主義の崩壊から市場経済システムへという社会体制の崩壊と再統合の過程に対して、どのようなインプリケーションをもつのかいまいち分かりにくいという点が気にかかる。既存の理論では社会変化のプロセスをじゅうぶんに説明できないので、この論文のような分析が必要であるというのが、当初の研究動機だったはず。

　それにしても扱っているトピックが経済的不平等や政治システムに対する意識で、対象が1990年頃のヨーロッパ（＋日本）となると、さすがに国ごとにかなり意識の分散がある。ISJPは国の数が12しかないので厳しいし、「旧社会主義ダミー」でけっこう説明できてしまいそうという難点があるけれど、マルチレベル分析向きのデータかもしれない。なんだか、読んでおくはずだった論文がたくさん。合宿まであと9日。大会まであと19日。

2010-04-25

SPSS 18.0

SPSS

　UMPCにSPSSをインスコ（年間ライセンス）。もうSPSSじゃなくて、PASWなんだけどね。