2008年9月26日 星期五

辛普森悖論(Simpson's Paradox)

辛普森悖論(Simpson's Paradox),亦有人譯為辛普森詭論,為英國統計學家(E. H. Simpson)於1951年提出的悖論,即在某個條件下的兩組數據,分別討論時都會滿足某種性質,可是一旦合併考慮,卻可能導致相反的結論。

茲舉一例說明:
今有甲、乙兩所高中,甲校參加大學入學考試的學生中,男有400人、女100人;乙校參加大學入學考試的學生中,男有100人、女400人。考慮兩校的國立大學錄取率,設甲校的國立錄取率男、女依序為40%、60%,乙校的國立錄取率男、女依序為30%、50%,乍看之下,乙校整體的國立錄取率似乎較低(因乙校男、女的國立錄取率分別低於甲校男、女的國立錄取率,且差距達10%),但經過仔細計算:
甲校的國立大學錄取率為(400*0.4+100*0.6)/500=44%
乙校的國立大學錄取率為(100*0.3+400*0.5)/500=46%
反而乙校整體的國立大學錄取率比甲校高。

這種分別討論時所得的結論和合併討論時的結論完全相反的現象,就稱辛普森悖論。

是故,不論是在瀏覽網路新聞或報章雜誌中的統計數據資料時,我們應格外注意此現象,特別是當統計數據是以某種分類的方式作比較時,一定要仔細計算合併後的數據,以免遭到誤導。

2008年9月13日 星期六

愛唱歌的女兒

也記不得女兒是多大時開始愛唱歌的
只記得她的第一首招牌歌就是「小星星」
應該是兩個月前左右就會唱了(目前她1y 9m 23d)

她唱歌有個習慣
就是左右腳交替站立
看起來搖頭晃腦挺有趣的

以下是今天幫她拍的DV影片
難得她很配合喔