二項分布と正規分布、標本による母集団の推測、信頼区間~2018センター試験・数学ⅡB・第5問
今年(2018年)の大学入試センター試験も無事終了。ムーミン問題、
携帯バイブ問題、試験官の居眠りなど、多少のトラブルや不祥事は
生じたが、志願者だけで全国60万人近くだから仕方ないだろう。
どれほど努力しても、ミスやエラーの確率は決してゼロにはならない。
例えば、1人当たりのトラブル発生率が0.1%で独立とするなら、
60万人×0.1%=600人
実際は問題作成者やスタッフも大勢関係するし、独立ではなく従属
だから、トラブルに巻き込まれる人数はさらに増えることになる。
☆ ☆ ☆
自分については正常な出来事が起こるはず、と考えるような楽観的
発想については、先日のドラマ『BG~身辺警護人~』第1話だと、
「正常性バイアス」と呼んでた。私だけは大丈夫という主観的な判断・
心理を正しいと思い込む、確証バイアスの一例とも考えられる。
もちろん、「ケセラセラ」(なるようになるさ)と達観するのも、一つの
生き方だろう。しかし一般的な正論としては、確率と統計を冷静に
把握し、可能性の低いリスクにもそれなりに考慮する必要がある。
例えば、意外と起伏に富む首都圏で数年ぶりの大雪が降った時、
車を運転すると、一部で何が起きるのか。昨日、今日のニュースを
見てれば実感できる。自分の車が大丈夫でも、他の車に問題が
生じたら巻き込まれてしまうのだ。スリップとか坂道を登れないとか。
今日は、草津国際スキー場で白根山の噴火も起きてる。世界遺産
ブームでにぎわう夏の富士山なら、遥かに大きな騒動だったはず。。
☆ ☆ ☆
というわけで、前置きがやや長くなったが、地道に確率・統計を解説
することにしよう。今年は既にセンター数学記事を1本アップしてある。
陸上選手の体格指数BMI(散布図と補助線の傾き、箱ひげ図)
~2018センター試験・数学ⅠA・第2問
上の記事で扱ったのは数学ⅠAの必答問題だが、これから書くのは
数学ⅡBの選択問題。つまり、理解してる人がかなり少ない分野の
話だ。だからこそと言うべきか、難易度レベルは低くて、教科書の
章末問題Aといった感じ。発展問題ではない。河合塾の分析でも、
標準とされてた。
以下、解き方はもちろん、問題文もコピペではなく私が簡単にまとめ
直したもの。原文は河合塾その他、大手予備校などで公開されてる
ので、そちらを参照。下図のようなpdfファイルで無料配布されてる。
ちなみに、大学入試センターの公式発表はなぜかいつも遅い。
☆ ☆ ☆
第5問 必要に応じて、正規分布表を用いてもよい。
(1) aは正の整数。2,4,6,・・・,2aの数字が1つずつ
書かれたa枚のカードが箱に入っている。1枚を無作為
に取り出す時、書かれた数字を表す確率変数をXとする。
X=2aとなる確率を求めよ。
次に、a=5とする。Xの平均(期待値)と分散を求めよ。
また、sX+tの平均が20、分散が32となるように、定数
s(>0)、tを定めよ。さらにその時、sX+tが20以上で
ある確率を小数で求めよ。
(解答) まず、 確率 P(X=2a)=1/a ・・・ア、イ
次に、a=5の時、
平均 E(X)=(2×1/5)+(4×1/5)+・・・
=(2+4+6+8+10)/5
6 ・・・ウ
∴ 分散 V(X)
=(2-6)²×1/5+(4-6)²×1/5+・・・
=(16+4+0+4+16)/5
=8 ・・・エ
さらに、(sX+tの平均)=s・(Xの平均)+t、
(sX+tの分散)=s²・(Xの分散)だから、
与えられた条件を連立方程式に直すと、
s×6+t=20
s²×8=32
s>0より、 s=2 ・・・オ、 t=8 ・・・カ。
∴ (sX+tが20以上の確率)
=P(2X+8≧20)
=P(X≧6)
=P(X=6)+P(X=8)+P(X=10)
=0.6 ・・・キ
(2) (1)でa≧3とする。箱から3枚同時に取り出し、横1列に
並べた時、左から小さい順に並んでいる事象をAとして、
Aの起こる確率を求めよ。
この試行を180回繰り返す時、Aが起こる回数を表す確率
変数をYとする。Yの平均m、分散σ²を求めよ。
さらに、回数が大きいので正規分布と考え、
Z=(Y-m)/σ とおいて標準化する。
P(18≦Y≦36)を、Zの確率を利用して求めよ。
(解答) 並び方は全部で、 3P3=3×2×1=6通り。
これらは同様に確からしいので、
P(A)=1/6 ・・・ク、ケ
Yは、180回中にAが起こる回数だから、二項分布に従う。
∴ 平均 m=180×1/6
=30 ・・・コサ
分散 σ²=180×(1/6)×{1-(1/6)}
=25 ・・・シス
よって Z=(Y-m)/σ=(Y-30)/5 だから、
Y=5Z+30
∴ P(18≦Y≦36)
=P(18≦5Z+30≦36)
=P(-2.40≦Z≦1.20) ・・・セ、ソタ、チ、ツテ
=P(0≦Z≦2.40)+P(0≦Z≦1.20)
≒0.4918+0.3849 (正規分布表の数値より)
≒0.88 ・・・トナ
(3) ある都市の世論調査で、無作為に400人の有権者を選び、
ある政策の賛否をたずねると、320人が賛成だった。全体の
賛成者の割合(母比率)pを推測する。
まず調査での賛成比率(標本比率)を求めよ。また二項分布
の正規分布による近似を用いて、pに対する信頼度95%の
信頼区間を求めよ。
続いて、その区間の幅をL₁とする。また、標本の大きさ400、
比率0.6の時の信頼区間の幅をL₂とし、大きさ500、比率
0.8の時の信頼区間の幅をL₃とする。L₁、L₂、L₃の不等式
を求めよ。
(解答) 標本比率は、 320/400=0.8 ・・・ニ
また、信頼度95%の信頼区間は公式より、
0.8-1.96×√0.8×0.2/400
≦ p ≦ 0.8+1.96×√0.8×0.2/400
∴ 0.8-1.96×0.02
≦ p ≦0.8+1.96×0.02
端数を四捨五入して、信頼区間は
0.76 ≦ p ≦ 0.84 ・・・ヌネ、ノハ
さらに、 L₁=2×(1.96×√0.0004)=0.08。
また、標本の大きさ400、比率0.6の時、同様の計算で
信頼区間の幅を求めると、
L₂=2×(1.96×√0.6×0.4/400)
=2×(1.96×√0.0006) > L₁
標本の大きさ500、比率0.8の時、信頼区間の幅は、
L₃=2×(1.96×√0.8×0.2/500)
=2×(1.96×√0.00032) < L₁
以上まとめると、 L₃ < L₁ < L₂ 。
つまり、答は4番。 ・・・ヒ
☆ ☆ ☆
なお、最後のL₂やL₃を真面目に計算すると時間の浪費になる。
また信頼区間の公式は、標準正規分布表などから近似的に求めた
もの。変数が0~1.96の区間に入る確率が0.475だから、
-1.96~1.96の区間に入る確率が0.95。
つまり95%ということになる。
下の正規分布(ガウス分布)表で、色付きの数値を参照。
その変数を、ここでは
(p´-p)/√p(1-p)/n (p´は標本比率)
と考えると、95%信頼区間は
-1.96≦ (p´-p)/√p(1-p)/n≦1.96
∴ p´-1.96×√p(1-p)/n
≦ p ≦ p´+1.96×√p(1-p)/n
さらに、不等式の左と右のpを標本比率で近似して、
95%信頼区間の公式が完成。
p´-1.96×√p´(1-p´)/n
≦ p ≦ p´+1.96×√p´(1-p´)/n
☆ ☆ ☆
上の覚えにくい不等式を暗記してそのまま使うのが、高校数学とか
大学受験数学ということになる。試験場で自分で導くのは困難。
しかし、この理論は近似だらけだし、説明も省略されてるので、他の
話と比べると説得力に乏しい。もし本格的に近似を正当化する証明
を行うと、完全に大学(以上)の数学のレベルになる。少なくとも中心
極限定理や確率密度関数が必要で、経験的正しさを主張するには
大数の法則という厄介な問題も絡んで来る。
というわけで、公式データは発見できてないが、この問題の選択者
は少ないはず。学研のサイトでは、「あまりおすすめはできません」
とアドバイスされてた。
だから逆に、マニアック・ブログが進んで扱うことになるわけだ。
それでは今日はこの辺で。。☆彡
(計 3315字)
| 固定リンク | 0
「数学」カテゴリの記事
- パズル「絵むすび」34、解き方とコツ、考え方(難易度4、ニコリ作、朝日新聞be、2025年5月24日)(2025.05.25)
- 小学生の習い事と受験勉強でしぶとく人気の算盤(そろばん)、令和ではタブレットと可愛いアプリで(2025.04.26)
- トランプ相互関税の税率の数式、経済的にも意味はあるけど数値1つ(分母の係数 φ)の代入ミス、英語原文と数学的解説(2025.04.09)
- 高速で高度な推論を行う最新AI、ChatGPT o3-mini にパズル「絵むすび」(朝日be、ニコリ作)を解かせると、少し出来る程度(2025.03.25)
- 4×9=36マスの格子を、8つの長方形(1~8マス)に区切る方法~開成中2025年入試、算数・問題2の解き方(2025.02.15)
「教育」カテゴリの記事
- APU(立命館アジア太平洋大学、別府市)の番組2つの比較、NHK『多国籍学生寮の72日間』はドキュメント72時間よりリアル(2025.06.11)
- 4×9=36マスの格子を、8つの長方形(1~8マス)に区切る方法~開成中2025年入試、算数・問題2の解き方(2025.02.15)
- かけ算の九九の表で、長方形で囲まれた数を足して315になる場合~灘中学校2025年入試、算数1・問題6の解き方(2025.02.07)
- 動画配信のおすすめ作品など、商業サイトでお薦めを決める方法と計算回数~2025年共通テスト・旧情報関係基礎・第2問(2025.02.04)
- くじ引き3回の参加料と景品代の期待値、金額設定の妥当性 ~ 2025年共通テスト・数学 Ⅰ A・第4問(2025.01.22)
コメント