« 井上荒野「キュウリいろいろ」2~長編小説『キャベツ炒めに捧ぐ』全体を読んで | トップページ | 大雪と凍結で走れない日、噴石で舞い上がるスキー場の雪煙に驚愕・・ »

二項分布と正規分布、標本による母集団の推測、信頼区間~2018センター試験・数学ⅡB・第5問

今年(2018年)の大学入試センター試験も無事終了。ムーミン問題、

携帯バイブ問題、試験官の居眠りなど、多少のトラブルや不祥事は

生じたが、志願者だけで全国60万人近くだから仕方ないだろう。

 

どれほど努力しても、ミスやエラーの確率は決してゼロにはならない。

例えば、1人当たりのトラブル発生率が0.1%で独立とするなら、

 60万人×0.1%=600人

 

実際は問題作成者やスタッフも大勢関係するし、独立ではなく従属

だから、トラブルに巻き込まれる人数はさらに増えることになる。

 

 

     ☆        ☆        ☆

自分については正常な出来事が起こるはず、と考えるような楽観的

発想については、先日のドラマ『BG~身辺警護人~』第1話だと、

「正常性バイアス」と呼んでた。私だけは大丈夫という主観的な判断・

心理を正しいと思い込む、確証バイアスの一例とも考えられる。

 

もちろん、「ケセラセラ」(なるようになるさ)と達観するのも、一つの

生き方だろう。しかし一般的な正論としては、確率と統計を冷静に

把握し、可能性の低いリスクにもそれなりに考慮する必要がある。

 

例えば、意外と起伏に富む首都圏で数年ぶりの大雪が降った時、

車を運転すると、一部で何が起きるのか。昨日、今日のニュースを

見てれば実感できる。自分の車が大丈夫でも、他の車に問題が

生じたら巻き込まれてしまうのだ。スリップとか坂道を登れないとか。

 

今日は、草津国際スキー場で白根山の噴火も起きてる。世界遺産

ブームでにぎわう夏の富士山なら、遥かに大きな騒動だったはず。。

 

 

     ☆        ☆        ☆

というわけで、前置きがやや長くなったが、地道に確率・統計を解説

することにしよう。今年は既にセンター数学記事を1本アップしてある。

 

 陸上選手の体格指数BMI(散布図と補助線の傾き、箱ひげ図)

   ~2018センター試験・数学ⅠA・第2問

 

上の記事で扱ったのは数学ⅠAの必答問題だが、これから書くのは

数学ⅡBの選択問題。つまり、理解してる人がかなり少ない分野の

話だ。だからこそと言うべきか、難易度レベルは低くて、教科書の

章末問題Aといった感じ。発展問題ではない。河合塾の分析でも

標準とされてた。

 

以下、解き方はもちろん、問題文もコピペではなく私が簡単にまとめ

直したもの。原文は河合塾その他、大手予備校などで公開されてる

ので、そちらを参照。下図のようなpdfファイルで無料配布されてる。

ちなみに、大学入試センターの公式発表はなぜかいつも遅い。

 

180123a

 

 

    ☆        ☆        ☆

第5問 必要に応じて、正規分布表を用いてもよい。

 (1) aは正の整数。2,4,6,・・・,2aの数字が1つずつ

   書かれたa枚のカードが箱に入っている。1枚を無作為

   に取り出す時、書かれた数字を表す確率変数をXとする。

   X=2aとなる確率を求めよ。

 

   次に、a=5とする。Xの平均(期待値)と分散を求めよ。

   また、sX+tの平均が20、分散が32となるように、定数

   s(>0)、tを定めよ。さらにその時、sX+tが20以上で

   ある確率を小数で求めよ。

 

 (解答) まず、 確率 P(X=2a)1/a ・・・ア、イ

 

   次に、a=5の時、

   平均 E(X)=(2×1/5)+(4×1/5)+・・・

          =(2+4+6+8+10)/5

           ・・・

 

   ∴ 分散 V(X)

        =(2-6)²×1/5+(4-6)²×1/5+・・・

        =(16+4+0+4+16)/5

        = ・・・エ

 

   さらに、(sX+tの平均)=s・(Xの平均)+t、

   (sX+tの分散)=s²・(Xの分散)だから、

   与えられた条件を連立方程式に直すと、

    s×6+t=20 

    s²×8=32

   s>0より、 s=2 ・・・、 t=8 ・・・

 

   ∴ (sX+tが20以上の確率)

      =P(2X+8≧20)

      =P(X≧6)

      =P(X=6)+P(X=8)+P(X=10)

      =0. ・・・

 

 

 (2) (1)でa≧3とする。箱から3枚同時に取り出し、横1列に

   並べた時、左から小さい順に並んでいる事象をAとして、

   Aの起こる確率を求めよ。

 

  この試行を180回繰り返す時、Aが起こる回数を表す確率

  変数をYとする。Yの平均m、分散σ²を求めよ。

  さらに、回数が大きいので正規分布と考え、

  Z=(Y-m)/σ とおいて標準化する。

  P(18≦Y≦36)を、Zの確率を利用して求めよ。

 

 

 (解答) 並び方は全部で、 3P3=3×2×1=6通り。

   これらは同様に確からしいので、

   P(A)1/6 ・・・ク、ケ

 

   Yは、180回中にAが起こる回数だから、二項分布に従う。

   ∴ 平均 m=180×1/6

          =30 ・・・コサ

     分散 σ²=180×(1/6)×{1-(1/6)}

          =25 ・・・シス

 

   よって Z=(Y-m)/σ=(Y-30)/5 だから、

    Y=5Z+30

 

   ∴ P(18≦Y≦36)   

    =P(18≦5Z+30≦36)

    =P(-2.40≦Z≦1.20) ・・・セ、ソタ、チ、ツテ

    =P(0≦Z≦2.40)+P(0≦Z≦1.20)

    ≒0.4918+0.3849 (正規分布表の数値より)

    ≒0.88 ・・・トナ

 

180123b

 

 (3) ある都市の世論調査で、無作為に400人の有権者を選び、

   ある政策の賛否をたずねると、320人が賛成だった。全体の

   賛成者の割合(母比率)pを推測する。

 

   まず調査での賛成比率(標本比率)を求めよ。また二項分布

   の正規分布による近似を用いて、pに対する信頼度95%の

   信頼区間を求めよ。

 

   続いて、その区間の幅をL₁とする。また、標本の大きさ400、

   比率0.6の時の信頼区間の幅をL₂とし、大きさ500、比率

   0.8の時の信頼区間の幅をL₃とする。L₁、L₂、L₃の不等式

   を求めよ。

 

 

 (解答) 標本比率は、  320/400=0. ・・・

 

    また、信頼度95%の信頼区間は公式より、

    0.8-1.96×√0.8×0.2/400

     ≦ p ≦ 0.8+1.96×√0.8×0.2/400

    ∴ 0.8-1.96×0.02

       ≦ p ≦0.8+1.96×0.02

    端数を四捨五入して、信頼区間は

    0.76 ≦ p ≦ 0.84 ・・・ヌネ、ノハ

 

    さらに、 L₁=2×(1.96×√0.0004)=0.08。

 

    また、標本の大きさ400、比率0.6の時、同様の計算で

    信頼区間の幅を求めると、

    L₂=2×(1.96×√0.6×0.4/400)

     =2×(1.96×√0.0006) > L₁

 

    標本の大きさ500、比率0.8の時、信頼区間の幅は、

    L₃=2×(1.96×√0.8×0.2/500)

     =2×(1.96×√0.00032) < L₁

 

    以上まとめると、 L₃ < L₁ < L₂ 

    つまり、答は4番。 ・・・

 

 

     ☆        ☆        ☆

なお、最後のL₂やL₃を真面目に計算すると時間の浪費になる。

 

また信頼区間の公式は、標準正規分布表などから近似的に求めた

もの。変数が0~1.96の区間に入る確率が0.475だから、

-1.96~1.96の区間に入る確率が0.95。

つまり95%ということになる。

下の正規分布(ガウス分布)表で、色付きの数値を参照。

 

180123c

 

その変数を、ここでは

 (p´-p)/√p(1-p)/n (p´は標本比率)

と考えると、95%信頼区間は

-1.96≦ (p´-p)/√p(1-p)/n≦1.96

∴ p´-1.96×√p(1-p)/n

    ≦ p ≦ p´+1.96×√p(1-p)/n

 

さらに、不等式の左と右のpを標本比率で近似して、

95%信頼区間の公式が完成。

 

 p´-1.96×√p´(1-p´)/n 

   ≦ p ≦ p´+1.96×√p´(1-p´)/n

 

 

    ☆        ☆        ☆  

上の覚えにくい不等式を暗記してそのまま使うのが、高校数学とか

大学受験数学ということになる。試験場で自分で導くのは困難。

 

しかし、この理論は近似だらけだし、説明も省略されてるので、他の

話と比べると説得力に乏しい。もし本格的に近似を正当化する証明

を行うと、完全に大学(以上)の数学のレベルになる。少なくとも中心

極限定理や確率密度関数が必要で、経験的正しさを主張するには

大数の法則という厄介な問題も絡んで来る。

 

というわけで、公式データは発見できてないが、この問題の選択者

は少ないはず。学研のサイトでは、「あまりおすすめはできません」

とアドバイスされてた。

 

だから逆に、マニアック・ブログが進んで扱うことになるわけだ。

それでは今日はこの辺で。。☆彡

 

            (計 3315字)

| |

« 井上荒野「キュウリいろいろ」2~長編小説『キャベツ炒めに捧ぐ』全体を読んで | トップページ | 大雪と凍結で走れない日、噴石で舞い上がるスキー場の雪煙に驚愕・・ »

数学」カテゴリの記事

教育」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 井上荒野「キュウリいろいろ」2~長編小説『キャベツ炒めに捧ぐ』全体を読んで | トップページ | 大雪と凍結で走れない日、噴石で舞い上がるスキー場の雪煙に驚愕・・ »