« 船ではなく、枠のない海の波を係留する桟橋を夢見る少女〜牧田真有子の小説『桟橋』(2024年・共通テスト・国語) | トップページ | 新型コロナ第1波~第10波、感染者数の推移グラフの全体(2020年~24年)&再び13km走、まずまず »

陸上長距離・マラソン、ベストタイムの統計分析、ベテランと若手の「偏差値」~2024年共通テスト・数学ⅠA・第2問〔2〕

今年の数学ⅠAの問題をザッと見渡すと、電柱の影が身近な問題で面白そうに見える。しかし、私は一応、高校の陸上部出身で市民ランナーの端くれなので、とりあえず今日は長距離・マラソンの問題を扱うことにしよう。どうも、本物のデータ(ベースボール・マガジン社、陸上競技ランキング)を使用して問題作成してるらしい。ちなみに、2問とも扱う余裕は無い。

    

いつものように、問題は河合塾から借用した。実際のデータの保存先は、提携先の産経news。今回のネット公開は、21時頃だったと思う。

  

本来なら、問題文はすべて自分で打ち直したいところだけど、あまりに問題が長過ぎる。まあ、短くすると、得点の分布が高い方に偏ってしまうからだと思うけど、国語や英語の問題ではないのだから、もう少し短くするべきだと思う。

     

今現在ならともかく、非常に近い将来(今年の内にとか)、長文の問題だとAIと人間の差が大きく開いてしまうはず。AIは単純な長文の読み書きが非常に速いけど、人間は遥かに遅いから。

   

なお、問題とは直接、関係ないけど、昨日行われた全国都道府県対抗女子駅伝の1区で、石川県代表の五島莉乃選手が1位、区間賞を獲得した。元日から続く地震の被災地を勇気づける走りはお見事。沿道からは、「石川がんばれ!」という温かい声援もあったとの事。ランナーでなくても、いいねボタンを押したくなる話だろう。

  

   

     ☆   ☆   ☆

240115a

   

  

2018年より前にマラソン・ベストタイムを出した男子選手の数値(データA)と、2018年以降にベストを出した選手の数値(データB)を分けて、全員に共通する2時間という部分をカット。残りの部分を「秒」単位に換算する。もし、「分」と「秒」のまま問題にしてれば、平均点は大幅に下がってたと思う。

       

簡単にまとめてしまうと、データAはベテラン(古株)グループ、データBは若手グループみたいな感じ。単なる年齢だけでなく、「現役度」みたいなもの。例えば、大迫傑は32歳だから、わりと年齢は高いけど、データBになる。マラソンのベストは2020年。

    

全体的には若手グループの方が速いけど、各集団内での「偏差値」みたいなものを比較するとどうか?、といった話まで考える専門的な出題。例えば、ベテランの中で非常に偏差値が高いランナーと、若手の中で少し偏差値が高いランナーなら、前者の方が優れてるとか。

  

  

    ☆   ☆   ☆

240115b

  

   

(i) 図1から、Aの最頻値は階級510以上、540未満の階級値。よって、サの答選択肢8

また、図2から、Bの中央値が含まれる階級は450以上、480未満。よって、シの答選択肢6

要するに、ベテラン・グループの方が遅いということ。

    

   

   ☆   ☆   ☆

240115c

  

   

 (ii) 図3の箱ひげ図を見る。Bの速い方から13番目の選手のベスト(下の四角の左端)は、Aの速い方から13番目のベスト(上の四角の左端)より、およそ45秒速い。よって、スの答選択肢4

  

Aの四分位範囲(上の四角の横の長さ)から、Bの四分位範囲(下の四角の横の長さ)を引いた差の絶対値は、ほぼ0。よって、セの答選択肢0

    

   

    ☆   ☆   ☆

240115d

    

このという値は、いわゆる偏差値みたいなもの。zのプラス・マイナスの符号を逆転させて、10倍して50を加えた数が、いわゆる偏差値。

  

   

240115e

    

  

Bの1位の選手のベストに対するzの値は、

 (296-454)/45 = -3.51

  

よって、ソタチの答は、351。ギリギリで割り切れないのに、3ケタも答えさせるとは、ちょっと意地悪かも。最後の小数第2位の数字で間違えた受験生は結構いると思う。35「0」とか。

  

また、ベストはBの1位の選手の方が速い。

さらに、Aの1位の選手のzの値は、

 (376-504)/40 = -3.2

よって、Bの1位の選手の方がzが小さい(優れてる)。

  

したがって、ツの答は、選択肢1

   

     

    ☆   ☆   ☆

240115f

    

240115g

  

   

図4の左下を見ると、マラソンのベストの速い方から3番目までの選手の10000mのベストは、3選手とも1670秒未満。よって、(a)の記述は正しい。

  

また、図4と図5を大まかに見比べると、図5のデータの方が、右上がりの直線に近い分布になってる。つまり、マラソンと10000mの相関は、5000mと10000mの相関より「弱い」。よって、(b)の記述は誤り。

  

したがって、(a)(b)の正誤の組合せとして正しいもの(テの答)は、選択肢1

   

マラソンは42195mだから、10000mの4.2倍もある。それに対して、10000mは5000mの2倍にすぎない。だから、5000mと10000mの相関の方が強いのは自然なこと。競技時間の差を考えても分かりやすい。マラソンは、10000mと比べて、1時間40分くらいも長いのだ。

       

   

     ☆   ☆   ☆

私にはこの問題は、簡単なサービス問題に見えるけど、はたして集計結果はどうなるか? 受験生の性格やパーソナリティーによっては、最後の問題はマジメに全て計算しようとして混乱してしまったかも。

  

統計というものは一般に、最後の結論の所は非常にざっくりしてるのだ。優れてるとか、速いとか、強いとか、上がったとか。それでは今日はこの辺で。。☆彡

    

      (計 2118字)

| |

« 船ではなく、枠のない海の波を係留する桟橋を夢見る少女〜牧田真有子の小説『桟橋』(2024年・共通テスト・国語) | トップページ | 新型コロナ第1波~第10波、感染者数の推移グラフの全体(2020年~24年)&再び13km走、まずまず »

ランニング」カテゴリの記事

数学」カテゴリの記事

教育」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 船ではなく、枠のない海の波を係留する桟橋を夢見る少女〜牧田真有子の小説『桟橋』(2024年・共通テスト・国語) | トップページ | 新型コロナ第1波~第10波、感染者数の推移グラフの全体(2020年~24年)&再び13km走、まずまず »