« 探し物と出張準備に追われる中、10km走で膝痛・・ | トップページ | 念のためにマスクの買いだめ&プチランで免疫力アップ »

ひらがな情報の符号化・暗号化(エンコード)、データ量の圧縮~2020年センター試験・情報関係基礎(数学)

毎年1月、大学受験生の2人に1人くらいが挑戦して来た大学入試センター試験も、いよいよ最後(たぶん♪)。記念に色んな問題を解いてみようと思ってたが、やはり正月明けのこの時期は余裕がない。

   

そこで今日は、時代の流れとしては最大の注目点とも言える、「情報関係基礎」をチェックしてみる。問題を流し読みすると、予想以上に面白くて、もっと前から扱うべきだったと思った。

    

ところが実施データを見ると、私が全く注目して来なかったのも無理はない。過去3年のデータを見ると、受験生が僅か500人程度しかいないのだ♪ 今年の中間発表では106人しかいないから、意外と人気が落ちてるのかも知れない。問題作成者や教科書会社が気の毒になるほど。

    

これだと、記事の読者も極端に少ないのかも知れないが、私自身が面白いから別にいい。内容的には、普通の数学ⅠAやⅡBより遥かに興味深くて実用的。おまけに深みもあると思う。ちなみに、センターの分野としては、数学ⅡBと同じ「数学②」とされてる。「数学Ⅱ」とは別で、より大きい区分だから、紛らわしいネーミングだが、意図的に合わせてるのだろう。

   

   

     ☆     ☆     ☆

では、2020年(令和二年)の問題から、第1問・問2を解説してみよう。太郎君が授業で情報の符号化とデータ量に学んだ内容、という設定。ただ、私はこの内容に関して検索をかけてみたけど、ピッタリ来るサイトは一つも見つからなかった。

  

200123a

   

1つのライトの点灯と消灯で、ひらがなの文字列を表現する。あ~おの点灯パターンは上の通り。う、え、お、には途中で1秒間の消灯が挟まれてる。問題文がやや不明確だが、あ、い、には消灯は無くて、点灯だけのようだ。モールス信号や点字を参考にした変換方式かと思って調べたが、かなり違ってた。

   

200123b 

  

文字と文字の間(「字間」)には、3秒の消灯を入れる。文字列の終わりの処理については、何も書いてないが、例えば5秒間の消灯で文字列の終わりを示せばいいと思う。

  

   

    ☆     ☆     ☆

以下、上のライトの点灯・消灯を、数字で符号化する。まず、秒ごとの点灯を1、消灯を0に対応させた数の列(ビット列)だと、「え」は「10111」。「あい」は「1000111」・・・チの答の選択肢は番。「11101000101」は「おう」を意味する・・・ツの答の選択肢は番。

  

これだと長いので、データ量を減らす(圧縮する)方法を考える。要するに、字間、1秒の短い点灯、3秒の長い点灯、計3種の信号の組合せだから、順に00、01、10とする(二進コードへの対応づけ)。1秒の短い消灯は省略する。

   

200123c

    

すると、「え」は0110。「あい」は「010010」・・テの答の選択肢は番。「0101000110」は「うえ」を意味する・・・トの答の選択肢は番。

   

  

     ☆     ☆     ☆

上のやり方だと、3種の信号を00、01、11と表していて、11は未使用だから、まだ無駄がある。そこで、二進法に加えて、三進法も利用する。三進法では、十進法の6は「20」・・・ナニの答(選択肢でなく、マーク)。

  

200123d

   

上の対応だと、「いえ」→「長い点灯・字間・短い点灯・長い点灯」→「2012」。これを十進法の数に直すと、2×3×3×3+1×3+2=59・・・ヌネの答(選択肢でなく、マーク)。

  

十進法の59をさらに二進数に直すと、111011で、6ケタ(=6ビット)で表せる。前の単なる二進コードだと、「いえ」は10000110の8ビットだから、データ量が8ビットから6ビットに減ったことが確認できた(と語って問題終了)。   

   

 

     ☆     ☆     ☆

結局、全体の流れをまとめると、

 ひらがな文字列 → ライト点灯・消灯 → 三進数 → 十進数 → 二進数

       

面白くて具体的な説明だが、数学的・論理的に見ると、かなり説明不足ではある。単なる二進コードにせよ、三進コードを加味するにせよ、それで本当に問題(エラー)が生じないのか、ひらがな全体や文字列全体を検討する必要がある。例えば、短い消灯を無視して本当に大丈夫なのか、など。

  

あと、データ量の削減という話は、1つの文字列だけで語ってもほとんど意味はない。というのも、この問題の論法だと極端な話、「いえ」を1、それ以外を0と符号化すれば、「いえ」は1ビットだけで表現できることになってしまうからだ。もちろんこれだと実際は、「それ以外」に含まれる無数の文字列が区別できないから、実用性はない。

  

まあ、良し悪しはさておき、その辺りは一般レベルでの情報理論の特徴だろう。それで全て上手くいくのか、問題は生じないのか、といった話は無いのだ。だから、OSとか巨大なプログラムには必ずバグ(欠陥)が付き物で、そこを狙う人間と改善する人間とのイタチごっこが延々続く。三菱電機&ウイルスバスターのセキュリティ・システムもハッカー集団に破られた。

     

ちなみに私の場合、先日のJava導入失敗の余波なのか、Javaアップデートの失敗が毎日のように続いてる。ネット情報によると、再インストールすれば直るという話だが、しばらく様子見する予定・・・と入力してる内に、またブラウザ(IE)がおかしな動きを始めてしまった。それでは今日はこの辺で。。☆彡

   

     (計 2135字)

|

« 探し物と出張準備に追われる中、10km走で膝痛・・ | トップページ | 念のためにマスクの買いだめ&プチランで免疫力アップ »

数学」カテゴリの記事

教育」カテゴリの記事

コメント

私も毎年、情報関係基礎をチェックして、ある勉強会で発表しています。テンメイさん、ご同輩ですね!!

投稿: gauss | 2020年1月24日 (金) 00時54分

> gauss さん

こんばんは。毎度どうもです♪
あっ、やっぱり注目してましたか。流石ですね。
  
面白かったから、いずれ過去問や教科書の類も
チェックしてみようと思ってます。
これでお別れかと思ったら、共通テストになっても
そのまま(?)残るみたいですね。
   
ちなみに最後の二進数を間違えてたので修正しました。
最後だし、問いになってなかったから、油断しました ☆彡

投稿: テンメイ | 2020年1月24日 (金) 23時47分

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 探し物と出張準備に追われる中、10km走で膝痛・・ | トップページ | 念のためにマスクの買いだめ&プチランで免疫力アップ »