ひらがな情報の符号化・暗号化(エンコード)、データ量の圧縮~2020年センター試験・情報関係基礎(数学)
毎年1月、大学受験生の2人に1人くらいが挑戦して来た大学入試センター試験も、いよいよ最後(たぶん♪)。記念に色んな問題を解いてみようと思ってたが、やはり正月明けのこの時期は余裕がない。
そこで今日は、時代の流れとしては最大の注目点とも言える、「情報関係基礎」をチェックしてみる。問題を流し読みすると、予想以上に面白くて、もっと前から扱うべきだったと思った。
ところが実施データを見ると、私が全く注目して来なかったのも無理はない。過去3年のデータを見ると、受験生が僅か500人程度しかいないのだ♪ 今年の中間発表では106人しかいないから、意外と人気が落ちてるのかも知れない。問題作成者や教科書会社が気の毒になるほど。
これだと、記事の読者も極端に少ないのかも知れないが、私自身が面白いから別にいい。内容的には、普通の数学ⅠAやⅡBより遥かに興味深くて実用的。おまけに深みもあると思う。ちなみに、センターの分野としては、数学ⅡBと同じ「数学②」とされてる。「数学Ⅱ」とは別で、より大きい区分だから、紛らわしいネーミングだが、意図的に合わせてるのだろう。
☆ ☆ ☆
では、2020年(令和二年)の問題から、第1問・問2を解説してみよう。太郎君が授業で情報の符号化とデータ量に学んだ内容、という設定。ただ、私はこの内容に関して検索をかけてみたけど、ピッタリ来るサイトは一つも見つからなかった。
1つのライトの点灯と消灯で、ひらがなの文字列を表現する。あ~おの点灯パターンは上の通り。う、え、お、には途中で1秒間の消灯が挟まれてる。問題文がやや不明確だが、あ、い、には消灯は無くて、点灯だけのようだ。モールス信号や点字を参考にした変換方式かと思って調べたが、かなり違ってた。
文字と文字の間(「字間」)には、3秒の消灯を入れる。文字列の終わりの処理については、何も書いてないが、例えば5秒間の消灯で文字列の終わりを示せばいいと思う。
☆ ☆ ☆
以下、上のライトの点灯・消灯を、数字で符号化する。まず、秒ごとの点灯を1、消灯を0に対応させた数の列(ビット列)だと、「え」は「10111」。「あい」は「1000111」・・・チの答の選択肢は9番。「11101000101」は「おう」を意味する・・・ツの答の選択肢は3番。
これだと長いので、データ量を減らす(圧縮する)方法を考える。要するに、字間、1秒の短い点灯、3秒の長い点灯、計3種の信号の組合せだから、順に00、01、10とする(二進コードへの対応づけ)。1秒の短い消灯は省略する。
すると、「え」は0110。「あい」は「010010」・・テの答の選択肢は3番。「0101000110」は「うえ」を意味する・・・トの答の選択肢は1番。
☆ ☆ ☆
上のやり方だと、3種の信号を00、01、11と表していて、11は未使用だから、まだ無駄がある。そこで、二進法に加えて、三進法も利用する。三進法では、十進法の6は「20」・・・ナニの答(選択肢でなく、マーク)。
上の対応だと、「いえ」→「長い点灯・字間・短い点灯・長い点灯」→「2012」。これを十進法の数に直すと、2×3×3×3+1×3+2=59・・・ヌネの答(選択肢でなく、マーク)。
十進法の59をさらに二進数に直すと、111011で、6ケタ(=6ビット)で表せる。前の単なる二進コードだと、「いえ」は10000110の8ビットだから、データ量が8ビットから6ビットに減ったことが確認できた(と語って問題終了)。
☆ ☆ ☆
結局、全体の流れをまとめると、
ひらがな文字列 → ライト点灯・消灯 → 三進数 → 十進数 → 二進数。
面白くて具体的な説明だが、数学的・論理的に見ると、かなり説明不足ではある。単なる二進コードにせよ、三進コードを加味するにせよ、それで本当に問題(エラー)が生じないのか、ひらがな全体や文字列全体を検討する必要がある。例えば、短い消灯を無視して本当に大丈夫なのか、など。
あと、データ量の削減という話は、1つの文字列だけで語ってもほとんど意味はない。というのも、この問題の論法だと極端な話、「いえ」を1、それ以外を0と符号化すれば、「いえ」は1ビットだけで表現できることになってしまうからだ。もちろんこれだと実際は、「それ以外」に含まれる無数の文字列が区別できないから、実用性はない。
まあ、良し悪しはさておき、その辺りは一般レベルでの情報理論の特徴だろう。それで全て上手くいくのか、問題は生じないのか、といった話は無いのだ。だから、OSとか巨大なプログラムには必ずバグ(欠陥)が付き物で、そこを狙う人間と改善する人間とのイタチごっこが延々続く。三菱電機&ウイルスバスターのセキュリティ・システムもハッカー集団に破られた。
ちなみに私の場合、先日のJava導入失敗の余波なのか、Javaアップデートの失敗が毎日のように続いてる。ネット情報によると、再インストールすれば直るという話だが、しばらく様子見する予定・・・と入力してる内に、またブラウザ(IE)がおかしな動きを始めてしまった。それでは今日はこの辺で。。☆彡
(計 2135字)
| 固定リンク | 0
「数学」カテゴリの記事
- Python(パイソン)入門4~ランダムなサイコロの目の予想、数値データのリストの処理(ChatGPT4oも使用)(2024.09.20)
- パズル「絵むすび」31、解き方とコツ、考え方(難易度4、ニコリ作、朝日新聞be、2024年9月14日)(2024.09.15)
- 四角形や丸の「真ん中」に正三角形を配置するデザイン(YouTubeほか)、長さ、重心、三角形分割錯視を考慮した視覚調整(2024.09.08)
- パズル「推理」、小学生向け8、カンタンな解き方、表の書き方(難易度3、ニコリ作、朝日be、24年8月31日)(2024.09.01)
- パズル「ナンスケ」解き方13、2024年7月13日の問題は間違い「ではありませんでした」(難易度4、ニコリ作、朝日新聞be)(2024.07.13)
「教育」カテゴリの記事
- インドの摩訶不思議な「ヴェーダ数学」、100に近い2つの数の掛け算のやり方、明星学園の中学入試問題(算数)と一般的証明(2024.07.06)
- Mrs. GREEN APPLE の曲『コロンブス』のMV炎上、探検家の歴史的評価の変化と、山川出版社の現在の高校教科書『世界史探究』(2024.06.15)
- 2進法の計算、直接的な減法(引き算)と、コンピューター内部で「2の補数」を用いる減算 ~ 高校『情報Ⅰ』(2024.06.04)
- ChatGPT-4oが音声と画像認識を利用して家庭教師、三角関数(三角比)のsinを英語で教えるビデオ動画の解読(2024.05.18)
- 朝ドラ『虎に翼』で受験、昭和初期(戦前)の国家・高等試験問題とAIの解答〜司法科・選択科目「論理学」、繋辞(コプラ)の意義(2024.05.11)
コメント
私も毎年、情報関係基礎をチェックして、ある勉強会で発表しています。テンメイさん、ご同輩ですね!!
投稿: gauss | 2020年1月24日 (金) 00時54分
> gauss さん
こんばんは。毎度どうもです♪
あっ、やっぱり注目してましたか。流石ですね。
面白かったから、いずれ過去問や教科書の類も
チェックしてみようと思ってます。
これでお別れかと思ったら、共通テストになっても
そのまま(?)残るみたいですね。
ちなみに最後の二進数を間違えてたので修正しました。
最後だし、問いになってなかったから、油断しました ☆彡
投稿: テンメイ | 2020年1月24日 (金) 23時47分