渡辺慧「みにくいアヒルの子の定理」、英語版ウィキペディアの簡単な具体例の解説
つい先日、「出会い」ということについてドラマ・レビューを書いたばかりだが、今回の出会いは全く想定外だった。ビミョーなネット情報との出会いが、知的刺激に富む遭遇につながったのだ。
キッカケは、東京大学大学院の特任准教授・大澤昇平が、「弊社 Daisy では中国人は採用しません」とツイートするなどして炎上してる話題を見かけたこと。ニュースを一読して、それなりに理屈に強い確信犯(または確信者)だと感じたから、本人ツイッターを検索。あえてリンクは付けないが、やはり只者ではない。
彼が、「機械学習の定理」として前提にしてると自分でツイートしてるのが、「みにくいアヒルの子の定理」。「純粋に客観的な立場からは、いかなるものも区別できない」とまとめてある。だから逆に、何かを区別しようと思ったら、主観的な立場にならざるを得ないということになる。国籍に関してであれ、学歴・能力に関してであれ。
騒動はさておき、私はその定理、名前だけ聞き覚えがあったので、検索してみた。すると、作者は前から知ってる日本の学者・渡辺慧だし、重要性や面白さのわりには理解されてないようだから、簡単に記事にしてみよう。
英語版ウィキペディアの「Ugly duckling theorem」が示す具体例に注目する。せっかく上手い例というか、分かりやすい図を挙げてるのに、説明が専門的で短すぎるから、不親切だと思う。
☆ ☆ ☆
下の図表では、右側に特徴が論理記号で書かれていて、左側にその特徴を持ってるかどうかが書かれている。持ってるなら、数字(真理値)は1。持ってないなら、数字は0。
3羽の水鳥を考える。それぞれの特徴を記すと、左の白鳥は「速い&白い」(Fast&White:FかつW)。真ん中の白鳥は、「速くない&白い」(Fでない、かつW)。右のアヒルは、「速くない&白くない」(Fでない、かつ、Wでない)。
(☆8ヶ月後の補足・修正: Fは英語で「first」(一番目の)の略語だと説明されてたが、特徴として不自然なので、「fast」(速い)の略語だと読み換えた。コメントによる指摘を受けて、英語版ウィキの編集履歴をチェック。元は「first-born」(最初に生まれた)で、編集合戦の末に「first」に落ち着いた感じだ。分かりにくいし、この記事ではfastという解釈のままにする。)
右端がみにくいアヒルのイメージだろうが、人種差別への批判に配慮するなら、黒色よりも緑色とかの方が無難だ。
結論から先に書くと、「白鳥とアヒルは、白鳥同士と同じくくらい似てる」ことになる。なぜなら、類似する特徴の数が同じ4コだからだ。ちなみに英語版ウィキは、後半を「アヒル同士と」と書いてるが、後述する原著では「白鳥2羽(two swans)」と書かれてた。
☆ ☆ ☆
では、その理由を説明しよう。要するに、「白鳥とアヒルの類似点の数は、白鳥同士の類似点の数と同じ」だからだ。
左の白鳥とアヒルの類似点(共通する特徴)は4つ。まず、「速い&白くない、ということはない」。表の3番の項目で、2羽とも0という数字になってて、これが「・・ということはない」という否定を表してる。普通の感覚だと、この類似点の書き方は不自然だろうが、数学・論理学・情報理論的にはそれほど不自然ではない。
次に、「速いか白いか、一方だけ成り立つ、ということはない」(表の5番、2羽とも0)。さらに、「速くないか白いか、一方だけ成り立つ」(表の7番、2羽とも1)。最後に、「速くない、または白い」(表の8番、2羽とも1)。
それに対して、白鳥同士の類似点も4つ。まず、「速い、または白い」(表の2番、2羽とも1)。次に、「速い&白くない、ということはない」(表の3番、2話とも0)。さらに、「速くない&白くない、ということはない」(表の4番、2羽とも0)。最後に、「速くない、または白い」(表の8番、2羽とも1)。
☆ ☆ ☆
まとめると、左の白鳥とアヒルの類似点は、表の3・5・7・8番。白鳥同士の類似点は、表の2・3・4・8番。どちらも4つだから、同じくらい似てる。客観的には、あるいは、数学・論理学的には。真ん中の白鳥とアヒルの類似点も同様(1・3・6・8番、説明省略)。
なお、英語版ウィキの記述は、定理の作者・渡辺慧(わたなべ・さとし)のこの著作をそのまま引用しているわけではなさそうだ(他の文献は未確認)。
『Knowing and Guessing』(知識と推測、知ることと推測すること、原書1969年)に目を通してみたが、上のような図表や、それに相当する説明文は発見できてない。別の論文(『Information and prediction in science』所収)にも無かった。元はもっと一般的な論述なのだ。定理の名前も僅かに違って、元は「theorem of the ugly duckling」。
図表の右側の論理式と変形については、論理学の知識が必要だからここでは省略するが、ごく初歩的な式と変形にすぎない。¬が否定(でない)。∧(かつ)、∨(または)。〇の中に+が入ってる記号は、「・・か~~か、どちらか一方だけ成り立つ」(排他的選言)ことを示す。
この例ではたまたま、「速い」のは左の白鳥だけで、「速い&白い」のも左の白鳥だけだから、F=F∧W という等式が成り立つ。もちろん、一般には、こんな等式は成り立たない。
☆ ☆ ☆
定理はともかく、この国籍・性別だから採用しないという考えと、この学歴・能力・年齢だから採用するという考え。この2つは、同様に主観的なものだと言えるだろうか。だからどちらも許容されるべきだとまで、言えるかどうか。
今の先進国の社会では前者は認められず後者は認められることが多い、というのは客観的な現実だろう。そして、多数派に少数派が異を唱えるとしばしば激しく批判・攻撃される、というのも客観的現実。
思想・表現の自由も絡んで、高度に微妙で困難な問題だとは思う。というわけで、今日のところはこの辺で終了。ではまた。。☆彡
(計 2304字)
(追記188字 ; 合計2492字)
| 固定リンク | 0
「数学」カテゴリの記事
- 1~7の数字を並べた整数A、Bの和が9723になるのは何通りか(高校・場合の数)~開成中2023年入試、算数・問題5の解き方(2023.02.04)
- 桜(ソメイヨシノ)の開花予想と、気温の時間積分(1次関数、2次関数)~2023年共通テスト数学ⅡB・第2問〔2〕(2023.01.29)
- パズル「推理」、小学生向け7、カンタンな解き方、表の書き方(難易度5、ニコリ作、朝日be、23年1月28日)(2023.01.28)
- トランプの4種の絵柄(ハート・スペード・クラブ・ダイヤ)を並べた暗号と解読方法~2023年共通テスト・情報関係基礎・第2問(2023.01.26)
- バスケットボールのシュートの軌道(リングへの放物線)、高身長プロ選手と普通女子~23年共通テスト数学ⅠA・第2問〔2〕(2023.01.17)
「社会」カテゴリの記事
- 女性の成人式出席と振り袖スーツ問題、切ない・・&再びハーフ1km4分台、ギリギリ・・(2023.01.19)
- AKB48に14年間・2000万円を費やしたファンがグッズを大量破壊してお別れ・・という話に思うこと、色々♪(2023.01.09)
- 心にしみるコラム、「めぐり合う クリスマスの奇跡」(朝日新聞・窓)&18km走、再び1km5分切りでも不調(2022.12.27)
- 怠惰な小人の妖精として生きる「ゴブリン・モード」が流行♪、アンデルセン童話『食料雑貨店のゴブリン』のあらすじ(2022.12.17)
- 3年続くコロナ禍で激減、旅行人口の推移(国内観光・帰省、海外)~『レジャー白書 2022』(2022.12.09)
コメント
こんにちは。大澤さんがその定理に言及してるとは知りませんでした。
内容について、細かいのですが、fast でなくて first (一番目) だと思います。
投稿: | 2020年7月31日 (金) 12時50分
> 名無し さん
はじめまして。コメントどうもです。
英文には「first」と書いてるのですが、
「一番目」だと特徴として不自然だと思って、
「fast」(速い)に修正しておきました。
今、英語版ウィキペディアの編集の履歴を調べると、
元々は「first-born」(最初に生まれた)。
その後、この英語表現に関して編集合戦になって、
今の「first」に落ち着いてるようです。
このブログ記事本文も補足・修正しておきました。
なお、当サイトはコメントに名前を求めているので、
よろしくお願いします。☆彡
投稿: テンメイ | 2020年8月 1日 (土) 04時22分