「アッシェンフェルターのワイン方程式」の間違いと本物(原論文)~『ハードナッツ』第5回
NHK『ハードナッツ!~数学girlの恋する事件簿~』第5回、「ワインと殺意
の方程式」(脚本・山浦雅大、数学考証・根上生也)。昨日のハートマークの
解析記事の冒頭で私は、メインの数式が「部分的に間違ってる可能性が高
い」と書いておいた。
その時点では、確率70%くらいの自信だったが、その後も色々と調べて、確
率90%超まで上昇。まだ僅かに、私が何か勘違いしてる可能性が残ってるが、
その点はまた更に別の数学記事で追求するつもりだ。とりあえず、今日はこう
書く所から始めよう。
☆ ドラマの「ワイン方程式」は、かなり間違ってる可能性が非常に高い ☆
しかもその間違いは、このドラマだけでなく、新聞や書籍も含め、日米のメディ
ア全体に拡散してしまってる間違いをそのまま引用してしまったものだ。こうし
た事態の主な原因はただ一つ。それは、英語の原論文と数字データをチェック
してないからなのだ。。
☆ ☆ ☆
まずはドラマを見てみよう。開始後10分ほどの箇所で、数学ガール・難波くる
み(橋本愛)が伴田刑事(高良健吾)に解説する際、黒板にはこう書かれてた。
改行もそのままだ。殺された夏目(小須田康人)が不倫相手・里中舞(能世あ
んな)のために付け足した式については、この記事末尾のP.S.に書いた。
アッシェンフェルターの方程式
ワインの品質
=12.145+0.00117×冬の降雨量
+0.0614×育成期平均気温
-0.00386×収穫期降雨量
これに対して、一番簡単で「大まかな」訂正は、項目名をより限定して、係数を
2つ変えること。項目名を限定することで、適用範囲は大幅に狭まるし、4つの
数字の内の重要な2つを変えて重要でない2つを残すのだから、数式としては
大違いだろう。もちろん、結果である左辺の「品質」の値も非常に大きく変化し
てしまう。
とにかく「大まかな」訂正後の式は次の通りで、訂正箇所だけをピンク色で強調
した。「厳密な」元の方程式は、しばらく後で別に示すので、念のため。
ボルドーワインの品質
= -12.145+0.00117×冬の降雨量
+0.616×育成期平均気温
-0.00386×収穫期降雨量
☆ ☆ ☆
もちろん、ドラマの物語の進行にとってはある意味、関係ないことではある。ワ
インの品質が雨量と気温の公式で表されてる点も同じだ。要するに、冬の雨や
春夏の高温はプラスで、収穫期の雨はマイナス。
しかし『ハードナッツ』は数学ガールが活躍する数学ドラマだし、私も数学好き、
理屈好きのマニアック・ブロガーだから、上の間違いについて追求してみよう。
まず、証拠である本物の英語の原論文とデータを示す。しっかりしたpdfファ
イルの形で公開されてる、オーリー・アッシェンフェルター(Orley Ashenfelter)
の論文は、次の通り。「0.616」も含めて、方程式の係数が書かれた表もコピ
ペさせて頂こう。カッコ内の数字は標準誤差だから、気にしなくていい。
Predicting the Quality and Prices of Bordeaux Wines
(ボルドーワインの品質と価格の予測)
☆ ☆ ☆
上の論文は2007年に発表されたものだが、重要な内容は、1990年頃に書
かれたと思われる次の論文をそのまま引用したものだ。アッシェンフェルター
自身が主催するワイン・サイト、「Liquid Assets」(流動資産=液体の宝物)
にある。
Bordeaux Wine Vintage Quality and the Weather
(ボルドーワイン・ヴィンテージの品質と天候)
実は、ハッキリした方程式の形は、この論文にも書かれてない。ただ、こちらに
タを見ると、方程
式を正確に導け
るのだ。まず冒頭、式の左辺(従属変数)が定義されてる。「1961年物に対
する平均ヴィンテージ価格の対数」。つまり、こういう事だ。
log e (その年のボルドーワインの平均価格 / 61年物の平均価格)
対数の底(てい)は明記されてないが、式とデータから明らかに、ネイピア数「e」
(≒2.718)だと思われる。つまり、いわゆる「自然対数」なのだ。61年物は、
データ(52年~80年)の中で一番高いので、上の式のカッコ内、つまり「真数」
は1より小さい。よってこの対数の値はマイナスになる。ただし、その年の平均
価格が高いほど、この値は大きくなるし、価格と品質の相関関係は高いだろう
から、「ワインの品質」と言えなくもない。実際、本人もそうみなしてるのだ。
次に、方程式の右辺。つまり、
上の対数の値を決める式の
要素と係数は左の通り。
上から、切片(変数がすべて
0の時の値を与える定数項)、
冬(前年10月~当年3月)の降
雨量、平均摂氏気温(4月~9月)、収穫期降雨量(8月、9月)、収穫後から
1983年までの経過年数。この最後の経過年数は、ドラマその他では省略さ
れてるが、要するに熟成させれば品質が上がるという事だし、影響も小さめ
なので、省略してもさほど問題ないと思う。
☆ ☆ ☆
結局、厳密なボルドーワインの方程式(Bordeaux equation)は次の通りだ。
係数の端数は細か過ぎるので省略。ドラマその他の式との違いをピンク色で
強調してある。
log e (その年のボルドーワインの平均価格 / 61年物の平均価格)
= -12.145+0.00117×冬の降雨量
+0.616×育成期平均気温
-0.00386×収穫期降雨量
+0.0238×熟成年数(83年の時点)
比較のため、ドラマその他で示されてる式も再掲しとこう。
ワインの品質
=12.145+0.00117×冬の降雨量
+0.0614×育成期平均気温
-0.00386×収穫期降雨量
☆ ☆ ☆
なお、データは下のようなもので、たとえば基準となる61年で計算すると、
本物と偽物の方程式の違いがハッキリする。
本物の方程式(61年)
0.0=-12.145+0.00117×830+0.616×17.3
-0.00386×38+0.0238×22
=-0.140
偽物の方程式(61年、左辺には品質の代わりに対数の値を入力)
0.0=12.145+0.00117×830+0.0614×17.3
-0.00386×38
=14.0
本物は高い精度で成り立ってるが、偽物は大幅に違ってる。対数の値が14
ということは、 「61年物/61年物=(2.718の14乗)」ということだ♪ もち
ろん左辺は1だから、 「1=1000000」という式になってしまうのだ。。
本当はデータから、統計学の「回帰分析」ということをやるわけだが、それは
また後ほど、別記事でアップすることにしたい。ここでは最後に、なぜこんな
間違いが日米で拡散してしまったのか、その背景的事情を推測しとこう。。
(☆15年3月17日追記: 回帰分析の記事をアップ。これで、ドラマの方程式
の間違いが確定した。
簡単な線形回帰分析~具体例の人力計算、エクセルの表計算 )
☆ ☆ ☆
間違いの元ネタを少しずつ遡っていくと、1冊の本
が大きく影響してるのが分かる。amazon(アマゾ
ン)で、邦訳『その数学が戦略を決める』(イアン・
エアーズ著、文春文庫)の「中身を閲覧」すると、
冒頭の目立つ場所でいきなり間違った式を載せ
てた(左図)。全体的には面白い本だが、この箇
所は単なる記入ミス以上のミスだ。
というのも、この計量経済学者が元のアッシェン
フェルターの論文を読まずに書いてるらしいこと
が、英語原書(Super Crunchers:絶対計算
者=超計算者、ハードカバー2007
年)の参照文献から推測できるから
だ。そこには色んな「紹介」文を挙げ
てるが、元の論文自体は挙げられてない。
左はソフトカバー
(2008)の参照
文献。中身の検
索もアマゾンで
出来るので、熱
心な方はご自分
でお試しあれ。
珍しい手抜きで
はないし、ある
意味、正直な記
載と言えなくもない。
おそらくエアー
ズの間違いの
元をたどると、
アッシェンフェ
ルターのサイト
におけるミスに
辿り着くと思わ
れる。左で既に
0.0614とい
う間違った係数
が確認できる。
これにおそらく、12.145の先頭のマイナス符号を忘れるミスが重なって、そ
れ以降はほとんど誰も確認しないまま、間違った方程式が拡散したのだろう。
元の方程式の評価については全く別問題であって、私はワインの知識がない
から、スルーするかも知れない。一応、気になる話の一つとして覚えとこう。
それでは、今日はこの辺で。。☆彡
P.S. 夏目がワイン方程式(偽物)に付け足した式は、以下の通り。
+0.0386×育成期平均日較差
-0.0647×育成期平均日照時間
不倫相手・舞がプロデュースした小樽のワインに有利な条件のはず
だが、小樽の日較差が他の産地と比べて特別大きいとか、春夏の日
照時間が特別長いというデータは、今のところ確認できてない。
付け足した式の上側も、日本版だから係数が変更されてた。
12.145
+0.00251×冬の降雨量
+0.0503×育成期平均気温
-0.00419×収穫期降雨量
P.S.2 放送から6日後、7月28日の夜になって、ワイン方程式に触れてる
もう一つの売れ線の本を、書店で確認してみた。2002年のノーベル
経済学賞受賞者、ダニエル・カーネマンの『ファスト&スロー(上)』
(早川書房)。原題は『Thinking,Fast and Slow』だ(2011)。
邦訳上巻の終盤で、ワイン方程式について肯定的に触れてるが、参
照文献さえ挙げずに、「3つ」の特徴で決まるという話を書いてる。彼
もおそらく、原論文や数字データを確認してないだろう。ちなみに下は、
Googleブックスで公開されてる該当箇所の一部だ(第21章)。
cf. トランプのポーカーの確率計算
~『ハードナッツ!~数学girlの恋する事件簿~』第1回解説
検査精度と難病の確率、落下速度、素因数分解の暗号
無理数を発見した弟子をピタゴラスが殺したという伝説の検証
ピタゴラス音律と普通の十二平均律、周波数のズレなど~第3回
ラブレターの換字式暗号&数字の順列パスワード~第4回
計量文献学による解析、K特性値、筆者判定~第4回
ハートマークと「i LOVE u」、愛の方程式~第5回
特殊な違いの有無の判定(統計的推測、5%片側検定)~第6回
変化点検出と外れ値、スコア(Score)~第7回
変化点検出とスコア、具体的な計算例~最終回
(計 4255字)
| 固定リンク | 0
「映画・テレビ」カテゴリの記事
- やす子24時間マラソンの2日目と「同じ道」を9時間で歩いて「検証」した YouTuber、実際は6割弱の距離(29km)を歩いただけ(2024.09.12)
- 直前の欠場、「パリ五輪は、まだ走れ!っていうメッセージ♪」~カンテレ『前田穂南が走れなかったオリンピック』(TVer動画)(2024.09.06)
- 世論の逆風と雷雨の中、やす子(体重78kg、25歳)の81kmマラソンSPの感想~日テレ『24時間テレビ』2024年(2024.09.04)
- パリ五輪2024・女子マラソン、ほぼリアルタイムの感想♪&優勝したハッサンのラップタイム(2024.08.11)
- パリ五輪2024・男子マラソン、ほぼリアルタイムの感想♪&6位入賞、赤﨑暁選手のラップタイム(2024.08.10)
「芸能・アイドル」カテゴリの記事
- 世論の逆風と雷雨の中、やす子(体重78kg、25歳)の81kmマラソンSPの感想~日テレ『24時間テレビ』2024年(2024.09.04)
- 二重偏波気象レーダー、降雹(こうひょう)アラート、数式(偏微分方程式)の変数 Pidep、Pgacw、etc ~『ブルーモーメント』第5話(2024.05.25)
- 絶対に離れない手のつなぎ方、正義も真実も超えて、人間として「心中」へ・・~『Destiny』第1話~第4話(2024.05.02)
- 嘘(lie)で壊れた橋=つながり、再建を信じて(believe)生きる(be、live)~『believe ━ 君にかける橋 ━」第1話(2024.04.27)
- 晴原(ハルカン=山下智久)が書いた雪崩の数式の意味、雲田彩(出口夏希)の中国語の発音と意味~『ブルーモーメント』第1話(2024.04.25)
「数学」カテゴリの記事
- パズル「絵むすび」31、解き方とコツ、考え方(難易度4、ニコリ作、朝日新聞be、2024年9月14日)(2024.09.15)
- 四角形や丸の「真ん中」に正三角形を配置するデザイン(YouTubeほか)、長さ、重心、三角形分割錯視を考慮した視覚調整(2024.09.08)
- パズル「推理」、小学生向け8、カンタンな解き方、表の書き方(難易度3、ニコリ作、朝日be、24年8月31日)(2024.09.01)
- パズル「ナンスケ」解き方13、2024年7月13日の問題は間違い「ではありませんでした」(難易度4、ニコリ作、朝日新聞be)(2024.07.13)
- インドの摩訶不思議な「ヴェーダ数学」、100に近い2つの数の掛け算のやり方、明星学園の中学入試問題(算数)と一般的証明(2024.07.06)
コメント
はじめまして。情報系の大学院に通っている学生です。ネットを検索中にこの文章を見つけました。ご指摘の「誤り」が大学院のデータサイエンスの先生の著書にもあり、引用の難しさを実感しました。特にこのケースは原典、原著者に近いwebサイトの間違いも要因とみられますでの、なかなか見破りにくいと思いました。それで、ご相談が2点あります。1つは、このブログの内容を、件の先生に提出するレポートで引用させていただけないか、というお願いです。もう1つは、この誤りを発見したきっかけをご教授いただければ、ということです。式を見ただけで見破った、のでしょうか?極意の片鱗を学びたく存じます。
投稿: ged | 2014年11月20日 (木) 18時44分
> ged さん
はじめまして。ブロガーのテンメイです。
丁寧なご挨拶と熱心なコメント、ありがとうございます。
仰る通り、かなり見破りにくいケースかも知れませんが、
私がおかしいと思ったのは一瞬のことでした。
つまり、「原著者に近い」サイトではなく、
「原著者の」論文をすぐ探し出したからです。
ブログその他で普段から頻繁に行ってる作業です。
論文1つを見た時点では、何が正しいのか不確定ですが、
元のデータを見て、さらに自分で計算までして、
大がかりな間違いの拡散・連鎖を確信しました。
で、ご相談の件ですが、レポートへの引用は
もちろん構いません。
ただ、当サイトの指摘を見た後、自分で元のデータを
調べたという形にすべきでしょうね。
情報系の大学院ということですし。
万が一、先生から反論のようなものがあれば、
またここに書き込んで頂いても構いません。
冷静で中身のある主張なら、私も真正面から応答します。
一方、「極意」について♪
式を見ただけで見破ったわけではありませんが、
この連続ドラマ、初回から計算間違いが複数あったのです。
だから、原論文を探してみたわけです。
それに、「ワイン方程式」という名前はちょっと
怪しいですね。通俗的で分かりやす過ぎます。
もう少し限定してないと、1つの数式にはしにくいはず。
実際、日本版のワイン方程式として放映されたものは、
少し違う式だったわけです。
一般に、米国の学者は引用文献・参照文献を大量に
付ける傾向が強いと思いますが、そんなに多くの本を
丁寧に読めるはずはありません。
という事は、つまみ読みしてるか、直接読んでないか、
いずれにせよ、信頼性があまり高くないのです。
孫引き(引用の引用)は出来る限り避けるべきでしょう。
ましてや、それが翻訳で日本に輸入された場合は、
一段と精度が下がります。
専門家・有名人の話でも、その程度のものだと
思っておけば、誤りを発見しやすくなるでしょう。
大学院生なら、なるべく信頼性の高い論文やデータに
基づく習慣を身に付けるべきだと思います。
STAP細胞騒動の後でもありますしね。
コピペや間違い、偽造に厳しい視線が集まる時期。
今後もレポートその他、大学院での学業で
頑張ってください。陰ながら応援しています。。
投稿: テンメイ | 2014年11月22日 (土) 03時18分
おお、重要なご指摘ありがとうございます! (翻訳のミスでなくてホッといたしましたが)。こんどエアーズにも連絡しておきます。
投稿: 山形浩生 | 2015年1月16日 (金) 22時39分
> 山形浩生さん
はじめまして。コメントありがとうございます。
エアーズの本の翻訳者の方ですね。
納得して頂けたようで、光栄です。
私も、アッシェンフェルター本人に確認したわけでは
ないので、100%の自信があるわけではありません。
ただ、この半年間の反応から考えても、
やはり正しい指摘だったのだと思ってます。
本当にエアーズにご連絡した際には、
その返答を教えて頂ければ幸いです♪
出版社は喜ばないかも知れませんが、
次回の印刷か改訂の際、訂正するのがベストでしょう。
他方面でのご活躍、今後も期待しています。
ではまた。。
投稿: テンメイ | 2015年1月17日 (土) 19時34分
さっそくきいたら、こんな結果になりました。ご笑覧ください。
http://d.hatena.ne.jp/wlj-Friday/20150121/1421802947
投稿: 山形浩生 | 2015年1月21日 (水) 10時23分
ごらんの通り、エアーズのまちがいの原因までほぼご指摘の通りで、調査能力の高さに感服いたします。
なお、お書きになっている中でカーネマンに触れた部分ですが、そこはまちがっていないと思います。というのも「for a particular property and at a particular age」については天候がらみの三つの要因が効く、と書いてあるからです。particular age, つまりある特定の年(ヴィンテージ)のワインをとった場合、この最後の項はすべて同じで効いてきません。ですから、日照と降雨と気温だけが作用するので、三つの要因でいいことになります。
投稿: 山形浩生 | 2015年1月21日 (水) 14時01分
> 山形浩生さん
おはようございます。
わざわざご連絡頂き、ありがとうございます。
非常に素早いコミュニケーションに驚きました。
エアーズの誠実さを物語るものでもある
でしょうし、本も面白いので、これ以上、
ご本人に問いかけるつもりはありません。
ただ、一般論として、なぜそのミスが
起きたのかはちょっと気になります。
エアーズが引用&誤読してしまった元記事は、
アッシェンフェルター本人によるものではないし、
本人の論文やデータはすぐ発見できますが・・・。
あと、最終項を書いてないのは、あの元記事より前、
ニューヨーク・タイムス冒頭も同じです(90年)。
雨量や温度に比べると、熟成年数はインパクトが
弱いので、もっと前に省略事例があるかも知れません。
これ以上、間違い探しする気もしませんが。
一方、カーネマンについて。
ご指摘のように、著者に好意的に読むことも
できなくはないでしょう。
少なくとも、著作の訂正までは必要ないと思います。
私も、「まちがってい」るとまでは書いてません。
ただ、彼は「三つの要因が効く」と書いてるの
ではなく、「三つの要因でワインの価格を予測する」
式だと書いてるわけです。
後に続く文章も「正確な」「価格」の話になってます。
正確な価格を予測するには、四つ目の項目も重要。
「ashenfelter wine」の検索で直ちにヒットする
本人の論文でも、「four variables」と書いて、
四つの変数を並べています。最初が熟成年数(年代)。
もし熟成年数だけなら、当たり前だから省略した
とも言えますが、係数0.0238を掛ける操作は
当たり前ではありません。
「三つの要因」の後で、「一つの係数」とか
付け加えるのなら問題ありませんけどね。
それをなぜか省略して、式の形で書くこともなく、
参考文献にもアッシェンフェルター本人のものが
見当たらないので、私は疑問に思ったわけです。
四つ目の項目がないこと自体よりも、
なぜ四つ目がないのか、その原因について。
あるいは、執筆の作法について。
ともあれ、この件はこのくらいにしましょう。
著者への問い合わせと私へのご連絡、
わざわざどうも有難うございました。
それでは。。
投稿: テンメイ | 2015年1月22日 (木) 08時55分