« 盆休みのはずがトラブル連発・・&悲惨なリハビリ・ジョグ | トップページ | ガリガリ君(梨)当たり♪&人妻忘却&雨上がり自転車 »

変化点検出とスコア、具体的な計算例~『ハードナッツ』最終回

お盆休み前に色々バタバタしたせいで、放映3日後になってしまったが、最後

の記事をアップしよう。『ハードナッツ!~数学girlの恋する事件簿~最終回

恐怖のウイルスとくるみの秘密(後編)」。数学考証、根上生也。最終回と言っ

ても、明らかに続編を意識した終わり方なので、第1シリーズ最終回と言うべ

きかも。

 

ウイルス、数学ガール・難波くるみ(橋本愛)、伴田刑事(高良健吾)、どれも

一通りの秘密は明かされてたが、キレイに解決した形にはなってない。去年

はBSだったのが、今年は地上波の再放送へと格上げ。1年以内に第2シリー

ズがある方が自然だと思う。あるいは映画化とか。『ガリレオ』も含めて、事件

ものの連続ドラマでは、続編が珍しくないのだ。

 

 

         ☆          ☆          ☆

では、前回の記事の続きとして、「変化点検出」の計算の具体例を示すことに

しよう。ドラマの物語的には、くるみが伴田の致命的な変化点を検出した時、

数式計算は使ってない。恋する女の子の勘でおかしいと思って、計算を止め

て伴田の元に向かったわけだ。場所を突き止めたのも、直感か直観だろう♪

 

ただ、ここでは例の数式を真正面から取り上げてみる。実際、計算してみると

思ったより遥かに面倒で、ネット上に手作業の具体例が見当たらないのも当

然だなと納得した。コンピューターのプログラム計算ばかりで、それでさえ量・

質ともに限られてるのが現状だ。

 

なお、前回の記事でかなりの理屈は説明してあるので、ここでは基本的に、同

じ話は省略する。前回の記事を読んでない方には、先にあちら(下のリンク)を

軽く読むことをお勧めしとこう。ただ、この記事だけでも一応、理解できると思う。

 

 cf. 変化点検出と外れ値、スコア(Score)~『ハードナッツ』第7回

 

 

         ☆          ☆          ☆

最初に、くるみが書いてた黒板のグラフに似たものとして、次のグラフを提示

しとこう。私が説明用に作ったもので、実社会で使う時には普通、遥かにデー

タ量が多いようだ(セキュリティ、金融など)。

 

140815a

 

 

横軸は時間tの軸で、例えばある月の日付けと考えればいい(ドラマは11月)。

縦軸は変数 x t の値で、ドラマだと伴田からの電話の回数だった。6日(t=6)

の時点で一度、0から2へと変化してるが、その後はまた0続きになってるから、

x 6の点やその値は「外れ値」と呼ばれる。それに対して、11日以降は本物の

変化に見えるので、「変化点」というものを計算で決めたくなる。

 

「計算しなくても明らかだろう」という考えは、このグラフの場合だけだと、ごもっ

ともだ。でも、実際は遥かに複雑で微妙な変化だから、「明らか」で済ませる事

は出来ない。そこで、何とか精度の高い計算を工夫するわけだが、単純ではな

い現象の未来を予測するのだから、完全な計算などあり得ない。そうした限界

は大前提として、ドラマの数式通りに計算してみる。

 

 

           ☆          ☆          ☆

では、前回の記事にも挿入した数式3本を再確認してみよう。

 

140806a

 

 

大きな流れとしては、次のようになってる。以下、上の「q」は大文字で「Q」と

書き直し、「ln」は普通に「log」(底eの自然対数)と書くので、念のため。

 

   変数 x t → その値の確率P(x t) 

         → そのスコア、Score(x t)。つまり、-log P(x t)

         → Score(x t)のT日分の平均、y t。

            つまり、(1/T)ΣScore(x i)

         → y tの値の確率Q(y t)

         → そのスコア、つまり、-log Q(y t)

         → そのT日分の平均、(1/T)Σ-log Q(y i)、

            つまり、Score(t)

 

要するに、3段階×2セット=6段階の計算をしてるわけで、特に確率分布P、

Qの計算が厄介だから、実用的にはコンピューターに任せてるらしい。以下の

私の計算では、大まかなイメージで暗算してあるので念のため。要するに、変

数からスコアに至る計算の流れを単純化して確認したいだけなのだ。。

 

 

          ☆          ☆          ☆

まず、最初の1段階の計算。つまり、x t の確率、P(x t)の計算まで。t-1

日目までの情報をもとに、その都度決め直すから、P t-1(x t)という分かり

にくい書き方になる。

 

140815b

 

 

目立つ値に対しては、確率が低くなるから、6日と11日には一気に確率0.1

(10%)まで下がってる。繰り返すが、上の確率の計算は私の目分量なので、

念のため。雰囲気的に、当たらずとも遠からずであるのが分かると思う。実際

にはプログラム計算で、前日(t-1日)までの値から、t日目の様々な値の確率

分布を求める(と言うより、決める)わけだ。

 

初日と2日目の確率Pを書いてないのは、情報不足で確率を決定できないか

ら。例えば、「この紙に書かれた数字は0。では、次の紙の数字は理論的にい

くらか?」と聞かれても困るだろう。一応、少なくとも2つ以上の情報が与えられ

た時点で確率を予測することにしたから、3日以降の確率Pしか書いてない。

 

 

           ☆          ☆          ☆   

続いて、y tまでの2段階の計算。Score(x t)は省略して S(x t)と書いた。

T=3、つまり3日分の平均値を取るので、ハッキリした動きがx t より2日遅

れくらいで生じる。8日目と13日目がポイントになってるのだ。

 

140815c

 

 

logの値は、本当は複雑だが、上では端数省略で単純化してある。これ以降

の計算でも同様。ただ、前の確率分布の計算と違って、ここでの計算は単純

なものだ。y t の値が5日目から始まってるのは、3日分の平均値だから、つ

まり5日目の値なら、y 5=(1/3)(S 3 +S 4 +S 5)と計算できるが、4日

目の計算は出来ないのだ(S 2 が無いから)。 

 

 

          ☆          ☆          ☆   

そして最後に、Score(t)までの3段階の計算。

 

140815d

 

 

もちろん、y t の確率分布Q(y t)は、私が目分量で決めてるだけ。気になる

方のためにQの値も書き添えると、左から順に、 0.02, 0.02, 0.02,

0.03, 0.04, 0.01, 0.005, 0.02, 0.04。yはxと違って整数

ではないから、全体的に確率は低くしてある。特殊な値である y 13 に対して

は、特に低い確率0.005を割り当てた。

 

最終的なスコア計算が可能になるのは9日目以降で、数値変化のピークは

14日目になる。要するに、技巧的な計算を重ねるに連れて、変化の検出は

遅くなるわけだが、外れ値に騙されることなく確実に検出できるということだ。

もちろん、建前的には。

 

 

           ☆          ☆          ☆

計算だけでなく、元のグラフとスコアのグラフの比較も行ってみよう。決定的変

化がほぼ確実になった所で、スコアのグラフは変化点らしきものを示してる。

ピークまで上がって下がる直前辺りが変化点だ。元のグラフと違って、上下ジ

グザグにはならず、単純に上がって下がるから、分かりやすいのは確かだ。

 

140815e

 

 

ちなみに、元の数値とスコアの数値が似てるのはたまたまで、一般的には

全く違う数値になるはずだ。スコアの場合、途中で2回、-log(確率)の計算

をしてるから、この私の例でたまたま似た値になってるのは、無意識の内に

私が0~5の簡単な値を望んだからだろう。

 

スコアのグラフの変化が少ないのもたまたまで、ネット上のプログラム計算例

を見ると、スコアのグラフは非常に激しい動きになってる。まあ、私の例でも、

スコアの値にもう一工夫して変化を激しくするのは簡単なのだ。すぐ思い付く

工夫は、10の{Score(t)-3}乗を計算すること。あるいはもっと簡単に、スコ

アから3を引いて縦軸を5倍に引き延ばしてもいい。

 

 

          ☆          ☆          ☆

なお、ウイルス散布のための、天井の高さ7.45mの計算については、少し調

べた上で、3日以内に追記する予定。あまりに簡単で適当な計算だから、ほと

んど実用性はないと思う。『ガリレオ』なら微分方程式を書く所だろう(具体的な

数値・計算抜きで)。

 

それでは、今日はこの辺で。。☆彡

 

 

 

cf. トランプのポーカーの確率計算

          ~『ハードナッツ!~数学girlの恋する事件簿~』第1回解説

   検査精度と難病の確率、落下速度、素因数分解の暗号

                     ~『ハードナッツ!~数学girl』第2回解説

   無理数を発見した弟子をピタゴラスが殺したという伝説の検証

                             ~『ハードナッツ』第3回

   ピタゴラス音律と普通の十二平均律、周波数のズレなど~第3回

   ラブレターの換字式暗号&数字の順列パスワード~第4回

   計量文献学による解析、K特性値、筆者判定~第4回

   ハートマークと「i LOVE u」、愛の方程式~第5回

   「アッシェンフェルターのワイン方程式」の間違いと本物(原論文)~第5回

   特殊な違いの有無の判定(統計的推測、5%片側検定)~第6回

   変化点検出と外れ値、スコア(Score)~第7回

 

                                    (計 3471字)

| |

« 盆休みのはずがトラブル連発・・&悲惨なリハビリ・ジョグ | トップページ | ガリガリ君(梨)当たり♪&人妻忘却&雨上がり自転車 »

映画・テレビ」カテゴリの記事

芸能・アイドル」カテゴリの記事

数学」カテゴリの記事

コメント

テンメイさん、こんにちは!
付記記事を追加ということですが、
まずはここまで完走お疲れ様です。
私の方は数学ガールのくるみがむっちゃかわいくて
数式の方はほぼスルー状態のまま
なんとか最後まで見ましたわ。
テンメイさんのところにお邪魔すると
丁寧な説明がありますが
まあ、右から左にほぼわかりません(苦笑
でも毎週ちゃんと読みに来てましたわよ。

ドラマでは最も興味深かったのが
事故率のパーセント(?)の6話かな。
アクチュアリーの友人視点を聞いた直後でしたから
まったく違うドラマなのに
文系の脳ではミックスされて
妙なものになって残ってました(^^;
最終回はあっさりで続きがあるとばかり思ってたから
終わっちゃったなんてびっくり。
数学で復讐をするという目的があったはずですが
人道的な終え方でしたね。
くるみの続編を見たいと言う人は多いでしょうね~。
テンメイさん、お疲れ様でした。
ひと休みしてコーラ味かき氷をどうぞ♪(^^

お盆はご実家に帰らなかったのでしょうか。
毎夏恒例の乗鞍も近づいてきましたしね。
残暑厳しいですがどうぞ気を付けてお過ごしくださいね。

投稿: エリ | 2014年8月16日 (土) 17時00分

> エリさん
   
おはようございます!
  
2本とか3本セットの記事を書いた時、
1本しか読まれないことはよくあります。
その点、この記事はわりと両方読んでくれる人の
割合が多いような気がしますね♪
  
ま、元々の読者数が少ないけど (^^ゞ
『ガリレオ』の5分の1以下かな。
記事内容はこっちの方がしっかりしてるのに。
ブツブツ。。(笑)
     
ドラマの本数が8本だし、再放送だし、
時期的にも8月半ばだから、「終わった~」って
感じが少ないんですが、やっぱりホッとしました♪
   
「数式の意味が分からなかったらどうしよう・・」
とか、毎回緊張してたもんで (^^ゞ
続編が始まるまでに、もっとパワーアップしなきゃ!
   
「くるみがむっちゃかわいくて」
エリさんの好みだろうな・・と思ってました(笑)
時々、むっちゃ可愛い表情や仕草がありましたね♪
無邪気であどけない、キュートな美少女
天真爛漫に見えて、ちょっと小悪魔系☆
数学の天才なのに、かなりおバカな所がまた可愛い。
     
まあでも、個人的には数式の方が可愛かったかも
せめて、あの数学ガールっぽいファッションを
どうにかしてくれれば、もっと萌えたのに♪
洋服だけ、あまりに現実っぽいから(笑)
  
   
で、エリさんはあの可愛い数式をスルーしたと♪
もったいない。。後で再チャレンジしてください。
9割以上は高校レベルですからね。
ちゃんとスタッフも考えて、高級な話は避けてます。
で、改めてウチの記事を読み直すと、
「こんなに簡単な内容だったの?!」と驚くでしょう
   
ここで突然、「アクチュアリー」!
ドラマのタイトルかと思いましたよ(^^ゞ
   
ビジネスのリスク計算の専門家ですね。
朝日新聞で何度か話題にしてたから覚えてます。
やっぱ、エリさんがひっそり住んでる「森」って、
実は専門家集団の要塞みたいな感じかも(笑)
遠くの別世界じゃなくて、現実世界ですよね。
絵本より日経新聞読んでる感じ
     
アクチュアリーと数学ガールって、
文系の脳じゃなくても、思い切り重なってますよ。
福山先輩なら、「実に面白い!」と言ってくれそう♪
ちょっと調べて、数学&経済記事でも書こうかな。
中間領域だから、どっちの領域の人もスルーするかも (^^ゞ
   
   
ドラマの最後は、まったく数学とは無関係でしたね。
文系的で「人道的」(笑)。ま、国営放送だから♪
続編では非・人道的な終え方で炎上するのもいいかも
   
僕が唯一読んでる漫画の週刊ヤングマガジンに、
『彼岸島』っていう人気作品があってね。
映画にも深夜ドラマにもなってる長編怪奇物語。
    
人間と吸血鬼が闘うんだけど、先日、吸血鬼の大勝利で
渋谷が大パニックになって、完結しちゃいました(爆)。
まさに非・人道的なシュールさ。
ま、実は続編へと引きつける「釣り」のようですが♪
   
   
とにかく、『ハードナッツ』第1シリーズ終了ってことで、
コーラ味のかき氷、どうもです
次は宇治金時 をお願いします♪
   
お盆はしばらく帰ってないんですよ。
まあ、今年は正月、2月、5月と帰省してるから、
十分でしょ・・と、親不孝ダメ息子は思ってます (^^ゞ
  
乗鞍が今年は9月だから、どうも気合が入らなくて。。 (^^ゞ
8月末のままの方が分かりやすかったのにな。
ま、残り3週間、それなりに頑張るつもりです
    
     
今年の夏も、そろそろ終盤の気配になって来ましたね♪
残暑と不安定な天気の中、エリさんもご自愛ください。
エアロバイクも、もう一頑張り(笑) ではまた。。

投稿: テンメイ | 2014年8月18日 (月) 07時23分

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: 変化点検出とスコア、具体的な計算例~『ハードナッツ』最終回:

» エボラ出血熱のようなもので退場(橋本真実)壁ドン(高良健吾)さよならなんて言わせません(橋本愛) [キッドのブログinココログ]
「続きはないのかよ・・・」と思わず叫ぶ最終回である。 「ケイゾク」や「トリック」あるいは「富豪刑事」などにはあったので・・・くるみとの再会の日を待ちたい。 それはそれとして・・・呪われた「地上波初放送」の後の第1回の再放送・・・。 6/29(日)にスポーツ中継の延長に伴って中止、7/8(火)深夜、台... [続きを読む]

受信: 2014年8月15日 (金) 16時22分

« 盆休みのはずがトラブル連発・・&悲惨なリハビリ・ジョグ | トップページ | ガリガリ君(梨)当たり♪&人妻忘却&雨上がり自転車 »