« 渡辺名人の細い攻めを丁寧に受け切って、藤井六冠が短手数で圧勝、敗因は8六角か~2023(第81期)名人戦・第4局 | トップページ | また土曜にお仕事・・、眠いのに11km走った後のつぶやきミックス »

ChatGPT-4、パズル「推理」の解答に大苦戦♪(難易度5、ニコリ作、朝日be、23年5月27日、表は使わない)

このブログでは今まで、パズル「推理」(ニコリ作)について、13本の記事を書いてます。

  

大人向け、4本(1本目2本目3本目4本目)。

小学生向け、6本(1本目2本目3本目4本目5本目6本目7本目)。

全員向け、1本

アインシュタイン式・論理脳ドリル、1本

  

今日は大人向けで、与えられた表を使わずに解いてみましょう。表の書き方を知りたい方は、過去の記事の解説を見てください。

    

いつものように、朝日新聞・土曜朝刊別刷beの問題で、ニコリ作、今日(2023年5月27日)掲載されてました。著作権に配慮して、文字が読めないほど縮小した上で引用しておきます。

     

230527as

 

     

     ☆     ☆     ☆

難易度は一番上の星5つですが、それほど難しい問題でもない気がします。私はいつものように、まず何も書かずに自分の頭の中だけで解決。

  

その後で、話題の対話型AI、ChatGPT(チャット・ジーピーティー)の有料最新版、Model GPT-4を使ってみました。まだ私の環境だと画像入力できないので、問題は文字入力になります。

     

230527b

   

(途中のやり取りは省略。なぜか入力の改行ができなくなったので、しばらく話が脱線♪)

   

230527c

    

GPT-4

 「了解しました。与えられた条件から以下の情報を得ました。

 1. 新井は4問作りましたが、数独ではありません。

 2. 志水は迷路を作りました。

 3. 数独を作った人は、問題数が5問以下でした。

 4. 矢北は、ナンスケを作った人の2倍の問題数でした。

 5. 柄田は、推理を作った人よりも、6問多く作りました。

   

箇条書きでまとめるのは出来るのですが、すぐに間違った回答を示して来ました。

   

230527d

   

かなりの混乱で、特に「7問」という答に苦笑 (^^ゞ たぶん、どこかで1問という問題数に6問(柄田の証言)を加えて、7問という問題数を勝手に作ってしまったのでしょう。

   

以前、朝日のパズル「ナンスケ」解かせた時大苦戦してたので、予想はしてましたが、今回もAIは大苦戦。少しずつ何度も解き方を教えて、ようやく正解にたどり着きました。まだ今現在、あまり複雑な論理は扱えないようです。ごく簡単なパズルが解ける程度のレベル。

  

   

      ☆     ☆     ☆

というわけで、人間の私が、AIを少しずつ誘導して行くことになりました。まあ、AIの進化のスピードは非常に速いので、1年後にはもう、単なる昔の笑い話になってるかも知れません♪

   

230527er

      

 「やはり、このレベルの問題は解けないようですね。では、私が少しずつ教えて行くので、それに従って回答してください。もし、新井がナンスケだと仮定すると、矛盾します。理由が分かりますか?

   

(途中のやり取りは省略。柄田は7問(笑)とか言って来たので、柄田は10問になることを教えました。)

   

GPT-4 「・・・(省略)・・・ 新井がナンスケを作ったとすると、その問題数は4問です。 矢北の問題数はナンスケを作った人(新井)の2倍なので8問になります。

しかし、柄田は推理を作った人よりも6問多く作るため、推理を作った人の問題数は4問(10-6)でなければならず、これは新井がすでに4問を作っているため矛盾します。したがって、新井がナンスケを作ったという仮定は誤りです。ご指摘ありがとうございました。」

    

   

というわけで、新井はナンスケではないし、数独や迷路でもないので、クロスワードか推理のどちらかです。

   

では、どちらでしょうか? 今はまだ土曜の夜。あまりネタバレにならないよう、いつものように少しずつ書いて行きます。次の更新(アップデート)は、明日(日曜)の夕方の予定です。ではまた。

     

   

      ☆     ☆     ☆

はい。日曜の夕方遅くになりましたが、少し先に進みましょう。

     

230528d

   

 「志水が迷路を作ったから、新井は迷路を作っていません。だから、新井が作ったのは、クロスワードか推理です。しかし、もし新井がクロスワードを作ったと仮定すると、矛盾が生じます。理由が分かりますか?

   

230528e

    

上のAIの説明は、最後の結論は合ってますが、前半で別の可能性を見落としてるので、私がそれを指摘しました。

  

 「違います。柄田が8問作って、推理を作った人が2問の可能性がまだ残されています。この場合、矢北が推理を2問作って、ナンスケを作った人が1問作ったことになります。すると、数独についての矛盾が生じます。理由が分かりますか?

   

230528f

     

GPT-4 「すみません。・・・・・・数独を作った人は問題数が5問以下であり、既に1問、2問、4問(新井が作った数)は取られています。しかし、次に少ない問題数である8問はすでに柄田が取っているため、数独を作ったひとが作る問題数が存在しなくなってしまいます。

 

したがって、新井がクロスワードを作ったという仮定は間違っています。新井は推理を作ったことになります。こうすると新井が作ったパズルは推理で、問題数は4問と確定します。ご指摘と説明に感謝します」

   

このAIの返事は、赤い色の部分が少し変ですが、もう面倒なので、突っ込みませんでした♪

    

  

      ☆     ☆     ☆

230528g

   

 「すると、柄田が作ったのは何問ですか? また、矢北が作ったのは何問になりますか?

   

この私の質問に、AIは、「柄田の問題数は10問、矢北の問題数は8問となります」、と答えて来ました(その説明は省略)。

  

だからは、柄田の10問は合ってるけど、矢北が間違ってると指摘しました。

   

それでは、矢北の正しい問題数は何問になるでしょうか? 次の更新は明日(月曜)の夜の予定です。ではまた。。

    

   

      ☆     ☆     ☆

はい。月曜の夜になったので、また少し進みます。

   

230529g

     

230529h

    

GPT-4の回答はまたあちこちがちょっと変ですが、大まかな流れと結論は合ってます。ナンスケを作った人が1問で、矢北が2問のはずです。

   

この後は、矢北が作ったパズルの種類が分かります。後はもう簡単なので、土曜の正解発表の後に書くことにします。ではまた。。

   

   

      ☆     ☆     ☆

はい。では正解が発表されたので、最後まで書きます。この辺りからはもう、AIも「ほぼ」正確に考えてました。

    

230603d

   

AIの応答は、途中の志水の説明が変ですが、スルーしましょう♪ 数独は5問以下。ナンスケが1問、推理が4問だから、数独は2問の矢北になります。

   

230603e

     

230603f

    

迷路の志水はもう、8問しか残ってません。これが応募用の答です。この後の説明はもう省略しましょう。

    

230603g

   

   

というわけで、AIが事実と異なることを答えるという話はよく言われてますが、論理的な思考もしばしば間違ってることが確認できました。

   

開発者も知ってるはずなので、近いうちに修正されるでしょう。数年以内には、このレベルの論理パズルも一瞬で解けるようになるはず。それでは今回はこの辺で。。☆彡

      

       (計 2242字)

   (追記464字 ; 合計2706字)

| |

« 渡辺名人の細い攻めを丁寧に受け切って、藤井六冠が短手数で圧勝、敗因は8六角か~2023(第81期)名人戦・第4局 | トップページ | また土曜にお仕事・・、眠いのに11km走った後のつぶやきミックス »

数学」カテゴリの記事

パズル」カテゴリの記事

AI」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 渡辺名人の細い攻めを丁寧に受け切って、藤井六冠が短手数で圧勝、敗因は8六角か~2023(第81期)名人戦・第4局 | トップページ | また土曜にお仕事・・、眠いのに11km走った後のつぶやきミックス »