« 今シーズンのランニング・イベントほぼ終了!、気が緩んで暴飲暴食、寝る前に一気に2600kcalとか♪ | トップページ | ChatGPT Plus(有料サブスク契約)で「メモリがいっぱいです」という表示を消す方法と対策&激重ジョグ »

高速で高度な推論を行う最新AI、ChatGPT o3-mini にパズル「絵むすび」(朝日be、ニコリ作)を解かせると、少し出来る程度

異常な物価高と円安が続く中、毎月20ドル(約3000円)のサブスク料金を払い続けてるから、一ヶ月に数回くらいはChatGPTと対話するのがノルマになってる♪

   

ChatGPT4の凄さが話題になった時にすぐ契約して、既に丸2年。最初はいろんな話をしてみたけど、AI(人工知能)としては不思議なことに、理数系の能力の不足が目立ってた。人文社会系の話題にはいくらでも高速で喋り続けるのに、簡単な計算をあっさり間違えてしまう。

    

この2年間で、理数系の能力もかなり上がったと言われてるけど、私は当初の失敗続きの印象が残ってて、試す気にならなかった。ようやく今日、図形的な論理パズル「絵むすび」で試してみたので、簡単に結果をまとめとこう。

   

先に一言で書くと、昔は100点満点で5点くらいしか取れなくて論外だったけど、今は30点~40点くらいか。

    

まだまだ不合格だけど、レベルアップはしてるし、一部の人間には既に勝ってると思う。最後まで解けない問題でも、それなりに鋭い説明を示して来たのだ。

    

    

     ☆   ☆   ☆

さて、有料契約のChatGPT Plusを使う時、デフォルト(初期設定)ではGPT-4oの画面になる。このモデルが、「ほとんどの質問に最適です」とされてるのだ。

    

最近は会話の文章も一段と人間的になってて、これであと擬人化されたCG映像のヴァージョンが出れば、本当に友達・恋人・先生みたいな感じになるはず。

  

それはともかく、まず、このモデル4oに絵むすびの例題を説明させてみた。朝日新聞・土曜朝刊の別刷beに掲載されてる、ニコリ作のもの。画像認識が苦手なAIにとって分かりやすくするために、余計なものを私が手作業で消してある。

   

250325a

  

同じ絵柄の2つをそれぞれ線で結んで、マス目の全体が埋まるようにする。各線は、交差したり分岐したりしてはいけないし、1つのマス目を通る線は1本だけ。

   

人間にとっては恐ろしく簡単な例題で、一目で分かる。しかし、AIモデルの4oは、いまだにこの4×4=16マスの画像が読み取れないようで、3×3マスの問題とか説明して来た。

   

   

     ☆   ☆   ☆

当然、全体の説明も答も大間違いだったけど、3種の絵柄(赤いハート、青いクローバー、緑のダイヤ)の大まかな位置なら分かるようだ。左上とか、右下とか。

    

とりあえず、このモデルはあきらめて、別のAIなら何を勧めるのか聞いてみると、驚いたことに他社(Google)のAIとか勧めて来た (^^ゞ

  

多分、質問の意図が伝わらなかったんだと思って、ChatGPTの別のモデルだとどうなのかと尋ねても、なかなか私が欲しい答が出なかったけど、かなり無理やり誘導すると、モデルo3-miniなら期待できるかもといった感じで答えて来た。

   

   

     ☆   ☆   ☆

というわけで、普通のモデル4oから、理数系モデルo3-miniへと変更。「高度な推論を高速に実現」という説明が表示された。

  

250325b

    

このo3-miniに、先ほどと同じ例題の画像を見せると、ちょっとだけマシな説明を示して来たけど、まだ4×4マスの格子だという点が認識できてない。

   

そこで、画像認識をあきらめて、言葉で問題を説明してみた。例えば、上から2行目、左から3列目のマス目なら、(2,3)と書く。

     

全体は、4×4マスの格子。ハートが、(1, 1), (2, 3)。クローバーが、(1, 3), (3, 2)。ダイヤが、(1, 4), (4, 4)です。

    

すると、分かりにくい書き方だけど、答の線の引き方を正しく説明して来た。たぶん、AIの推論のプロセスをそのまま表示してるんだろうと思う。1本のつながった線を、1マス分ごとに細かく分割して考えてるのだ。アナログではなく、デジタルな思考の良くない例。

   

250325c

   

言葉による出題も、昔やってみた事だけど、前は失敗してた。今回の推論に特化したモデルは、見事に成功。ただし、人間なら一瞬で分かることを推論するのに、1分もかかってた。考えの内容や方法が違うにせよ、これだと高速とは言えない。

    

   

     ☆   ☆   ☆

ではいよいよ、本題。2025年3月22日(土曜)朝日新聞で出題された絵むすびの問題が解けるか? 難易度は☆3つとされてるけど、私は☆2.5個くらいの簡単な問題だと思う。

   

著作権に配慮すると共に、AIにとっての分かりやすさを考えて、絵柄の代わりにアルファベットA~Fを使って描き直した。元の問題の絵柄だと、ラッパ、ラブレター、らっきょう、ラグビーボール、ランタン(ランプ)、ランドセル

   

250325d

    

9×9マスの格子で、アルファベットのA~Fをつなぐ問題を、言葉で出しますね。・・・Aが、(1, 4), (6, 5)。Bが、(1, 9), (2, 2)。Cが、(2, 6), (9, 6)。Dが、(3, 8), (9, 9)。Eが、(6, 8), (8, 8)。Fが、(7, 3), (8, 9)です。」

    

こう出題すると、AIは5分以上(!)も考えて、大まかな答えを示して来た。

  

Aの経路  上左から内側を大きく回るルート ・・・

 の経路  右上端から左上中央への大回りルート ・・・

 の経路  中央部を縦断するルート ・・・

 の経路  右上から右下へカーブするルート ・・・

 の経路  比較的短い直線または軽い曲線のルート ・・・

 の経路  中央下部の残り空間を蛇行するルート ・・・ 」

       

ここで「・・・」と省略した部分には、もっと細かい説明が付いてる。最後のFがちょっと怪しいけど、大体なら合ってると言っていい。100点満点で、30~40点くらい。

    

    

     ☆   ☆   ☆

だから、本当はキレイに解けてるのかと思ったら、そうではないらしい。私が何度も、もっと具体的に詳しくルートを書くように指示しても、どうしても書けないし、無理して書くと間違った回答になってしまう。おまけに、また時間がかかる。

   

というわけで、あきらめて元の普通のモデル4oに戻って、同じように例題を言葉で出してみた。すると、惜しい回答を書いて来たから、ヒントを与えると、今度は正しく回答して来た。o3-miniには劣るけど、やはりそこそこの推論能力も持ってるらしい。

   

ここまでのAIとのやり取りで、既にかなりの時間を使ってしまってるから、もう終了した。

  

   

     ☆   ☆   ☆

最後に、元の問題のヒント。要するに、ラブレター(上図のB)の線が上側で横に伸びてて、ラッパ(上図のA)の線が左上から左下へと大回り。あと、左側あたりで余ったマス目を、らっきょうとランドセルの線でうめればいい。

    

考え方としては、まずラッパの線とラブレターの線の関係に注目するか、ラッパの線とらっきょうの線の関係に注目するか。今まで、絵むすび記事で何十回も説明して来た通りのやり方・コツで、簡単に解くことができる。

   

それでは、今日はそろそろこの辺で。。☆彡

   

     (計 2756字)

| |

« 今シーズンのランニング・イベントほぼ終了!、気が緩んで暴飲暴食、寝る前に一気に2600kcalとか♪ | トップページ | ChatGPT Plus(有料サブスク契約)で「メモリがいっぱいです」という表示を消す方法と対策&激重ジョグ »

数学」カテゴリの記事

パズル」カテゴリの記事

AI」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 今シーズンのランニング・イベントほぼ終了!、気が緩んで暴飲暴食、寝る前に一気に2600kcalとか♪ | トップページ | ChatGPT Plus(有料サブスク契約)で「メモリがいっぱいです」という表示を消す方法と対策&激重ジョグ »