高速で高度な推論を行う最新AI、ChatGPT o3-mini にパズル「絵むすび」(朝日be、ニコリ作)を解かせると、少し出来る程度
異常な物価高と円安が続く中、毎月20ドル(約3000円)のサブスク料金を払い続けてるから、一ヶ月に数回くらいはChatGPTと対話するのがノルマになってる♪
ChatGPT4の凄さが話題になった時にすぐ契約して、既に丸2年。最初はいろんな話をしてみたけど、AI(人工知能)としては不思議なことに、理数系の能力の不足が目立ってた。人文社会系の話題にはいくらでも高速で喋り続けるのに、簡単な計算をあっさり間違えてしまう。
この2年間で、理数系の能力もかなり上がったと言われてるけど、私は当初の失敗続きの印象が残ってて、試す気にならなかった。ようやく今日、図形的な論理パズル「絵むすび」で試してみたので、簡単に結果をまとめとこう。
先に一言で書くと、昔は100点満点で5点くらいしか取れなくて論外だったけど、今は30点~40点くらいか。
まだまだ不合格だけど、レベルアップはしてるし、一部の人間には既に勝ってると思う。最後まで解けない問題でも、それなりに鋭い説明を示して来たのだ。
☆ ☆ ☆
さて、有料契約のChatGPT Plusを使う時、デフォルト(初期設定)ではGPT-4oの画面になる。このモデルが、「ほとんどの質問に最適です」とされてるのだ。
最近は会話の文章も一段と人間的になってて、これであと擬人化されたCG映像のヴァージョンが出れば、本当に友達・恋人・先生みたいな感じになるはず。
それはともかく、まず、このモデル4oに絵むすびの例題を説明させてみた。朝日新聞・土曜朝刊の別刷beに掲載されてる、ニコリ作のもの。画像認識が苦手なAIにとって分かりやすくするために、余計なものを私が手作業で消してある。
同じ絵柄の2つをそれぞれ線で結んで、マス目の全体が埋まるようにする。各線は、交差したり分岐したりしてはいけないし、1つのマス目を通る線は1本だけ。
人間にとっては恐ろしく簡単な例題で、一目で分かる。しかし、AIモデルの4oは、いまだにこの4×4=16マスの画像が読み取れないようで、3×3マスの問題とか説明して来た。
☆ ☆ ☆
当然、全体の説明も答も大間違いだったけど、3種の絵柄(赤いハート、青いクローバー、緑のダイヤ)の大まかな位置なら分かるようだ。左上とか、右下とか。
とりあえず、このモデルはあきらめて、別のAIなら何を勧めるのか聞いてみると、驚いたことに他社(Google)のAIとか勧めて来た (^^ゞ
多分、質問の意図が伝わらなかったんだと思って、ChatGPTの別のモデルだとどうなのかと尋ねても、なかなか私が欲しい答が出なかったけど、かなり無理やり誘導すると、モデルo3-miniなら期待できるかもといった感じで答えて来た。
☆ ☆ ☆
というわけで、普通のモデル4oから、理数系モデルo3-miniへと変更。「高度な推論を高速に実現」という説明が表示された。
このo3-miniに、先ほどと同じ例題の画像を見せると、ちょっとだけマシな説明を示して来たけど、まだ4×4マスの格子だという点が認識できてない。
そこで、画像認識をあきらめて、言葉で問題を説明してみた。例えば、上から2行目、左から3列目のマス目なら、(2,3)と書く。
「全体は、4×4マスの格子。ハートが、(1, 1), (2, 3)。クローバーが、(1, 3), (3, 2)。ダイヤが、(1, 4), (4, 4)です。」
すると、分かりにくい書き方だけど、答の線の引き方を正しく説明して来た。たぶん、AIの推論のプロセスをそのまま表示してるんだろうと思う。1本のつながった線を、1マス分ごとに細かく分割して考えてるのだ。アナログではなく、デジタルな思考の良くない例。
言葉による出題も、昔やってみた事だけど、前は失敗してた。今回の推論に特化したモデルは、見事に成功。ただし、人間なら一瞬で分かることを推論するのに、1分もかかってた。考えの内容や方法が違うにせよ、これだと高速とは言えない。
☆ ☆ ☆
ではいよいよ、本題。2025年3月22日(土曜)に朝日新聞で出題された絵むすびの問題が解けるか? 難易度は☆3つとされてるけど、私は☆2.5個くらいの簡単な問題だと思う。
著作権に配慮すると共に、AIにとっての分かりやすさを考えて、絵柄の代わりにアルファベットA~Fを使って描き直した。元の問題の絵柄だと、ラッパ、ラブレター、らっきょう、ラグビーボール、ランタン(ランプ)、ランドセル。
「9×9マスの格子で、アルファベットのA~Fをつなぐ問題を、言葉で出しますね。・・・Aが、(1, 4), (6, 5)。Bが、(1, 9), (2, 2)。Cが、(2, 6), (9, 6)。Dが、(3, 8), (9, 9)。Eが、(6, 8), (8, 8)。Fが、(7, 3), (8, 9)です。」
こう出題すると、AIは5分以上(!)も考えて、大まかな答えを示して来た。
「Aの経路 上左から内側を大きく回るルート ・・・
Bの経路 右上端から左上中央への大回りルート ・・・
Cの経路 中央部を縦断するルート ・・・
Dの経路 右上から右下へカーブするルート ・・・
Eの経路 比較的短い直線または軽い曲線のルート ・・・
Fの経路 中央下部の残り空間を蛇行するルート ・・・ 」
ここで「・・・」と省略した部分には、もっと細かい説明が付いてる。最後のFがちょっと怪しいけど、大体なら合ってると言っていい。100点満点で、30~40点くらい。
☆ ☆ ☆
だから、本当はキレイに解けてるのかと思ったら、そうではないらしい。私が何度も、もっと具体的に詳しくルートを書くように指示しても、どうしても書けないし、無理して書くと間違った回答になってしまう。おまけに、また時間がかかる。
というわけで、あきらめて元の普通のモデル4oに戻って、同じように例題を言葉で出してみた。すると、惜しい回答を書いて来たから、ヒントを与えると、今度は正しく回答して来た。o3-miniには劣るけど、やはりそこそこの推論能力も持ってるらしい。
ここまでのAIとのやり取りで、既にかなりの時間を使ってしまってるから、もう終了した。
☆ ☆ ☆
最後に、元の問題のヒント。要するに、ラブレター(上図のB)の線が上側で横に伸びてて、ラッパ(上図のA)の線が左上から左下へと大回り。あと、左側あたりで余ったマス目を、らっきょうとランドセルの線でうめればいい。
考え方としては、まずラッパの線とラブレターの線の関係に注目するか、ラッパの線とらっきょうの線の関係に注目するか。今まで、絵むすび記事で何十回も説明して来た通りのやり方・コツで、簡単に解くことができる。
それでは、今日はそろそろこの辺で。。☆彡
(計 2756字)
| 固定リンク | 0
« 今シーズンのランニング・イベントほぼ終了!、気が緩んで暴飲暴食、寝る前に一気に2600kcalとか♪ | トップページ | ChatGPT Plus(有料サブスク契約)で「メモリがいっぱいです」という表示を消す方法と対策&激重ジョグ »
「数学」カテゴリの記事
- 小学生の習い事と受験勉強でしぶとく人気の算盤(そろばん)、令和ではタブレットと可愛いアプリで(2025.04.26)
- トランプ相互関税の税率の数式、経済的にも意味はあるけど数値1つ(分母の係数 φ)の代入ミス、英語原文と数学的解説(2025.04.09)
- 高速で高度な推論を行う最新AI、ChatGPT o3-mini にパズル「絵むすび」(朝日be、ニコリ作)を解かせると、少し出来る程度(2025.03.25)
- 4×9=36マスの格子を、8つの長方形(1~8マス)に区切る方法~開成中2025年入試、算数・問題2の解き方(2025.02.15)
- パズル「ナンスケ」の解き方、考え方14~難易度3、ニコリ作、朝日新聞be、2025年2月8日(2025.02.09)
「パズル」カテゴリの記事
- 高速で高度な推論を行う最新AI、ChatGPT o3-mini にパズル「絵むすび」(朝日be、ニコリ作)を解かせると、少し出来る程度(2025.03.25)
- パズル「ナンスケ」の解き方、考え方14~難易度3、ニコリ作、朝日新聞be、2025年2月8日(2025.02.09)
- パズル「絵むすび」33、解き方とコツ、考え方(難易度4、ニコリ作、朝日新聞be、2025年1月25日)(2025.01.26)
- パズル「推理」の解き方、考え方、表の書き方16(難易度4、ニコリ作、朝日be、24年12月21日)(2024.12.22)
- パズル「漢字抜け熟語」の解き方・考え方5、四字熟語(難易度4、ニコリ、朝日be、24年11月30日)(2024.12.01)
「AI」カテゴリの記事
- 高速で高度な推論を行う最新AI、ChatGPT o3-mini にパズル「絵むすび」(朝日be、ニコリ作)を解かせると、少し出来る程度(2025.03.25)
- 生成AIによるディープフェイク映像・音声の功罪、近未来ドラマと世界の状況〜NHKスペシャル『創られた“真実”』(2025.03.19)
- ノーベル物理学賞2024は人工ニューラル・ネットワークの機械学習の基礎、ChatGPT4oに感想を聞くと&秋雨ずぶ濡れラン(2024.10.09)
- 世界初(?)のミスAIはヒジャブ姿のモロッコ美女、日本ではほとんど話題にならず・・(2024.07.12)
- 株式時価総額でまもなく世界1位、AI半導体トップ企業・エヌビディアの優位性・将来性について、ChatGPT-4oと対話(2024.06.08)
コメント