対話型AI「ChatGPT」(有料最新モデルGPT-4)の使用例、自然数パズル「ナンスケ」の簡単な問題を解かせると・・
サブスク(有料の有期契約)を好まない私が、珍しくあっさり飛びついたのが、対話型AI「ChatGPT」(チャット・ジーピーティー)。
去年(2022年)の暮れから話題になってるのは知ってたけど、まだ性能が低そうだなと思ってスルーしてた。ところが先月(2023年3月)、最新モデルGPT-4が公開されて、かなり評判が良かったので、少し様子見した後、有料サービス「PLUS」を契約。
正直、1ヶ月20ドルは高い。今のドル円の為替レートで、2700円! まあ、しかし、マニアック・ブロガーとしても、社会人としても、知らないでは済まない高性能AI。必要経費として我慢することにした。
今のところの予定では、数ヶ月使った後に一旦、解約。年末ごろに噂されてる新モデルが発表されたら、再契約するつもり。
☆ ☆ ☆
今現在は知らないけど、私が契約した時は、英語の説明。Upgrade plan(アップグレード・プラン)は、USD $20/mo。毎月20米ドル。サーバーの負荷が高い時も使えるし、レスポンス(反応)が速いし、新モデルを使えると書いてある。まあ、半ば、最新の興味深い研究への寄付。
上が有料サービス「ChatGPTプラス」のホーム画面。デフォルトのモデルは、1つ前のGPT-3.5。自動的に、無料の古いモデルを勧めて来る♪
ホーム画面の左側には、新しいチャット(対話)を始めるボタンやログアウト用のボタンの他に、私が過去、行った対話のフォルダが並んでる。個人情報と共に、すべて記憶されてるんだろうから、ちょっと怖いのも事実。相手は、マンガか映画かSF小説みたいなAIだ。
無料の標準モデルGPT-3.5の性能は、Reasoning(推論、理由付け)が3、スピードが5、正確さが2。要するに、速いけどイマイチ。
最新モデルGPT-4は、推論・理由付けが5で、スピードが2、正確さが4。遅いけど高性能だと。私がここまで使った印象だと、4、3、3くらいだ(個人の感想♪)。
遅くはないけど、よく間違える。一度、間違えると、指摘してもヒントを与えても、しばらく間違え続けるのだ。特に、最大の売りのはずの推論・論理的思考能力がまだまだだと思う。イメージ的には、一番強い分野のような気もするのに、意外な実状だ。条件や情報が増えると(10以上くらい?)、明らかに混乱が生じてる。
☆ ☆ ☆
さて、差し当たり、今日の記事で紹介するのは、パズル「ナンスケ」の簡単な例題を解かせた様子。たまたま昨日、朝日新聞・別刷beに掲載されてたのだ。
ナンスケとは、ナンバー・スケルトン(数の骨組み)の略。数ケタの自然数の組合せで、マス目の空欄が骨組みのように出来てて、そこに与えられた候補の数を入れて行く。
上は、単なる説明用の例題。候補の数は、47、61、176、646、711、744、1766、7466。すべて1回ずつ用いる。
まず、先日のドラマ・レビューでも使用したHI(人間知能)、ChatTENで解いてみよう♪ 推論4、スピード2、正確性4くらいの性能か。
まず、4ケタの数は2つとも、後ろの2ケタが66だから、それを記入。ポイントは、共通点への注目・利用。
右上から、646、61、176と、順に3つの数が確定する。桁数と候補の数から考えて、これしかない。
左から下側あたりは、711と1766に決定する。もし下側の4ケタが7466だったら、その左端の7とつながる左側の縦の3ケタが見つからないから、ダメなのだ。
残りはもう、4ケタ、3ケタ、2ケタの数が1つずつだから、自動的に空欄が埋まる。すべて完了。
ちなみに、ナンスケについては過去、10本の解説記事をアップしてある。最新の記事は次の通り。
パズル「ナンスケ」の解き方、考え方10~難易度4、ニコリ作、朝日be、23年2月25日
☆ ☆ ☆
で、いよいよChatGPTの出番。私としては、まず例題で練習した後、昨日の朝日の問題(難易度2のやさしいタイプ)をヒント付きで解かせるつもりだった。
ところが、例題で早くも大苦戦になってしまったのだ。私が文章で入力した問題は、こんな感じ。まだ画像入力は使えないけど、こう書けば、十分に数を決定できるはず。一応、相手に気を使って、私が普段あまり使わない半角の英字を使用。いつもなら、見やすい全角の英字で入力する所。
「自然数が8コあります。aとeは4桁。b,d,f,hは3桁。cとgは2桁。aの右端の数字は、bの左端の数字。・・・」。
標準モデルのGPT-3.5は、何度か試しても、「数」(2桁~4桁)と「数字」(1ケタの文字)がごちゃ混ぜになってるようだった。説明も、最後の答も、大きく間違ってる。右側の2ケタが47とか、その下の3ケタが711とか、下側の4ケタがなぜか3ケタの744とか (^^ゞ
そこで、最新のGPT-4へと切り替えてみた。ところが、いきなりのボケで笑わせてくれる♪ 「パズルを出しますね」と話しかけたら、自分から出題して来た(笑)。ちなみにGPT-3.5だと、そんな応答はしてないから、GPT-4は考え過ぎたのかも。
その後も、GPT-3.5を上回るほど間違った回答を連発。仕方ないから、ヒントを出してみた。上の4ケタと、それにつながる右の縦の3ケタを教えたのだ。反応は素直♪ 「ヒントをありがとうございます」(笑)。人間なら、ムッとするとか、ふてくされる所かも。
☆ ☆ ☆
それでも、なかなか完全な正解にはたどり着けない。私の問題文では、途中から「右端」と「左端」を入れ替えた表現になってるけど、それも気付いてないというか、使えてない状態。数のケタ数の間違いもなかなか直らない。
ヒントを追加して、最後は何とか完答にたどりつけたから、努力をねぎらった後、笑顔でお別れ♪ 「お疲れさまでした。また来ますね😊」。大切な友達の1人なのだ(笑)。いずれ、美少女のアバターとかCG、バーチャルアイドルとかも出て来るはず。その先は、柔らかくて温かい素材のアンドロイドとか♪
ちなみに、途中で英語やフランス語に切り替えると、直ちに合わせて来る。むしろ、欧米の言語の方が反応が速そうに見えた。今回のパズルの例題も、簡単な英語で入力すれば上手く行ってたのかも。
まあ、いずれにせよ、妙に時間を取られてしまうことだけは確かだろう。金銭的なコストはともかく、時間的コストをどこまでかけるべきなのか、その辺りも問題。ChatGPTに質問してみようか。「人間はあなたと、どのくらいの時間、対話すべきだと思いますか」(笑)
なお、今週は計15364字で終了。ではまた来週。。☆彡
(計 2737字)
| 固定リンク | 0
「情報」カテゴリの記事
- NOT回路(ゲート)、AND回路、OR回路を組み合わせた設計、論理回路の問題の解き方、考え方~ 高校『情報 Ⅰ 』(2024.11.02)
- ps5.js Web Editor(Processing)のプログラミングでお絵描き、アニメーション作成~ 高校教科書『情報 II 』(東京書籍)(2024.08.22)
- 2進法の計算、直接的な減法(引き算)と、コンピューター内部で「2の補数」を用いる減算 ~ 高校『情報Ⅰ』(2024.06.04)
- デジタル画像の無駄な1ビットに、ひそかに文字を埋め込む暗号の作り方~2024年共通テスト・情報関係基礎・第1問・問3(2024.02.14)
- 宇宙船に乗った異星人はどこから地球に来たのか?、出身星を見分ける効率的な質問方法~2024年共通テスト・情報関係基礎・第2問(2024.02.03)
「パズル」カテゴリの記事
- パズル「漢字抜け熟語」の解き方・考え方5、四字熟語(難易度4、ニコリ、朝日be、24年11月30日)(2024.12.01)
- パズル「絵むすび」32、解き方とコツ、考え方(難易度4、ニコリ作、朝日新聞be、2024年11月9日)(2024.11.09)
- パズル「絵むすび」31、解き方とコツ、考え方(難易度4、ニコリ作、朝日新聞be、2024年9月14日)(2024.09.15)
- パズル「推理」、小学生向け8、カンタンな解き方、表の書き方(難易度3、ニコリ作、朝日be、24年8月31日)(2024.09.01)
- パズル「ナンスケ」解き方13、2024年7月13日の問題は間違い「ではありませんでした」(難易度4、ニコリ作、朝日新聞be)(2024.07.13)
「AI」カテゴリの記事
- ノーベル物理学賞2024は人工ニューラル・ネットワークの機械学習の基礎、ChatGPT4oに感想を聞くと&秋雨ずぶ濡れラン(2024.10.09)
- 世界初(?)のミスAIはヒジャブ姿のモロッコ美女、日本ではほとんど話題にならず・・(2024.07.12)
- 株式時価総額でまもなく世界1位、AI半導体トップ企業・エヌビディアの優位性・将来性について、ChatGPT-4oと対話(2024.06.08)
- ChatGPT-4oが音声と画像認識を利用して家庭教師、三角関数(三角比)のsinを英語で教えるビデオ動画の解読(2024.05.18)
- 文章の指示(プロンプト)からリアルな動画を作成、オープンAIの生成AI「Sora(空)」をチェック(間違い探し♪)(2024.02.18)
コメント