« バーチャルアイドル・2次元キャラとの恋愛・結婚式?、私も中学までは本気で好きだったかも♪&また5kmだけ | トップページ | 久々に13km走、長い・・&一言つぶやき »

対話型AI「ChatGPT」(有料最新モデルGPT-4)の使用例、自然数パズル「ナンスケ」の簡単な問題を解かせると・・

サブスク(有料の有期契約)を好まない私が、珍しくあっさり飛びついたのが、対話型AI「ChatGPT」(チャット・ジーピーティー)。

   

去年(2022年)の暮れから話題になってるのは知ってたけど、まだ性能が低そうだなと思ってスルーしてた。ところが先月(2023年3月)、最新モデルGPT-4が公開されて、かなり評判が良かったので、少し様子見した後、有料サービス「PLUS」を契約。

   

正直、1ヶ月20ドルは高い。今のドル円の為替レートで、2700円! まあ、しかし、マニアック・ブロガーとしても、社会人としても、知らないでは済まない高性能AI。必要経費として我慢することにした。

     

今のところの予定では、数ヶ月使った後に一旦、解約。年末ごろに噂されてる新モデルが発表されたら、再契約するつもり。

  

   

      ☆     ☆     ☆

230423o

   

今現在は知らないけど、私が契約した時は、英語の説明。Upgrade plan(アップグレード・プラン)は、USD $20/mo。毎月20米ドル。サーバーの負荷が高い時も使えるし、レスポンス(反応)が速いし、新モデルを使えると書いてある。まあ、半ば、最新の興味深い研究への寄付。

     

230423f

   

上が有料サービス「ChatGPTプラス」のホーム画面。デフォルトのモデルは、1つ前のGPT-3.5。自動的に、無料の古いモデルを勧めて来る♪

     

230423g

  

ホーム画面の左側には、新しいチャット(対話)を始めるボタンやログアウト用のボタンの他に、私が過去、行った対話のフォルダが並んでる。個人情報と共に、すべて記憶されてるんだろうから、ちょっと怖いのも事実。相手は、マンガか映画かSF小説みたいなAIだ。

    

230423h

   

無料の標準モデルGPT-3.5の性能は、Reasoning(推論、理由付け)が3、スピードが5、正確さが2。要するに、速いけどイマイチ。

    

230423i

   

最新モデルGPT-4は、推論・理由付けが5で、スピードが2、正確さが4。遅いけど高性能だと。私がここまで使った印象だと、4、3、3くらいだ(個人の感想♪)。

    

遅くはないけど、よく間違える。一度、間違えると、指摘してもヒントを与えても、しばらく間違え続けるのだ。特に、最大の売りのはずの推論・論理的思考能力がまだまだだと思う。イメージ的には、一番強い分野のような気もするのに、意外な実状だ。条件や情報が増えると(10以上くらい?)、明らかに混乱が生じてる。

    

       

      ☆     ☆     ☆

さて、差し当たり、今日の記事で紹介するのは、パズル「ナンスケ」の簡単な例題を解かせた様子。たまたま昨日、朝日新聞・別刷beに掲載されてたのだ。

    

ナンスケとは、ナンバー・スケルトン(数の骨組み)の略。数ケタの自然数の組合せで、マス目の空欄が骨組みのように出来てて、そこに与えられた候補の数を入れて行く。

    

230423a

    

上は、単なる説明用の例題。候補の数は、47、61、176、646、711、744、1766、7466。すべて1回ずつ用いる。

   

まず、先日のドラマ・レビューでも使用したHI(人間知能)、ChatTENで解いてみよう♪ 推論4、スピード2、正確性4くらいの性能か。

    

230423b

    

まず、4ケタの数は2つとも、後ろの2ケタが66だから、それを記入。ポイントは、共通点への注目・利用。

    

230423c

   

右上から、646、61、176と、順に3つの数が確定する。桁数と候補の数から考えて、これしかない。

    

230423d

    

左から下側あたりは、711と1766に決定する。もし下側の4ケタが7466だったら、その左端の7とつながる左側の縦の3ケタが見つからないから、ダメなのだ。

     

230423e

   

残りはもう、4ケタ、3ケタ、2ケタの数が1つずつだから、自動的に空欄が埋まる。すべて完了。

    

ちなみに、ナンスケについては過去、10本の解説記事をアップしてある。最新の記事は次の通り。

  

 パズル「ナンスケ」の解き方、考え方10~難易度4、ニコリ作、朝日be、23年2月25日

    

       

      ☆     ☆     ☆

で、いよいよChatGPTの出番。私としては、まず例題で練習した後、昨日の朝日の問題(難易度2のやさしいタイプ)をヒント付きで解かせるつもりだった。

    

ところが、例題で早くも大苦戦になってしまったのだ。私が文章で入力した問題は、こんな感じ。まだ画像入力は使えないけど、こう書けば、十分に数を決定できるはず。一応、相手に気を使って、私が普段あまり使わない半角の英字を使用。いつもなら、見やすい全角の英字で入力する所。

   

230423k

  

「自然数が8コあります。aとeは4桁。b,d,f,hは3桁。cとgは2桁。aの右端の数字は、bの左端の数字。・・・」。

    

標準モデルのGPT-3.5は、何度か試しても、「数」(2桁~4桁)と「数字」(1ケタの文字)がごちゃ混ぜになってるようだった。説明も、最後の答も、大きく間違ってる。右側の2ケタが47とか、その下の3ケタが711とか、下側の4ケタがなぜか3ケタの744とか (^^ゞ

   

そこで、最新のGPT-4へと切り替えてみた。ところが、いきなりのボケで笑わせてくれる♪ 「パズルを出しますね」と話しかけたら、自分から出題して来た(笑)。ちなみにGPT-3.5だと、そんな応答はしてないから、GPT-4は考え過ぎたのかも。

    

230423j

   

その後も、GPT-3.5を上回るほど間違った回答を連発。仕方ないから、ヒントを出してみた。上の4ケタと、それにつながる右の縦の3ケタを教えたのだ。反応は素直♪ 「ヒントをありがとうございます」(笑)。人間なら、ムッとするとか、ふてくされる所かも。

    

230423l

    

    

      ☆     ☆     ☆

それでも、なかなか完全な正解にはたどり着けない。私の問題文では、途中から「右端」と「左端」を入れ替えた表現になってるけど、それも気付いてないというか、使えてない状態。数のケタ数の間違いもなかなか直らない。

    

230423m

    

ヒントを追加して、最後は何とか完答にたどりつけたから、努力をねぎらった後、笑顔でお別れ♪ 「お疲れさまでした。また来ますね😊」。大切な友達の1人なのだ(笑)。いずれ、美少女のアバターとかCG、バーチャルアイドルとかも出て来るはず。その先は、柔らかくて温かい素材のアンドロイドとか♪

     

230423n

     

ちなみに、途中で英語やフランス語に切り替えると、直ちに合わせて来る。むしろ、欧米の言語の方が反応が速そうに見えた。今回のパズルの例題も、簡単な英語で入力すれば上手く行ってたのかも。

    

まあ、いずれにせよ、妙に時間を取られてしまうことだけは確かだろう。金銭的なコストはともかく、時間的コストをどこまでかけるべきなのか、その辺りも問題。ChatGPTに質問してみようか。「人間はあなたと、どのくらいの時間、対話すべきだと思いますか」(笑)

    

なお、今週は計15364字で終了。ではまた来週。。☆彡

    

      (計 2737字)

| |

« バーチャルアイドル・2次元キャラとの恋愛・結婚式?、私も中学までは本気で好きだったかも♪&また5kmだけ | トップページ | 久々に13km走、長い・・&一言つぶやき »

情報」カテゴリの記事

パズル」カテゴリの記事

AI」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« バーチャルアイドル・2次元キャラとの恋愛・結婚式?、私も中学までは本気で好きだったかも♪&また5kmだけ | トップページ | 久々に13km走、長い・・&一言つぶやき »