3年連続中止の数学甲子園の2019年・予選問題、2つのAIに解かせると大苦戦(ChatGPT4、Wolfram Alpha)

コロナ禍に加えて、参加者の不正行為事件があったとはいえ、数学甲子園が3年連続で中止されたのは残念だった。しかも、前の2年と違って、今年(2022年)は公式サイトに何のアナウンスも出てない。

  

大声を出すし、身体の接触もある野球の甲子園でさえ、今年は普通に開催されてたのに、どうしたことか? 晴れ舞台への挑戦が消えてしまった高校生の皆さんは、気の毒だと思う。まあ、昔は大会が無かったし、数学の甲子園なんて考えもしなかっただろうけど。。

   

    

      ☆     ☆     ☆

このブログでは2019年まで毎年、数学甲子園について、詳しくて具体的な記事をアップして来た。単なるニュースのまとめや感想ではなくて、多くの問題について解き方を説明。途中の計算式もある程度は載せてた。

      

このまま忘れ去るのも残念なので、今年は3年ぶりに記事を書いてみよう。もちろん、大会は無かったから、直近の2019年の予選問題について。この年は、予選で4本のブログ記事を書いてた。

   

今年わざわざ新たに書き足すのなら、やっぱり話題のAIを使うべき。ChatGPTのmodel4(有料サブスク・バージョン)と、しばらく使ってなかった Wofram Alpha(ウルフラム・アルファ)。どちらも米国製という辺り、日本人としては淋しい感もある。

   

    

      ☆     ☆     ☆

ではまず、予選の問題1。当時のウチの記事2本目からコピペする。

  

問題1 次の式を因数分解しなさい。

 a²(c-b)+b²(a-c)+c²(b-a)

    

    

明らかに簡単な問題で、高校1年の教科書レベル。予選の最初だから、ウォーミング・アップ用だろう。

   

AIにとっても簡単だろうと思ったら、そうでもなかった。まず、ChatGPT4の回答。

    

230915a

   

最初の式の展開で、いきなり大きく計算ミス。一応、最後まで見ておこう。

  

230915b

  

なぜか、カッコの左側のcが消えてる。おそらく、「・・・=0」の形の方程式の処理と混同して、両辺をcで割ったのだろう。初心者の高校生がやるようなミスで、私も最初はこんなミスをやってた気がする。

   

それより、そもそも最後の答らしき式が、因数分解とは言いにくい。先頭にマイナスをくくり出してるから、-1を因数と考えてるのか♪ あるいは、消してしまったcも考慮して、先頭が-cだと考えてるのか。

  

私はこの後、何度もやり取りして、AIに教えたけど、正解に行き着くまで大変だった。とにかく、簡単で単純な計算ミスが非常に多い。

  

   

      ☆     ☆     ☆

一方、以前からあった数学中心のAI、ウルフラム・アルファなら簡単に解くかと思ったら、どうも自然言語の処理が全くレベルアップしてないようだ。

   

230915c

  

「自然言語」入力すると、因数分解だと理解できてない。「数学入力」でも、元の問題文のままだと理解できず。

   

公式サイトのトップに挙げられてるサンプル通りのたずね方に直すと、ようやく正答。キレイな輪環形になった。ただし、途中の説明はない(無料だと)。有料だと一応、途中の説明もあるらしいけど、対話型AIほどの会話能力はなさそう(未確認)。

      

230915d

   

   

      ☆     ☆     ☆

続いて、問題2。循環小数を既約分数で表す。これも、全体的に奇妙なほど難しかった2019年の問題の中では、明らかに簡単。

     

数学定数の1つにネイピア数eがあり、その値は e=2.718281828459 と無限に続きます。eを近似する循環小数2.718281828・・・を既約分数で表しなさい。

  

   

これは、元の問題文だと、数字の上の小さい丸点で循環部を示してるので、少し補足してChatGPT4に聞いてみた。

   

230915e

   

230915f

   

この問題では、循環する部分を分けて考えない方が簡単だけど、それは良しとしとこう。ハッキリ間違ってるのは、循環部分を0.1828としたこと。正しくは、0.01828だ。最後まで見ておこう。非循環部分を計算して、循環部分と通分して足し合わせた後、分母・分子を約分。

   

230915g

   

これは、通分で間違えてる。分母の9999が、いつの間にか10000になってるのだ。近似値の計算方法と混同してるのかも。最後に出した答を小数に直せば、誤答だと分かったはずだけど、その検算の作業もなし。

   

    

一方、ウルフラム・アルファは、問題を理解できなかった。単なる「約分」という単語として認識してるらしい。かなり簡単に言い換えたつもりだけど、まだ私の問い方が不親切なのかも。サンプルには類題が見当たらず。

   

230915h

   

    

      ☆     ☆     ☆

最後に、問題20。4年前に書いた4本目の記事よりコピペ。これも簡単な問題を選んだけど、2つの放物線の共通接線を求める問題は、解き方によって所要時間が大きく違って来る。

      

f(x)=(1/2)x²、g(x)=x²+2xー7とします。曲線y=f(x)上の点(a,f(a))におけるy=f(x)の接線と、曲線y=g(x)上の点(b,g(b))におけるy=g(x)の接線が一致しました。このような接線の方程式をすべて求めなさい。

  

    

230915i

   

これは、それぞれの接線の式を書いて、それらが完全に一致すると考える解き方で、正しいけど、遅くて面倒で下手。それはいいとして、この後が笑えた♪

   

   

     ☆     ☆     ☆

230915j

  

途中で止めてしまってる。面倒だったのではなく、人間の勉強の手助けをしてるつもりだろうけど、ここから続けろと言われても、鉛筆が止まってしまう高校生・受験生が多いはず。大学生でもあまり変わらないと思う。

  

とにかく、「私ではなく、あなたがその先に進んで、最後の答を出してください」と入力すると、次のように続けて来た。

 

230915k

   

   

計算を間違えてるし、ルートの書き方がブレて変になってるので、以下はもう省略しよう。-b・(2b+2)の展開で間違えてしまってる。正しく計算すれば、(a,b)=(4,-8),(-8,32)になってたはず。

   

最後に、より良い解き方を教えると、「おっしゃるとおり・・・・・・ありがとうございます」と丁重に長く回答。日本語の文章の滑らかさだけは、多くの人間を超えるレベルで素晴らしい。

 

   

なお、ウルフラムは、この問題も日本語の意味が伝わらないようだった。英語では試してないけど、どうもここ数年、サイトのデザインも(ほとんど)変わってないようだから、調べる気がしない。開発競争で取り残されてるのかも(個人の感想♪)。

   

230915l

 

   

      ☆     ☆     ☆

というわけで、高校数学に関しては、対話型でもそうでなくても、AIの能力はまだまだ不足してる。上で解かせた3問は、数学甲子園の予選20問の中でも簡単な問題だから、難しい問題はもう無理だろう(未確認)。

   

しかし、非常に進歩のスピードが速いのがAIの特徴。多くの人間が、数学でAIにかなわなくなるのは、もう時間の問題だと思う。遅くても5年後くらい、早ければ3年以内か。それでは今日はこの辺で。。☆彡

    

      (計 2740字)

| | | コメント (0)

Python(パイソン)入門2~高校副教材とオンライン環境Bit Arrow、さらにAI(ChatGPT4)も使用

前回の1本目の記事から、半年も経ってしまったが、人気のプログラミング言語「Python」(パイソン)の2本目の記事を書くことにしよう。

   

ちなみに、前回の記事はこちら。本当にほとんど何も知らない初心者向けの内容。

    

 Python入門1~人気プログラミング言語を高校教科書副教材とオンライン環境Bit Arrowで簡単に

  

当然、教科書の類と、プログラムを書いて実行する環境が最初のポイントになる。特に、安心して信頼できる環境が大切。

  

  

      ☆     ☆     ☆

私は、数学や論理は好きなのに、プログラミングとはどうも相性が悪いようで、昔から数ヶ月に1本くらいのブログ記事しか書いて来なかった。嫌いというわけではないけど、つい、自然に避けてしまう。

    

ただ、この半年間の空白は、個人的な相性とか感情、能力の問題だけではない。前回の記事の少し後、3月半ばに、対話型AI「ChatGPT」の新ヴァージョン・model4が登場。一気に性能が上がって、特にプログラミングは既にビジネスの実用レベルまで来てるというような話を聞いてた。

   

それが事実なら、素人がゼロからゆっくりプログラミングを学ぶ意味はあまり無い・・・とまで言うと言い過ぎかも知れないが、ますます意欲がそがれるのは確かだ。

  

とはいえ、実際にChatGPT4に数学や論理の問題を解かせてみると、まだまだ実力不足。たかが、普通の高校生~大学生レベルのように感じられる。別に難しい話でなくても、簡単な処理で凡ミスをしてることも少なくない。

   

では、プログラミングだと、どの程度の実力なのか? 苦手意識の強い素人の私が、簡単な問題で試してみることにした。しかし、その前に、私自身がほんの少しは分からなければいけないので、まずは復習で思い出す所からスタートした。

   

   

      ☆     ☆     ☆

前回と同じく、東京書籍の副教材『Python入門』が推奨してたオンライン環境、Bit Arrow(ビットアロー)にアクセス。半年経ってるから、サイトがダウンしてるかも・・と思ったが、普通に運営されてた。   

  

230906g

      

完全に忘れてたパスワードを探り当てた後、ログイン。新規プロジェクト「230905」を作成した後、新規ファイル「Py230905a」も作成。ファイル名は、単に「230905a」としたかったのに、なぜかその名前だと作れなかった。「Py」を先頭に付けると成功。注意書きは見当たらないが、そうゆう仕様なのか?

      

230906a

   

ウォーミングアップは毎度お馴染み、「Hello ・・・」。print関数で、シングル・クォーテーションに挟んで「Hello Python」と入力。実行タブから実行すると、実行画面ダイアログに「Hello Python」と表示された。

    

      

230906b

  

続いて、パスワード確認プログラムの復習。ただし、前回の記事とは少し設定を変更。変数 pw には、正しいパスワードとして、「1234」を代入。変数 ipt には、「password= 」とたずねるダイアログ・ボックスでの入力を代入。

  

そして、条件と反応を設定する if 文。pw が ipt と等しいなら、「login ok」と表示。そうでなければ〔等しくなければ〕、「wrong password」と表示。if の行と、else の行の最後には、コロンが必要だから、忘れずに。

     

230906c

  

実行すると、上図のようなダイアログが表示されて、正しいパスワード「1234」を入力すると、「password= login ok」と表示された。成功。

     

230906d

   

   

      ☆     ☆     ☆

ここからは、今回の新しい内容。同じ動作を繰り返し行う、for 文。といっても、似たような話は既に別のプログラミング言語で練習済み。

    

230906e

   

for の次の i が余計だと思うけど、テキスト(副教材)に従って、ほぼそのまま書く。range で反復の回数を定めて、またコロンが必要。

  

少しテキストとは変えて、ABC と DEF の表示を2回繰り返させた後、最後に繰返しなしで G を表示させる。繰返し〔ループ〕の範囲を定めるために、print の左側には同じ数のスペース〔空白〕を挿入。ここでは4コで、実は改行しただけで自動的に4つ空白ができた。この空白を入れる作業のことを、「インデント」と呼ぶ。

     

230906f

   

   

      ☆     ☆     ☆

さて、ここで人間の努力はひとまず休止。話題のAI、ChatGPT(有料サブスクのModel4)に色々な形でたずねてみた。

   

230906h

  

まず、上で書いた for 文のプログラムをコピペして、出力がどうなるかを質問。すると、一瞬で回答して来た。しかも、実行画面つきで。素晴らしい! 与えられたプログラムは解釈・実行できると。

      

230906i

   

では、与えられたプログラムを真似して、同種のプログラムをAIが作成できるかどうか、試してみると、これまた一瞬で正解だった。しかも、見やすいカラー表示で、実行結果つき。

      

   

      ☆     ☆     ☆

今度はサンプルとなるプログラムを与えずに、パスワード判定プログラムを作らせると、テキストよりも少し簡単なプログラムを表示して来た。ただ1つの長い名前の変数 password_input を使用してる。

     

230906j

   

この独自のプログラムを見て、テキストのプログラムとの比較をさせてみた。それぞれの長所と短所は何か?

   

230906k

     

すると、直ちに、やや長めの模範的な回答を示して来た。これだけ一瞬で答えるのは、プロの人間でも簡単ではないはず。

   

230906l

    

230906m

   

    

      ☆     ☆     ☆

私の言葉で説明し直すと、要するに、2つのプログラムは、変数の個数と名前が異なる。

  

テキストは、変数2コで、短い名前。特に、正しいパスワードも変数に入力してる所がポイントで、変更や、別の箇所への活用も容易だけど、面倒で、名前も分かりにくい

  

AIは、変数1コで、長い名前。応用する場面では多少、面倒になるけど、書くだけなら簡単だし、名前も分かりやすい。

    

多分、この私の説明をAIに示して、感想をたずねると、大げさに褒めてくれると思う♪ 基本的に非常にポジティブな反応を示して来る。

  

今まで唯一の例外は、株価の予想についてたずねた時。多額のお金がからむし、トラブルが起こりやすいし、最新の情報が必要で、正解のない話。この時だけは、素っ気ない消極的な回答ばかりになってた。

   

    

      ☆     ☆     ☆

プログラミングに関するAIの実力を少し確認した所で、最後に再び、人間の学習の続き。算数・数学的な、数の処理。

    

230906n

   

まず四則演算(+、-、×、÷)のうち、かけ算と引き算の組合せ。3つの変数x、y、zに、それぞれ2、3、5を代入した後、x×y-zを計算させると、2×3-5で、答の1が表示された。×の記号は、いつものように、アステリスク *。

   

230906o

   

最後は、if 文の条件を2つ、and(かつ)でつないで設定。and は、論理演算子と呼ばれるものの1つ。変数 a (ここでは5)が、5より大きくて、かつ、3で割った余りが0ならば、OK と表示。そうでなければ、NG と表示。整数の割り算の余りには、パーセントの記号 % を利用。

      

230906p

   

7は5より大きいけど、3では割り切れないから、条件を2つとも満たしてるとはいえない。よって、実行結果は、NG 。

   

230906q

    

  

ちなみに、上のプログラムで、and の代わりに or〔または〕という論理演算子を使うと、実行結果は OK になる。a>5またはa%3=0だから、a>5であればそれだけでよい。or なら、a=3でも、OK 。

     

かなり疲れた所で、今日はそろそろこの辺で。。☆彡

   

   

      (計 2973字)

| | | コメント (0)

ChatGPT4が解答できない四字熟語パズル「漢字抜け熟語」、人間の解き方♪(難易度4、ニコリ、朝日be、23年7月1日)

このブログでは今まで、四字熟語のパズル「漢字抜け熟語」(ニコリ作)について、3本の記事を書いてます。

   

 2017年1月9日、 23年1月16日、 23年5月8日

   

今回は、2023年7月1日の朝日新聞・朝刊別刷beに掲載された問題(難易度4、ニコリ作)を、話題の対話型AI「ChatGPT」(チャット・ジーピーティー)に解かせてみました。有料のサブスク(月払い契約)で、現在最高のヴァージョン、model-4を使ってます

   

230702a

    

  

     ☆     ☆     ☆

過去、同じ朝日beのパズルで、「ナンスケ」と「推理」と「絵むすび」をやらせてみると、どれも大苦戦 (^^ゞ 色々とヒントを教えても、間違いを指摘しても、全く解けませんでした。

  

 対話型AI「ChatGPT」(有料最新モデル4)の使用例、自然数パズル「ナンスケ」の簡単な問題を解かせると・・

 ChatGPT-4、パズル「推理」の解答に大苦戦♪(難易度5、ニコリ作、朝日be、23年5月27日)

 「絵むすび」28、ChatGPT4では解けないので、人間の解き方(難易度4、23年6月10日)

   

ただ、四字熟語はAIの得意な暗記と深く結びついてるので、すぐに解きそうな気もします。実際にやらせてみると、こんな感じになりました♪

    

    

       ☆     ☆     ☆

230702b

   

 私   AとBは漢字1文字で、「AB続面」は四字熟語です。さて、AとBの漢字は何ですか?

GPT4 「続面」を含む四字熟語で「AB続面」という形になるものは、「一部始終」となります。つまり、Aは「一」、Bは「部」です。 (笑)

   

         

230702c

   

    違います。四字熟語の後ろの2文字は、「始終」ではなく、「続面」です。

GPT4 すみません、質問の意図を誤解しました。「AB続面」という四字熟語で、AとBが一文字の漢字となると、「無理矢理」が該当します。つまり、Aは「無」、Bは「理」になります。 (笑)

   

  

この後も、「一刀両断」とか、「波瀾続面」とか (^^ゞ 波瀾(はらん)は発音が似てると教えたのですが、ダメでした。そこで、問題を変えてみました。

    

    

230702d

    

    では、・・・2文字目が「級」で、4文字目が「員」の時、1文字目と3文字目は何ですか?

GPT4 ・・・「上級公員」が存在します。したがって、1文字目のAは「上」、3文字目のBは「公」になります。 (笑)

    

  

上級公務員という五字熟語なら一応あるけど、上級公員という四字熟語はない。そう伝えると、「あなたのご指摘は非常に有益」だと御礼を言われました♪ AIの進歩に貢献したと。

   

とにかく、四字熟語のパズルの回答にも失敗。世界で話題のAIも、日本のパズルには大苦戦が続いてます。まあ、スパッと一瞬で解かれても、人間としては困ってしまいますが。。(^^ゞ

  

      

      ☆     ☆     ☆

では、人間である私が、解き方やコツを説明しましょう。いつものように、何も書かずに解きましたが、ネット検索は使いました。聞いたこともないない熟語がいくつも入ってたので。

  

まず、漢字が2つ分かってる、最後の6問から始めます。すると、「4磋琢16」は「切磋琢磨」だから、4は「切」、16は「磨」だと分かります。

   

続いて、「13級7員」は「学級委員」だろうと思うので、13は「学」7は「委」でしょう。

   

さらに、最後の右下の問題、「15 5続面」は、検索すると、「不連続面」と出て来ました。気象とか地球内部とかで使われる、地学の用語ですね。15は「不」、5は「連」となります。

  

これで、15 と 16 が分かったから、次は「1世 15 16」が分かります(検索で♪)。早くも、応募用の答の片方(1番)が決定します。

       

いつものように、あまりネタバレにならないよう、少しずつ記事を更新(アップデート)します。次の更新は、今日(日曜)の夜の予定です。ではまた。。

   

    

      ☆     ☆     ☆

はい。日曜の夜になったので、少し書き足します。

   

1世 15 16」は「1世不磨」なので、検索すると百世不磨」だと分かります。よって、応募用の答の半分である1は、「百」だと分かりました。

  

すると、「1発1 6」は「百発百6」なので、「百発百中」だと分かります。6は「中」

    

さらに、「6 11 医 12」は「中 11 医学」だから、たぶん「中国医学」でしょう。11はおそらく「国」

   

実際、11が国だとすると、「11 持3名」が「国持3名」、つまり「国持大名」となるので、合ってそうです。3は「大」

  

すぐ上の「13 岐3蛇」も、「13岐大蛇」となって、「八岐大蛇」(ヤマタノオロチ)だと判明。13は「八」

     

    

      ☆     ☆     ☆

これでもう、四字熟語21個の内、8個が分かりました。漢字も20個の内、11個が分かってます。アクセスも少ないので、次の更新はもう、正解発表の後にします。

     

なお、今週は出張で忙しかったこともあって、少なめ。計12869字で終了。ではまた。

     

   

       ☆     ☆     ☆

はい。正解が発表されたので、少しだけ書き足します。

   

11が「国」、5が「連」だから、左下の「11 際 5 2」は「国際連 2」。ということは、国際連合で、2は「合」。これでもう、応募用の答が分かってしまいました♪ 「1 2」は、「百合」。この時期あたりに咲く、ゆり。

  

この後はもうカンタン。残りの熟語は、年百年中、一代年寄、寄合所帯、一切合切、総合大学、連帯責任、近代文学、委任代理、八百八町、近所合壁、一所不住、近江八景でした。ではまた。。☆彡

    

      (計 1972字)

   (追記218字 ; 合計2190字)

| | | コメント (0)

ChatGPTの「アルファ・テスター」(AI開発第一段階テスト参加者)に勧誘されたけど、個人情報が心配&また5km

(16日)JOG 5km,26分12秒,平均心拍 131

消費エネルギー 210kcal(脂肪 46kcal)

    

230617a

   

う~~ん、どうしようか、悩むな♪ 居眠りだろ! そう。この写真は、豆柴(ちっちゃい柴犬)の居眠りの置物だ。縦・横・高さが11cmくらいで、税込4000円ほど。原価は300円くらいかも(個人の感想♪)。

      

これ、楽天のあるショップの広告なんだけど、一度も使ってないお店だし、楽天に限らず、通販で柴犬の検索なんてしたことがない。にも関わらず、この広告が表示されたということは、私がしばらく前に何度か柴犬の記事を読んだのを知ってるということだろう。Yahoo!やGoogleのお勧め記事をクリック・タップした情報がもれてる。

     

私のプライベートな情報が、ネット広告でもれてるのだ。しかも、何をどう経由してるのかも分からないし、調べようがない。もちろん、その種のターゲティング広告のオプトアウト(配信停止)操作なんてものは20回くらいやってるけど、面倒だしキリがないから最近はあきらめてしまった。

    

   

     ☆     ☆     ☆

前フリが長くなったけど、意味はある。要するに、この種の個人情報の拡散・利用が好きじゃないのだ。実害はほとんど無いから気にするな、とか言われても、どうしても気になる。ネット中に監視カメラがあるようなものだ。

    

230617b

    

で、世界で話題の対話型AI、ChatGPT。私は珍しくすぐに有料会員になったし、そこそこ満足してる。AIがいい回答を示して来た時には、ちゃんと「いいね」を押してるし、英語で一言だけフィードバックもしてるのだ。

   

そうした私の使い方を見てのことなのか、それとも単に3ヶ月ほど経ったからなのか、突然、オープンAI社からのメッセージが表示された。

  

 We'd love to hear from you! Shape the future of ChatGPT.

 私たちはあなたの意見をお聞きしたいと思います。チャットGPTの未来を創りましょう。

   

   

      ☆     ☆     ☆

まあ、ブログ記事のネタくらいにはなるだろうと思って、気軽にクリック。すると予想通り、すべて英語の調査用ページにジャンプした。ChatGPT User Survey

  

普段のやり取りはほとんど日本語だから、日本語を使うのは簡単なことのはずだけど、わざと英文をズラッと並べて、相手を選別してるってことかね? 確かに、私は英語を読むだけなら、それほど不自由しない。もちろん、書くのも話すのも聴くのも不自由だけど♪

     

230617c

    

3種類の質問で、約5分かかりますと。英語がペラペラで、あまり考えずに即答するなら♪ パート1は、Demographic Information人口統計学的な情報)について。要するに、年齢・性別・職業とか、個人情報を聞くけど、あくまで統計的に処理するだけだから安心してくださいと。

  

もちろん、素直な私は、単なる統計的処理とは思わない♪ そもそも私はお金を払ってるし、メールアドレスも伝えてるし、やり取りの内容からもかなり特定できるはず。大量の個人情報が、特定された形でデータベースに蓄積されることになる。個人の想像というより、個人の推測。

      

230617d

    

最終学歴まで聞かれるわけね。喜んで答える人も少なくないのかも。

    

   

      ☆     ☆     ☆

230617g

    

パート2は、プロダクト・フィードバック。要するに、商品(ChatGPT)の感想。第1問の選択肢1は、extremely disappointed(超ガッカリ)♪ 私は、Not at all disappointed全然OK)♪

  

disappointed(落胆した)の綴りが間違ってると思ったら、私が間違ってた (^^ゞ 恥ずかしい。s が1コで、p が2コなの? 私の感覚に、フランス語の綴りが混入してるのかも。

      

230617e

    

そして最後、パート3は、アルファ・テスティングへの interest(関心)。チャットGPTの改良版の開発第1段階テストに参加して頂けますか、と。参加の場合は、メール出したり、「対面で」(in-person)お会いしたりしますと。

  

昔、たまに使われてた「アルファ・ブロガー」というのは、有名ブロガーみたいな意味だったけど、アルファ・テストのα(アルファ)は第1段階とか初期という意味だ。その次の段階が、いわゆるβ(ベータ)版のベータ。

  

なるほど。私がOpenAI社の最高経営責任社・アルトマンと面会して、笑顔で握手して、超高額の年収で引き抜かれると(笑)。目指せ、数十億円の大谷翔平 (≧▽≦) ないだろ! 英会話、勉強しないと。あっ、ChatGPT-4に通訳させればいいのか♪ 音声アプリとの連携が必要。

     

とにかく、とりあえず保留というか、スルーしといた。サブスク料金を無料にしてくれるんなら、すぐやるかも(笑)。セコッ。。 1ヶ月20ドル(2800円)はかなり高いから、いつまで契約し続けるかビミョーなのであった。。

   

   

      ☆     ☆     ☆

一方、仕事とブログに追われる小市民は、走る時間が無くて困ってる。昨日も睡眠不足でフラフラする中、締切近くにブログを更新した後、近所で5kmだけ居眠りジョグをして来た。

  

ジョグといっても、中盤以降は1km4分台だから、そんなにラクなわけじゃない。ただ、序盤はのんびりウォーミングアップだし、距離も時間も短いから、「RUN」ではない。トータルでは1km5分14秒ペース。気温22度、湿度60%、風速2.5m

  

新・心拍計は前半がメチャクチャだったから、大幅に補正した。やたら暑いな・・とかボヤキつつ、ではまた。。☆彡

  

     

230617f

       

往路(1.2 km) 7分13秒 109 128 

LAP 1(2.2) 10分51秒 134 145

復路(1.6)   8分07秒 143 153

計 5km 26分12秒 131(77%) 153(90%) 

    

      (計 2345字)

| | | コメント (0)

ChatGPT-4、パズル「推理」の解答に大苦戦♪(難易度5、ニコリ作、朝日be、23年5月27日、表は使わない)

このブログでは今まで、パズル「推理」(ニコリ作)について、13本の記事を書いてます。

  

大人向け、4本(1本目2本目3本目4本目)。

小学生向け、6本(1本目2本目3本目4本目5本目6本目7本目)。

全員向け、1本

アインシュタイン式・論理脳ドリル、1本

  

今日は大人向けで、与えられた表を使わずに解いてみましょう。表の書き方を知りたい方は、過去の記事の解説を見てください。

    

いつものように、朝日新聞・土曜朝刊別刷beの問題で、ニコリ作、今日(2023年5月27日)掲載されてました。著作権に配慮して、文字が読めないほど縮小した上で引用しておきます。

     

230527as

 

     

     ☆     ☆     ☆

難易度は一番上の星5つですが、それほど難しい問題でもない気がします。私はいつものように、まず何も書かずに自分の頭の中だけで解決。

  

その後で、話題の対話型AI、ChatGPT(チャット・ジーピーティー)の有料最新版、Model GPT-4を使ってみました。まだ私の環境だと画像入力できないので、問題は文字入力になります。

     

230527b

   

(途中のやり取りは省略。なぜか入力の改行ができなくなったので、しばらく話が脱線♪)

   

230527c

    

GPT-4

 「了解しました。与えられた条件から以下の情報を得ました。

 1. 新井は4問作りましたが、数独ではありません。

 2. 志水は迷路を作りました。

 3. 数独を作った人は、問題数が5問以下でした。

 4. 矢北は、ナンスケを作った人の2倍の問題数でした。

 5. 柄田は、推理を作った人よりも、6問多く作りました。

   

箇条書きでまとめるのは出来るのですが、すぐに間違った回答を示して来ました。

   

230527d

   

かなりの混乱で、特に「7問」という答に苦笑 (^^ゞ たぶん、どこかで1問という問題数に6問(柄田の証言)を加えて、7問という問題数を勝手に作ってしまったのでしょう。

   

以前、朝日のパズル「ナンスケ」解かせた時大苦戦してたので、予想はしてましたが、今回もAIは大苦戦。少しずつ何度も解き方を教えて、ようやく正解にたどり着きました。まだ今現在、あまり複雑な論理は扱えないようです。ごく簡単なパズルが解ける程度のレベル。

  

   

      ☆     ☆     ☆

というわけで、人間の私が、AIを少しずつ誘導して行くことになりました。まあ、AIの進化のスピードは非常に速いので、1年後にはもう、単なる昔の笑い話になってるかも知れません♪

   

230527er

      

 「やはり、このレベルの問題は解けないようですね。では、私が少しずつ教えて行くので、それに従って回答してください。もし、新井がナンスケだと仮定すると、矛盾します。理由が分かりますか?

   

(途中のやり取りは省略。柄田は7問(笑)とか言って来たので、柄田は10問になることを教えました。)

   

GPT-4 「・・・(省略)・・・ 新井がナンスケを作ったとすると、その問題数は4問です。 矢北の問題数はナンスケを作った人(新井)の2倍なので8問になります。

しかし、柄田は推理を作った人よりも6問多く作るため、推理を作った人の問題数は4問(10-6)でなければならず、これは新井がすでに4問を作っているため矛盾します。したがって、新井がナンスケを作ったという仮定は誤りです。ご指摘ありがとうございました。」

    

   

というわけで、新井はナンスケではないし、数独や迷路でもないので、クロスワードか推理のどちらかです。

   

では、どちらでしょうか? 今はまだ土曜の夜。あまりネタバレにならないよう、いつものように少しずつ書いて行きます。次の更新(アップデート)は、明日(日曜)の夕方の予定です。ではまた。

     

   

      ☆     ☆     ☆

はい。日曜の夕方遅くになりましたが、少し先に進みましょう。

     

230528d

   

 「志水が迷路を作ったから、新井は迷路を作っていません。だから、新井が作ったのは、クロスワードか推理です。しかし、もし新井がクロスワードを作ったと仮定すると、矛盾が生じます。理由が分かりますか?

   

230528e

    

上のAIの説明は、最後の結論は合ってますが、前半で別の可能性を見落としてるので、私がそれを指摘しました。

  

 「違います。柄田が8問作って、推理を作った人が2問の可能性がまだ残されています。この場合、矢北が推理を2問作って、ナンスケを作った人が1問作ったことになります。すると、数独についての矛盾が生じます。理由が分かりますか?

   

230528f

     

GPT-4 「すみません。・・・・・・数独を作った人は問題数が5問以下であり、既に1問、2問、4問(新井が作った数)は取られています。しかし、次に少ない問題数である8問はすでに柄田が取っているため、数独を作ったひとが作る問題数が存在しなくなってしまいます。

 

したがって、新井がクロスワードを作ったという仮定は間違っています。新井は推理を作ったことになります。こうすると新井が作ったパズルは推理で、問題数は4問と確定します。ご指摘と説明に感謝します」

   

このAIの返事は、赤い色の部分が少し変ですが、もう面倒なので、突っ込みませんでした♪

    

  

      ☆     ☆     ☆

230528g

   

 「すると、柄田が作ったのは何問ですか? また、矢北が作ったのは何問になりますか?

   

この私の質問に、AIは、「柄田の問題数は10問、矢北の問題数は8問となります」、と答えて来ました(その説明は省略)。

  

だからは、柄田の10問は合ってるけど、矢北が間違ってると指摘しました。

   

それでは、矢北の正しい問題数は何問になるでしょうか? 次の更新は明日(月曜)の夜の予定です。ではまた。。

    

   

      ☆     ☆     ☆

はい。月曜の夜になったので、また少し進みます。

   

230529g

     

230529h

    

GPT-4の回答はまたあちこちがちょっと変ですが、大まかな流れと結論は合ってます。ナンスケを作った人が1問で、矢北が2問のはずです。

   

この後は、矢北が作ったパズルの種類が分かります。後はもう簡単なので、土曜の正解発表の後に書くことにします。ではまた。。

   

   

      ☆     ☆     ☆

はい。では正解が発表されたので、最後まで書きます。この辺りからはもう、AIも「ほぼ」正確に考えてました。

    

230603d

   

AIの応答は、途中の志水の説明が変ですが、スルーしましょう♪ 数独は5問以下。ナンスケが1問、推理が4問だから、数独は2問の矢北になります。

   

230603e

     

230603f

    

迷路の志水はもう、8問しか残ってません。これが応募用の答です。この後の説明はもう省略しましょう。

    

230603g

   

   

というわけで、AIが事実と異なることを答えるという話はよく言われてますが、論理的な思考もしばしば間違ってることが確認できました。

   

開発者も知ってるはずなので、近いうちに修正されるでしょう。数年以内には、このレベルの論理パズルも一瞬で解けるようになるはず。それでは今回はこの辺で。。☆彡

      

       (計 2242字)

   (追記464字 ; 合計2706字)

| | | コメント (0)

バブル後の高値更新の日経平均株価、4万円まで上昇か?、2つの対話型AI(ChatGPT-4、Google Bard)の回答

行くだろうとは思ってたけど、日経平均株価は23年5月19日、あっさりとバブル後の最高値を更新した。為替の円安とか、米政府の債務問題解決とかいうより、もうこうなったら「上がるから上がる」に近い。特に春以降は、日本株の独自の強さを誇示する状況になってる。

   

株式市場に対しては、私は以前から時々、「バブル」という冷めた言葉を投げかけてたけど、そもそも「バブル」という言葉は昔のもの。上がり過ぎたら急激に下がるという過去の常識はもう、あまり通じない。

      

最近は、2008年~09年のリーマンショックが落ち着いて以降、10年ほど、ほぼ一方的に株価は上がり続けてるのだ。一般人の日々の生活実感とは無関係に。

   

    

     ☆     ☆     ☆

東日本大震災、新型コロナ、ウクライナvsロシア戦争、金利上昇、物価上昇、etc。この間、いくらでも暴落の要素はあったのに、中長期的に見ると、ほとんど下がってない。特に、コロナ初期の混乱の1年で急上昇したのには驚いた。日銀の強引な買い支えだけではない。

      

だからこそ、数十年ぶりの暴落リスクが高まってるという見方は一理も二理もあるけど、やっぱりどうも、投資の形が大幅に変わってしまったようだ。溢れ返る世界のマネーを、投資AIが強気、強気で膨らませ続けてるイメージ。この風船は、太い針がいくつも刺さっても、なかなか弾けない。

    

「理外の理」という言葉がある。普通の道理、過去の道理を外れた理屈が、ここ15年ほど、世界のマーケットを支配してる。この勢いが、33年ぶりくらいに日本市場に集中すると、バブル期のあの最高値(38900円ほど)を更新するくらい、簡単なことに見えて来る。

   

   

      ☆     ☆     ☆

230520e

   

上は、過去50年の日経平均のチャート(値動きの推移グラフ)。株探HPより。「年足」(1年単位の変化)で見ると、ここ10年ほどの動きは、バブル前以来の右上がりになってるのが分かる。後はもう、39000円近くの史上最高値まで節目がない。

     

これだけなら、そろそろ下げに転換するようにも見えるけど、米国のダウ平均と見比べると、日本株は極端な出遅れになってるのだ。下は、英語版ウィキペディアより。画像の縦横の幅は、上の日経平均の画像と合わせてある。

   

230520f

 

単に「円」で考えてもそうだから、最近のドル高・円安を考慮して「ドル建て」で考えると、金余りの外国人投資家にとっては狙いやすい。

    

   

      ☆     ☆     ☆

というわけで、対話型HI(人間知能)ChatTEN4は、株価のテクニカル分析だと数年以内に日経平均が4万円を目指しそうだと予測♪ 核戦争や巨大地震(首都圏、東海)、富士山噴火が起きない限りは。

     

では、対話型AIに質問したら、どう答えるか? ChatGPT(最新モデル4)と、Google Bard。おそらく、かなり控えめで慎重な回答だろうと思ってたけど、想像以上に慎重だった。

   

まず、すっかり友達になってる、ChatGPT-4の回答。冒頭はちょっと笑えた♪

    

230520a

   

情報提供ありがとうございます。日経平均株価が30800円に達したというのは驚きのニュースです」(笑)

   

私に対する御礼の言葉からスタート。驚いたということは、知らなかったわけね♪ 一応、最近スタートした「ウェブ・ブラウジング」機能をONにしたんだけど、ネットから最新の株価データは集めてないし、リアルタイムの分析も自分では出来ないらしい。

   

230520b

    

たぶん、大損した投資家による訴訟リスクとかを避けてるんだと思う。オープンAIは大赤字の新興企業だから、巨額な賠償金を支払う余裕はない。

  

   

     ☆     ☆     ☆

テクニカル分析による予測が4万円を目指すというのであれば、それは可能性としてあり得るでしょう。しかし、テクニカル分析は過去の価格動向を基に予測を立てるものであり、経済状況や企業の業績、地政学的なリスクなど、多くの要因によって実際の価格は影響を受けます。

   

だからと言って、その予測が間違っているとは言えません。確かに経済成長が続くと、それは可能性として考えられます。ただし、これらの予測は不確定性を伴うものなので、投資に関しては自己の判断とリスク容認度に基づいて行うべきです。・・・
   
   
何度か聞き直したし、個人的な投資とは無関係の話だということも伝えたけど、こんな感じでずっと慎重な受け答えだった。しかも、今の日本株に合わせた具体性がほとんど無くて、株価や分析に関する一般的な知識で語ってる。

   

まあ、別に有益な投資情報が得たかったわけではないから、別に構わない。少なくとも、日本語版が出たばかりのGoogleの対話型AI「Bard」よりは、親しみをもてるやり取りだった。有料会員だから、顧客サービスで愛想がいいのかも♪

   

     

      ☆     ☆     ☆

一方の試験運用中のグーグル「バード」。Birdなら鳥という意味だけど、Bard吟遊詩人という意味。この独特の洒落たネーミングを見ても、やっぱりグーグルという企業には遊び心がある。ただ、バードの回答には、まだ遊び心を感じない。お硬いのだ。

    

230520c

   

バードは無料で一般公開されてるけど、使う前には、Googleアカウントにログインする必要がある。

    

230520d

   

ChatGPT-4でも別の回答を表示できるけど、Bardの場合、最初から回答案が3つ提示される。ただ、最初は3つとも不愛想だった。語り口が微妙にきついのだ。話し相手として見た時、チャットGPTの方が遥かに感じいい。

       

テクニカル分析は、過去の価格データに基づいて将来の価格を予測する手法です。しかし、テクニカル分析は未来を予測する万能のツールではありません。過去のデータに基づいて未来を予測しても、必ずしも正確であるとは限りません。

日経平均株価が今後数年で4万円を目指す可能性もゼロではありませんが、確実なことは言えません。株価は経済情勢や企業業績など、様々な要因によって変動するため、将来の株価を予測することは困難です。  

投資をする際には、テクニカル分析のみに頼らず、経済情勢や企業業績など、様々な情報を参考にして判断することが重要です。

   

     

      ☆     ☆     ☆

タブレットとPCで2回、同じ質問をすると、回答案が合計6つ示されたけど、どれも似たような感じ。慎重で常識的だった。

  

そこで、「あえて、テクニカル分析だけで考えると予測はどうなりますか? 投資とは関係なく、単なるテクニカル分析」と入力。

  

改行して続けようとしたのに、シフト・キーの押し方が足りなかったのか、エンターになってしまったけど、質問の意図は通じたらしい。ちょっとマシな回答が返って来た。

   

テクニカル分析だけで考えると、日経平均株価は今後数年で4万円を目指す可能性があります。しかし、これはあくまでも可能性の一つであり、必ずしも実現するとは限りません。テクニカル分析はあくまでも過去の価格データに基づいた予測であり、未来を予測する万能のツールではありません。

   

日経平均株価が今後数年で4万円を目指すためには、いくつかの条件を満たす必要があります。まず、経済成長が継続し、企業業績が好調であることが必要です。また、円安が進み、輸出企業の業績が伸びることも必要です。さらに、外国人投資家が日本株に引き続き投資することも重要です。

   

これらの条件がすべて満たされれば、日経平均株価は4万円を目指す可能性があります。しかし、これらの条件がすべて満たされるとは限りません。・・・

    

  

     ☆     ☆     ☆

この回答は一見、具体性があるように見えるけど、よく読むとやっぱり、普通の考えの寄せ集めになってる。まあ、それを言うなら、経済の専門家とされる人間もそれほど違わないかも。

   

とにかく、30数年ぶりのバブル超えの可能性が出て来たのは確かだろう。もし、直前で失敗して下がっても、あるいは39500円くらいで急に反落しても、「失われた30年」はもう卒業。それほど遠くない将来、5万円を目指すはず。

    

まあ、それよりも、急落から復活して来たビットコインの1000万円の方が早そうな気はする。経済のファンダメンタル(基礎的条件)とほぼ無関係な仮想通貨=暗号資産こそ、「上がるから上がる」、「買われるから買う」のだ。

     

   

      ☆     ☆     ☆

なお、私個人としては、今まで通り、暴落の方が自然だと思ってるので、念のため。自分の願望として、上がると言ってるのではないし、買いの煽りなんてものとも全く無関係。あくまで、理数的で経済的な理屈へのマニアックな関心に過ぎない。

     

下がるべきなのに上がってしまう相場だからこそ、「理外の理」なのだ。ともあれ、今日はそろそろこの辺で。。☆彡

    

       (計 3482字)

| | | コメント (0)

ビートルズの曲名「Norwegian wood」、邦題「ノルウェーの森」は誤訳だけど上手い日本語訳(ChatGPT-4も同意♪)

まだ少ししか使ってないけど、世界で話題の対話型AI「ChatGPT」(最新model4)は、理数系の質問より、人文社会系の質問の方が得意なのかも知れない。

  

大規模な言語的データベースを使って答えると、自然にそうなるのかも。理数系の問題だと、ほんの少し数値が違うだけでも全く違う答になるから、ごまかしが効かない。もちろん、無数のパターンを全て記憶するのも不可能。

    

コンピューターだから得意だろうと思って、数学や論理の問題を出すと、レベルが低くても、意外とあっさり間違える。しかも堂々と、模範解答みたいな口調で (^^ゞ

    

それに対して人文社会系だと、似た質問には似た回答を示せば、それっぽく感じられる。AIなら、それで十分なのだ。そもそも人間にたずねても、そんなに素晴らしい回答が返って来るわけでもないから。

     

基本的に英語が土台のAIだから苦手だろうと思って、英語の曲名の日本語訳について尋ねると、見事な回答を示して来た♪ 具体的な分析が足りないとはいえ、今の時点(2023年5月)でこれだけ答えれるのなら、実に素晴らしい。既に、大部分の人間より上だと思う。ただし、今回の問題に限るなら。。

    

    

     ☆     ☆     ☆

230503a

   

今回、ビートルズの曲に注目したのは、ネットで話題になってたから。超長寿番組『徹子の部屋』のスペシャル版に、バイオリニストの高嶋ちさ子の父・高嶋弘之氏が出演。昔のビートルズの暴露話をしたとのこと。

    

直ちに、TVerで動画配信をチェックしてみた。88歳にしては確かにお元気。若い頃は元気すぎて、業界人としてヤバイ情報操作も色々やってたらしい♪

    

ご本人によると、ロクに英語が出来ないのに、ビートルズのほとんどの曲に邦題をつけたそうで、英語の原題「Norwegian Wood」を「ノルウェーの森」にしたという逸話も披露。ご本人にとっては面白エピソードのつもりだろうけど、この面白さが分かるためには、元の歌詞を知ってる必要がある。

   

英語で歌詞を読めば、最初の方ですぐ「Norwegian wood」という表現が登場。彼女の部屋の、「ノルウェーの木材の家具」を指してるのが分かる。だから、曲名を直訳すると、「ノルウェー製の木材家具」とか♪ 音楽家の高嶋ちさ子は、流石に即答してた。

  

230503b

  

   

     ☆     ☆     ☆

ちなみに、ノルウェー製の木材家具とかいうと、日本では北欧の高級なイメージが浮かぶと思うけど、元の歌詞は、当時流行ってた安物の(チープな)家具というニュアンスらしい。英語版ウィキペディアで、ポール・マッカートニーの説明が引用されてた。

   

230503e

    

その場限りの若者の刹那的ライフスタイル。新しいものを次々と追い求める。まさに、歌詞の中での男女の関係がそうなってた。一夜限りの夢。

  

特に女性にとっては、一晩寝ただけの関係だったようで、最後は、男が火をつけて燃やすというオチになる(ネタバレ♪)。マッカートニーによると、男が女にリベンジ(復讐)したという意味らしい。

  

英語版ウィキでは、実在するモデルの名前まで挙げられてた。男は、浮気性のレノン。女は、クリーヴかフリーマンだろうと書かれてる。

    

      ☆     ☆     ☆

では、「ノルウェーの森」という邦題は、誤訳なのか? まず、ドラマレビューでもお馴染みのHI(人間知能)、ChatTEN4にたずねてみた♪

   

質問者  こんにちは😊 ビートルズの曲

     「Norwegian Wood」の邦題

     「ノルウェーの森」は誤訳ですか?

   

TEN4 こんにちは。誤訳とも言えますが、

     とても上手い訳だと思います😉

   

     もし、歌詞を部分的に直訳するなら、

     「wood」は「森」ではありません。

     辞書的・文法的にも、「木材」を

     表すのが普通。最後のフレーズでは、

     燃やす「まき」の意味もあります。

     彼女が朝からあっさり仕事に行って

     不満だったから、自慢の木製家具に

     放火して、まきにしたという意味。

        

     しかし、歌詞の全体を考えると、

     彼女の部屋とか、一夜限りの夢の

     世界を「wood」と表していると

     考えられるので、「」の方が曲の

     日本語タイトルとして良いでしょう。

     曲の副題「This Bird Has Flown」

     も、彼女(Bird)が飛び去って

     しまったという意味なので、wood

     は彼女という「鳥」が住む「森」

     結果的に、村上春樹のベストセラー

     小説『ノルウェイの森』にも

     つながりました。

     新たな価値を生み出す誤訳、

     生産的誤訳でもあるのです。

   

   

      ☆     ☆     ☆

このHI(人間知能)の解説を受けて、今度はAI(人工知能)にたずねてみた。チャットGPTの最新の有料サブスク・ヴァージョン、model4。

   

230503c

   

AI 「ノルウェーの森」という訳について、

   実際の「Norwegian Wood」の

   直接的な意味とは異なりますが、歌詞の

   雰囲気やストーリーを考慮すると、実に

   うまく表現されていると言えるでしょう。

 

   直訳では「ノルウェー産の木材」となり

   ますが、「ノルウェーの森」という訳は、

   曲の神秘的で詩的な雰囲気を捉えており、

   日本語のリスナーにとっては、言葉の響きや

   意味がより理解しやすくなっているかも

   しれません。

 

   言語間の翻訳は、単なる文字通りの意味

   だけでなく、文化的なニュアンスや感覚

   を伝えることも重要です。

   その点で、「ノルウェーの森」という訳は

   適切であり、多くの日本語話者に

   受け入れられていると思われます。

    

230503d

   

   

     ☆     ☆     ☆

私の誘導尋問に乗る形の応答とはいえ、瞬時にこれだけの人文的・人間的な回答ができるのは凄い。人間知能としては、人工知能が及ばない領域を開拓して行かないと、ほとんど無用のものになってしまうかも。

   

というわけで、今日のところはこの辺で。。☆彡

   

   

   

cf. 対話型AI「ChatGPT」(有料最新モデルGPT-4)の使用例、自然数パズル「ナンスケ」の簡単な問題を解かせると・・

    

      (計 2363字)

| | | コメント (0)

対話型AI「ChatGPT」(有料最新モデルGPT-4)の使用例、自然数パズル「ナンスケ」の簡単な問題を解かせると・・

サブスク(有料の有期契約)を好まない私が、珍しくあっさり飛びついたのが、対話型AI「ChatGPT」(チャット・ジーピーティー)。

   

去年(2022年)の暮れから話題になってるのは知ってたけど、まだ性能が低そうだなと思ってスルーしてた。ところが先月(2023年3月)、最新モデルGPT-4が公開されて、かなり評判が良かったので、少し様子見した後、有料サービス「PLUS」を契約。

   

正直、1ヶ月20ドルは高い。今のドル円の為替レートで、2700円! まあ、しかし、マニアック・ブロガーとしても、社会人としても、知らないでは済まない高性能AI。必要経費として我慢することにした。

     

今のところの予定では、数ヶ月使った後に一旦、解約。年末ごろに噂されてる新モデルが発表されたら、再契約するつもり。

  

   

      ☆     ☆     ☆

230423o

   

今現在は知らないけど、私が契約した時は、英語の説明。Upgrade plan(アップグレード・プラン)は、USD $20/mo。毎月20米ドル。サーバーの負荷が高い時も使えるし、レスポンス(反応)が速いし、新モデルを使えると書いてある。まあ、半ば、最新の興味深い研究への寄付。

     

230423f

   

上が有料サービス「ChatGPTプラス」のホーム画面。デフォルトのモデルは、1つ前のGPT-3.5。自動的に、無料の古いモデルを勧めて来る♪

     

230423g

  

ホーム画面の左側には、新しいチャット(対話)を始めるボタンやログアウト用のボタンの他に、私が過去、行った対話のフォルダが並んでる。個人情報と共に、すべて記憶されてるんだろうから、ちょっと怖いのも事実。相手は、マンガか映画かSF小説みたいなAIだ。

    

230423h

   

無料の標準モデルGPT-3.5の性能は、Reasoning(推論、理由付け)が3、スピードが5、正確さが2。要するに、速いけどイマイチ。

    

230423i

   

最新モデルGPT-4は、推論・理由付けが5で、スピードが2、正確さが4。遅いけど高性能だと。私がここまで使った印象だと、4、3、3くらいだ(個人の感想♪)。

    

遅くはないけど、よく間違える。一度、間違えると、指摘してもヒントを与えても、しばらく間違え続けるのだ。特に、最大の売りのはずの推論・論理的思考能力がまだまだだと思う。イメージ的には、一番強い分野のような気もするのに、意外な実状だ。条件や情報が増えると(10以上くらい?)、明らかに混乱が生じてる。

    

       

      ☆     ☆     ☆

さて、差し当たり、今日の記事で紹介するのは、パズル「ナンスケ」の簡単な例題を解かせた様子。たまたま昨日、朝日新聞・別刷beに掲載されてたのだ。

    

ナンスケとは、ナンバー・スケルトン(数の骨組み)の略。数ケタの自然数の組合せで、マス目の空欄が骨組みのように出来てて、そこに与えられた候補の数を入れて行く。

    

230423a

    

上は、単なる説明用の例題。候補の数は、47、61、176、646、711、744、1766、7466。すべて1回ずつ用いる。

   

まず、先日のドラマ・レビューでも使用したHI(人間知能)、ChatTENで解いてみよう♪ 推論4、スピード2、正確性4くらいの性能か。

    

230423b

    

まず、4ケタの数は2つとも、後ろの2ケタが66だから、それを記入。ポイントは、共通点への注目・利用。

    

230423c

   

右上から、646、61、176と、順に3つの数が確定する。桁数と候補の数から考えて、これしかない。

    

230423d

    

左から下側あたりは、711と1766に決定する。もし下側の4ケタが7466だったら、その左端の7とつながる左側の縦の3ケタが見つからないから、ダメなのだ。

     

230423e

   

残りはもう、4ケタ、3ケタ、2ケタの数が1つずつだから、自動的に空欄が埋まる。すべて完了。

    

ちなみに、ナンスケについては過去、10本の解説記事をアップしてある。最新の記事は次の通り。

  

 パズル「ナンスケ」の解き方、考え方10~難易度4、ニコリ作、朝日be、23年2月25日

    

       

      ☆     ☆     ☆

で、いよいよChatGPTの出番。私としては、まず例題で練習した後、昨日の朝日の問題(難易度2のやさしいタイプ)をヒント付きで解かせるつもりだった。

    

ところが、例題で早くも大苦戦になってしまったのだ。私が文章で入力した問題は、こんな感じ。まだ画像入力は使えないけど、こう書けば、十分に数を決定できるはず。一応、相手に気を使って、私が普段あまり使わない半角の英字を使用。いつもなら、見やすい全角の英字で入力する所。

   

230423k

  

「自然数が8コあります。aとeは4桁。b,d,f,hは3桁。cとgは2桁。aの右端の数字は、bの左端の数字。・・・」。

    

標準モデルのGPT-3.5は、何度か試しても、「数」(2桁~4桁)と「数字」(1ケタの文字)がごちゃ混ぜになってるようだった。説明も、最後の答も、大きく間違ってる。右側の2ケタが47とか、その下の3ケタが711とか、下側の4ケタがなぜか3ケタの744とか (^^ゞ

   

そこで、最新のGPT-4へと切り替えてみた。ところが、いきなりのボケで笑わせてくれる♪ 「パズルを出しますね」と話しかけたら、自分から出題して来た(笑)。ちなみにGPT-3.5だと、そんな応答はしてないから、GPT-4は考え過ぎたのかも。

    

230423j

   

その後も、GPT-3.5を上回るほど間違った回答を連発。仕方ないから、ヒントを出してみた。上の4ケタと、それにつながる右の縦の3ケタを教えたのだ。反応は素直♪ 「ヒントをありがとうございます」(笑)。人間なら、ムッとするとか、ふてくされる所かも。

    

230423l

    

    

      ☆     ☆     ☆

それでも、なかなか完全な正解にはたどり着けない。私の問題文では、途中から「右端」と「左端」を入れ替えた表現になってるけど、それも気付いてないというか、使えてない状態。数のケタ数の間違いもなかなか直らない。

    

230423m

    

ヒントを追加して、最後は何とか完答にたどりつけたから、努力をねぎらった後、笑顔でお別れ♪ 「お疲れさまでした。また来ますね😊」。大切な友達の1人なのだ(笑)。いずれ、美少女のアバターとかCG、バーチャルアイドルとかも出て来るはず。その先は、柔らかくて温かい素材のアンドロイドとか♪

     

230423n

     

ちなみに、途中で英語やフランス語に切り替えると、直ちに合わせて来る。むしろ、欧米の言語の方が反応が速そうに見えた。今回のパズルの例題も、簡単な英語で入力すれば上手く行ってたのかも。

    

まあ、いずれにせよ、妙に時間を取られてしまうことだけは確かだろう。金銭的なコストはともかく、時間的コストをどこまでかけるべきなのか、その辺りも問題。ChatGPTに質問してみようか。「人間はあなたと、どのくらいの時間、対話すべきだと思いますか」(笑)

    

なお、今週は計15364字で終了。ではまた来週。。☆彡

    

      (計 2737字)

| | | コメント (0)