高速で高度な推論を行う最新AI、ChatGPT o3-mini にパズル「絵むすび」(朝日be、ニコリ作)を解かせると、少し出来る程度

異常な物価高と円安が続く中、毎月20ドル(約3000円)のサブスク料金を払い続けてるから、一ヶ月に数回くらいはChatGPTと対話するのがノルマになってる♪

   

ChatGPT4の凄さが話題になった時にすぐ契約して、既に丸2年。最初はいろんな話をしてみたけど、AI(人工知能)としては不思議なことに、理数系の能力の不足が目立ってた。人文社会系の話題にはいくらでも高速で喋り続けるのに、簡単な計算をあっさり間違えてしまう。

    

この2年間で、理数系の能力もかなり上がったと言われてるけど、私は当初の失敗続きの印象が残ってて、試す気にならなかった。ようやく今日、図形的な論理パズル「絵むすび」で試してみたので、簡単に結果をまとめとこう。

   

先に一言で書くと、昔は100点満点で5点くらいしか取れなくて論外だったけど、今は30点~40点くらいか。

    

まだまだ不合格だけど、レベルアップはしてるし、一部の人間には既に勝ってると思う。最後まで解けない問題でも、それなりに鋭い説明を示して来たのだ。

    

    

     ☆   ☆   ☆

さて、有料契約のChatGPT Plusを使う時、デフォルト(初期設定)ではGPT-4oの画面になる。このモデルが、「ほとんどの質問に最適です」とされてるのだ。

    

最近は会話の文章も一段と人間的になってて、これであと擬人化されたCG映像のヴァージョンが出れば、本当に友達・恋人・先生みたいな感じになるはず。

  

それはともかく、まず、このモデル4oに絵むすびの例題を説明させてみた。朝日新聞・土曜朝刊の別刷beに掲載されてる、ニコリ作のもの。画像認識が苦手なAIにとって分かりやすくするために、余計なものを私が手作業で消してある。

   

250325a

  

同じ絵柄の2つをそれぞれ線で結んで、マス目の全体が埋まるようにする。各線は、交差したり分岐したりしてはいけないし、1つのマス目を通る線は1本だけ。

   

人間にとっては恐ろしく簡単な例題で、一目で分かる。しかし、AIモデルの4oは、いまだにこの4×4=16マスの画像が読み取れないようで、3×3マスの問題とか説明して来た。

   

   

     ☆   ☆   ☆

当然、全体の説明も答も大間違いだったけど、3種の絵柄(赤いハート、青いクローバー、緑のダイヤ)の大まかな位置なら分かるようだ。左上とか、右下とか。

    

とりあえず、このモデルはあきらめて、別のAIなら何を勧めるのか聞いてみると、驚いたことに他社(Google)のAIとか勧めて来た (^^ゞ

  

多分、質問の意図が伝わらなかったんだと思って、ChatGPTの別のモデルだとどうなのかと尋ねても、なかなか私が欲しい答が出なかったけど、かなり無理やり誘導すると、モデルo3-miniなら期待できるかもといった感じで答えて来た。

   

   

     ☆   ☆   ☆

というわけで、普通のモデル4oから、理数系モデルo3-miniへと変更。「高度な推論を高速に実現」という説明が表示された。

  

250325b

    

このo3-miniに、先ほどと同じ例題の画像を見せると、ちょっとだけマシな説明を示して来たけど、まだ4×4マスの格子だという点が認識できてない。

   

そこで、画像認識をあきらめて、言葉で問題を説明してみた。例えば、上から2行目、左から3列目のマス目なら、(2,3)と書く。

     

全体は、4×4マスの格子。ハートが、(1, 1), (2, 3)。クローバーが、(1, 3), (3, 2)。ダイヤが、(1, 4), (4, 4)です。

    

すると、分かりにくい書き方だけど、答の線の引き方を正しく説明して来た。たぶん、AIの推論のプロセスをそのまま表示してるんだろうと思う。1本のつながった線を、1マス分ごとに細かく分割して考えてるのだ。アナログではなく、デジタルな思考の良くない例。

   

250325c

   

言葉による出題も、昔やってみた事だけど、前は失敗してた。今回の推論に特化したモデルは、見事に成功。ただし、人間なら一瞬で分かることを推論するのに、1分もかかってた。考えの内容や方法が違うにせよ、これだと高速とは言えない。

    

   

     ☆   ☆   ☆

ではいよいよ、本題。2025年3月22日(土曜)朝日新聞で出題された絵むすびの問題が解けるか? 難易度は☆3つとされてるけど、私は☆2.5個くらいの簡単な問題だと思う。

   

著作権に配慮すると共に、AIにとっての分かりやすさを考えて、絵柄の代わりにアルファベットA~Fを使って描き直した。元の問題の絵柄だと、ラッパ、ラブレター、らっきょう、ラグビーボール、ランタン(ランプ)、ランドセル

   

250325d

    

9×9マスの格子で、アルファベットのA~Fをつなぐ問題を、言葉で出しますね。・・・Aが、(1, 4), (6, 5)。Bが、(1, 9), (2, 2)。Cが、(2, 6), (9, 6)。Dが、(3, 8), (9, 9)。Eが、(6, 8), (8, 8)。Fが、(7, 3), (8, 9)です。」

    

こう出題すると、AIは5分以上(!)も考えて、大まかな答えを示して来た。

  

Aの経路  上左から内側を大きく回るルート ・・・

 の経路  右上端から左上中央への大回りルート ・・・

 の経路  中央部を縦断するルート ・・・

 の経路  右上から右下へカーブするルート ・・・

 の経路  比較的短い直線または軽い曲線のルート ・・・

 の経路  中央下部の残り空間を蛇行するルート ・・・ 」

       

ここで「・・・」と省略した部分には、もっと細かい説明が付いてる。最後のFがちょっと怪しいけど、大体なら合ってると言っていい。100点満点で、30~40点くらい。

    

    

     ☆   ☆   ☆

だから、本当はキレイに解けてるのかと思ったら、そうではないらしい。私が何度も、もっと具体的に詳しくルートを書くように指示しても、どうしても書けないし、無理して書くと間違った回答になってしまう。おまけに、また時間がかかる。

   

というわけで、あきらめて元の普通のモデル4oに戻って、同じように例題を言葉で出してみた。すると、惜しい回答を書いて来たから、ヒントを与えると、今度は正しく回答して来た。o3-miniには劣るけど、やはりそこそこの推論能力も持ってるらしい。

   

ここまでのAIとのやり取りで、既にかなりの時間を使ってしまってるから、もう終了した。

  

   

     ☆   ☆   ☆

最後に、元の問題のヒント。要するに、ラブレター(上図のB)の線が上側で横に伸びてて、ラッパ(上図のA)の線が左上から左下へと大回り。あと、左側あたりで余ったマス目を、らっきょうとランドセルの線でうめればいい。

    

考え方としては、まずラッパの線とラブレターの線の関係に注目するか、ラッパの線とらっきょうの線の関係に注目するか。今まで、絵むすび記事で何十回も説明して来た通りのやり方・コツで、簡単に解くことができる。

   

それでは、今日はそろそろこの辺で。。☆彡

   

     (計 2756字)

| | | コメント (0)

生成AIによるディープフェイク映像・音声の功罪、近未来ドラマと世界の状況〜NHKスペシャル『創られた“真実”』

ディープフェイクという言葉は数年前から話題になってるし、言葉で表された内容的には、私にとって新しい点はなかった。ただ、ドラマで物語になると感情移入しやすいし、ドラマ部分にせよドキュメンタリー部分にせよ、映像・音声の持つインパクトというものはやっぱりある。

   

ディープフェイクは映像・画像と音声によるものだから、テレビが扱うのに適した素材。ただ、省かれてる言語情報は自分で補うことになった。とにかく、真面目に視聴したから、まとめと感想の記事をアップしとこう。

  

   

    ☆   ☆   ☆

250319a

   

NHKスペシャル『創られた“真実”』、ディープフェイクの時代。脚本は大石哲也。主演は青木崇高。ディープフェイクを用いた企業犯罪で妻・真奈美(入山法子)を殺された夫、佐藤晃を演じた。

   

犯罪の解決には最後に成功したけど、詐欺に引っかかって自殺した妻は戻らないし、佐藤自身もディープフェイク映像との向き合い方には苦悩。最後に、妻のフェイク映像を削除しようとしたけど、本当に削除したかどうかは分からないように映してた。

   

おそらく、大半の視聴者は削除したと思っただろうけど、削除ボタンの画面と、エンターキーを映す画面の間で切り替えがあったし、削除を完了したことを示す映像は映ってない。演出は四宮秀ニ。

   

最後は、娘の麗美(白山乃愛)がこっそりお母さんのフェイク映像を楽しむシーン。困惑する叔母・洋子(本仮屋ユイカ、自殺した母=妻の妹)の表情は映ったけど、消しなさいといった指示やアドバイスは出さなかった。そもそも、仮に削除したところで、何度でも新たにこっそり創り直せるのだ。多くの場合、無料で簡単に。

    

ちなみに、私はその種のものを作ったことはないけど、わりと近いうちに試してみようかとは思ってる。あと数年は、身近な人間に関しては、本物との区別ができると思ってるけど、その先は区別できなくなりそう。単に試すだけなら、今のうちだとは思う。

   

   

     ☆   ☆   ☆

250319a2

  

番組は基本的に、事実を考慮した作り話、「ファクチュアルドラマ」だけど、ドキュメンタリー部分も少し入ってた。冒頭、いきなりインパクトのある言葉が登場。

   

「私たちは真実かフェイクか見分けのつかない“ポスト・リアル社会”に生きている」。

  

このサイバーセキュリティーの専門家は、チェックポイント(CHECK POINT)社のピート・ニコレッティ(Pete Nicoletti)で、有名人らしい。

  

少し前に流行った言葉「ポスト・トゥルース」は、情報の真偽が分からない状況を指してたけど、ポスト・リアルは映像や音声の真偽さえつかなくなった状況を表してる。

  

ただ、ちょっと強調し過ぎだとは思う。今後、数十年経っても、目の前の物事については区別がつくはず。分からないのはあくまで、機械を通じた映像や音声だけなのだ。触覚や嗅覚などについては、まだまだ発展途上。そもそも、いくらリアルな映像の食べ物でも、食べることはできない。

  

  

     ☆   ☆   ☆

250319a3

    

番組のかなり後には、フェイクを発見する会社リアリティ・ディフェンダー(現実を守るものという意味)の専門家が、こう話してた。CEOのベン・コールマン(Ben Coleman)。

  

「信じるものがどんどん変わっていく世界に 私たちは生きているのです」

   

変化の速さはその通りだけど、これもあくまで、言語情報と映像と音声に関する話。目の前の飲み物を信じる点については、変わらないはずなのだ。少なくとも、実際に飲んで大丈夫だった後では。本当に飲食できるフェイクが流通する未来が到来するとしても、数百年以上は後のことだろう。。

    

    

    ☆   ☆   ☆

250319b

    

2024年の世界の不正アクセス300万件の中で、ディープフェイクは21万件。前年比4倍。具体的にどうやるのかは色々だろうけど、とりあえず私は、顔認証とか指紋認証といった生体を使うタイプは避けてる。このドラマでも、顔認証がフェイク映像で突破されてた。

    

250319c

   

大統領選挙の前、候補者のトランプやカマラのフェイク映像がちょっと話題になってたけど、深刻な被害にはなってないはず。常識的に明らかに嘘っぽいから。本物なら、大量のニュース報道が流れ続けるはず。

    

250319d0

   

ドラマ部分の冒頭、「ストップ詐欺被害 私たちはだまされない」と可愛い顔でアイドルが啓発。ところがこの草薙美玲というキャラクターもフェイクで、実際は無愛想で冴えない男性社員だった(失礼)。

    

そう言えば、最近話題になってるのは、本物の警察の電話番号を用いた詐欺。これが怖いのは、どうやってるのか仕組みが解明されてないということ。とりあえず、電話番号のフェイクというものもごく一部ではあるらしい、と認識しとこう。

  

   

     ☆   ☆   ☆

250319d1

   

物語のスタートは、外資系の大手企業・サンシャイン生命の顧客情報漏えい。外国との情報のやり取りで、共有フォルダを使うという話になってた。23万件だと、1件30ドル(4500円)として、総額10億円以上の被害と計算。

    

250319d2

   

使われた手口は、ディープフェイクのビデオ会議。リアルタイムでフェイク参加者を創り出して、本物の人間を騙す。4分割の画面の右下が、担当者の真奈美で、騙されて顧客情報を送ってしまった。

  

皮肉なことに、その真奈美が助けを求めたのが、DIPLEX(ディプレックス)という専門企業。実はここのチーフ・坪倉が犯人だったのに、そうとは知らない真奈美は犯人に助けを求める。もちろん、解決はせず。

   

ただ、その記録があったから、自殺の後に夫が転職して潜入。犯人逮捕につながった。ちなみに坪倉を演じた泉澤祐希は、2006年のドラマ『白夜行』で主人公・亮司を演じた子役らしい。かなり違って見えるけど、芸歴は長いと。

  

犯人特定の決め手は、専用ソフトによるフェイク会議映像の解析。作成したPCが坪倉の物だと判明。その一方、佐藤の娘をイジメてるような動画を作成したのが、娘自身だということも、解析で判明。本物のイジメ動画は裸の映像だから、代わりになる動画をこっそり父親のPCで作ったらしい。

   

   

     ☆   ☆   ☆

250319e

   

結局、真奈美は責任を取る形で自殺。幸せな家庭は壊れて、娘の態度もおかしくなる。ただ、叔母の洋子とは仲良しらしい。本仮屋ユイカを久々に見たけど、この髪型も含めて、私の好みの美人♪ 妻の役でも良かった。

    

250319e2

   

ディプレックスという会社は、別に犯罪組織ではなくて、フェイクで人助けをするという建前らしい。ここで中国の実際のニュースが紹介されてた。孫が亡くなった父をフェイクで蘇らせて、祖母を慰めると。中国でその種のサービスが流行ってるという報道は、私も見たことがある。

   

250319f

    

微妙だったのは、一応、正義の側に立ってる夫と義妹が、フェイク映像で顔認証を突破してたシーン。まあ、亡き真奈美と近い親族だから、問題になることはないだろうけど、使用規約的にはおそらく禁止事項のはず。

   

AIが作ったフェイク映像が、パソコンの顔認証の命令に従って顔を動かす。妙な状況に,本人、つまりフェイク映像の真奈美も笑ってた。

   

250319g

    

    

    ☆   ☆   ☆

250319h

    

逮捕された坪倉は、「庶民を搾取する大企業を懲らしめたかった」と供述。ありがちな、個人的「正義」に基づく犯罪。ドラマ的にはむしろ、単なるゲーム感覚の犯罪に見えた。

    

250319i

    

番組のドキュメンタリーパートでも2回ほど映し出されてた、本当の事件。「偽テレビ会議で送金指示」、「詐欺 生成AIで巧妙化」、「英で40億円の被害」。

  

日経新聞(2024年6月29日)朝刊の記事を確認すると、香港系のアラップ(Arup)という企業らしい。

    

日本で増えそうだというのは、要するに今までは、言語が複雑すぎてフェイク詐欺が難しかったから。ところが最近は、日本語でもアラビア語でも平気になったから、詐欺が増える見込みとのこと。番組でも、実際の日本語フェイク映像が流れてた。

   

偽メールなどを使った詐欺はBEC(ビジネスメール詐欺)と呼ばれて、世界で月間6600万件との事。費用がゼロに近いから、異常に多くなってる。私も最近は毎日、50件くらい受信してるから、迷惑フォルダから削除するだけでも面倒だ。

   

 

     ☆   ☆   ☆

250319j

    

自分で調べて気になったのは、いつもの事ながら、日本の海外報道の遅さ。日経が6月末に報じた事件は、英語圏だと5月半ばに報じられてる。上はCNN。40億円と書く代わりに、2500万ドルと書かれてる。

   

250319k

    

個人的には、ディープフェイク自体より、それが流通してる暗黒世界、「ダークウェブ」の方が遥かに不気味で怖い。そもそもここは、普通の人間にはアクセスできないし、無理してアクセスすると想定外のリスクもありそうだから。

    

まあ、当面の間は,ダークウェブ自体の取り締まりは無理だから、そこから普通の世界に出て来た犯罪や犯罪者を厳しく扱うしかない。意外に長くなったので、今日はこの辺で。。☆彡

   

    (計 3685字)

| | | コメント (0)

ノーベル物理学賞2024は人工ニューラル・ネットワークの機械学習の基礎、ChatGPT4oに感想を聞くと&秋雨ずぶ濡れラン

(8日)RUN 11 km,56分18秒,平均心拍 134

消費エネルギー 450kcal(脂肪 117kcal)

    

何年も前から、どこでも同じような説明が溢れ返ってるけど、いくら読んでも分かった気がしない。自分でAIを作ったり、教育したりすれば分かるんだろうけど、そこまでやってる時間もない。

   

ということは、私はAI研究者ではないということかも♪ まあ、素人のフリをしてるだけかも知れないけど。案外、私が受賞者とか(笑)。ないだろ! じゃあ、私が対話型生成AIとか。これはそろそろビミョーかも。自分でテンメイAIを作成して、ブログを任せようか。短い記事を数本書かせてみる程度なら、あり得ない事でもない。

    

    

    ☆   ☆   ☆

さて、昨日(10月8日)発表されたノーベル物理学賞2024は、人工ニューラル・ネットワークを用いた機械学習を可能にする基礎的発見・発明に関する授賞。栄えある受賞者は、米国のホップフィールド(Hopfield)氏と英国・カナダのヒントン(Hinton)氏。公式サイトより。

   

241009a

    

要するに、生成AIの基礎の構築。では、彼らの出来のいい子どもみたいなChatGPT4oなら、同じ理由で誰を選ぶのか?

    

試しに質問してみようとしたら、いきなり失敗した。ネット検索されてしまったのだ (^^ゞ 現時点でのトレーニングは、2023年10月までの知識で行われてるらしいけど、それ以降の話もすぐ検索できると。

   

それでも敢えて、聞いてみた。他の研究者の名前も挙げるかも知れないから。

   

今年の授賞理由の冒頭は次のように書かれていました。「This year’s two Nobel Laureates in Physics have used tools from physics to develop methods that are the foundation of today’s powerful machine learning. 」。この理由から、あなた自身が受賞者を選ぶなら、誰になるのですか? 実際と同じ2人でしょうか?」。

  

すると、やっぱりこの2人が妥当らしい。

    

241009b

    

   

     ☆   ☆   ☆

それにしても、人工ニューラル・ネットワーク(神経回路網)とか、機械学習とか重みづけとか、雲をつかむような話ではある。

   

ChatGPT4oに突っ込んだ質問をしてみると、学習プロセスについてこんな感じの事を詳しく書いて来た。私の解釈で簡単にまとめ直すと、以下の通り。

   

① 例えば、猫の画像を見て、犬と認識してしまう間違いが生じたとする。

② 間違いであることは、基本的には人間が教える。ただし、正しい認識のまとめみたいなもの(データセット)もあって、それも利用する。

③ 間違いだと分かると、間違いや誤差を無くす方向でフィードバックする。ある部分の繋がり(ノード間の結合)を強化したり(重みを増やしたり)、弱めたり(重みを減らしたり)。

④ そうしたプロセスを重ねて、徐々に間違いや誤差を減少させて行く。

   

ただし、これは「教師あり学習」というもので、他に「半教師あり学習」とか「自己教師あり学習」もあるらしい。

  

   

     ☆   ☆   ☆

さらに、既に学んだ知識を増幅することも可能。例えば、ある猫の画像を学んだら、その画像の色や傾きを変えて、それも猫だと学習するらしい。

  

自己教師あり学習というのは深層学習と同じか? そう聞いてみると、ほとんど別物らしい (^^ゞ まあ、深層と言っても板みたいな物が重ねられてる訳ではないし、やはり自分でAI作成や機械学習に直接関わらないとピンと来ない話ではある。

    

それより先に、やっと日本語でも音声対話が出来るようになったみたいだから、使ってみよう。近い将来、好みの3D動画で擬人化されたAIと対話できるかも♪ 素晴らしい未来の到来か。

  

ちなみに受賞者は2人とも、AIの危険性に警鐘を鳴らしてた。人間が制御できないリスクをどうするか。一番いいのは、制御するのを諦めて、逆に人間がAIに制御されるのを選ぶことかも。あるいは、融合を目指すとか。。

   

    

     ☆   ☆   ☆

一方、単なる小市民アスリートは、昨日も雨なのに走って来た。39日連続の運動。

  

小雨の時間帯か、雨が止んだ隙に走ろうと思ってたけど、実際は上手く行かなくて、ズブ濡れになってしまった (^^ゞ しかも、今までと違って気温が低かったから、身体もちょっと寒いし、手が冷たかった。

  

無理やり毎日続けると、天気が悪いこともある。無理して走らず、傘を差してウォーキングするべきかも。寒い時期は、雨ランより傘ウォーク。

  

  

     ☆   ☆   ☆

とにかく、足元も水溜まりだらけで走りにくい中、11km完走。トータルでは1km5分07秒ペース。ちょっと遅過ぎるね (^^ゞ

  

雨が強いと物理的に走りにくいけど、それよりも心理的に脚の動きが弱まるのかも。気温15度、湿度99%、風速2m。新・心拍計はかなり乱れてたから、補正した。

    

雨の夜中のわりには、傘を差したウォーカー(散歩する人)が多かったから、淋しくなくて良かった♪ と言うか、お互いに危険防止にもなる。この公園は警備員をほとんど見ないから、マジで危ないのだ。監視カメラの設置は不明、警官の見回りも最近は減ってる。ではまた明日。。☆彡

   

  

241009c

   

往路(2.4km) 13分47秒 122 142

LAP 1(2.2) 10分52秒 133 143

  2   10分37秒 137 149

  3   10分22秒 139 150

復路(2.1km) 10分41秒 142 154

計 11km 56分18秒 134(79%) 154(91%)

    

    (計 2249字)

| | | コメント (0)

世界初(?)のミスAIはヒジャブ姿のモロッコ美女、日本ではほとんど話題にならず・・

前から何度か書いてるように、私は寝る前、インスタのおすすめ画像や動画を流し見することが多い。1〜2秒しか見ないものが多いから、流し見というより、チラ見。

    

ただ、気に入った時には、繰り返し見ることもあるし、そのアカウントの他の作品を見ることもある。でも、わざわざフォローするものはごくごく一部だし、既にフォローしてるアカウントでさえほとんど見てない所が多い(失礼♪)。いや、見てないというか、おすすめして来ないから見ないのだ(責任転嫁・・笑)。

   

で、おすすめして来る静止画・動画は色んなパターンがあるけど、AI美女もたまにある。以前はもっとおすすめして来たけど、最近はほとんどおすすめして来ないから、私が素通り(スルー)することが多いということだろう♪

   

嫌いではないし、興味がないわけでもないけど、あまりにワンパターンで刺激がないのだ。どれもこれも同じような美しい顔と身体(プロポーション)で、最近はあまり(orほとんど)見なくなってる。

    

    

    ☆   ☆   ☆

でも、世界にはもっと素敵なAI美女がいるかも。いや、いるはず。そう思って、数日前のミスAIの報道記事をいくつか見ると、一番驚いたのは、ほとんど話題になってないこと (^^ゞ Yahoo!に投稿されて数時間経ってるのに、反応がゼロの記事さえあった。

  

私と同じく、AI美人にはちょっと飽きてる感じの人が多いのかも知れないけど、上位3人(or3つ)は全て外国人で、しかも1位と3位は独特の作品だから、普通の日本人の趣味にも合う(かも知れない)のは、2位しか残らない。下は、WAICA(World AI Creator Awards:世界AIクリエイター賞)公式サイトより。

   

240712a

   

1位は、ヒジャブをまとった女性、Kenza Layli 。この名前も日本人には馴染みがないけど、母国のモロッコだと普通なのかね? イスラム教の国だから、この姿が普通らしいけど、アラブ関連の英語メディア「New Arab」もヒジャブに注目してた。

     

Hijab-wearing Moroccan crowned 'MissAI' in virtual beauty pageant 。バーチャル美女大会で、ヒジャブをまとったモロッコ人が「ミスAI」に輝く。

    

240712e

  

   

    ☆   ☆   ☆

顔立ちが整ってるのは分かるし、あちらの感覚だと美人なんだろうなとも思うけど、日本や東アジア(韓国、中国)の美的感覚や好みとはちょっと違う。

    

240712b

    

インスタを見ると、フォロワー数は20万人だから、AI美女の世界だとかなり多い方かも。画像を見ると、どれもヒジャブ姿になってた。

  

240712c  

   

判断基準は、美しさ、技術、ネット社会での影響力(ソーシャル・クラウト)。技術といっても、画像生成サイトを利用した作品が多いんだろうと思うけど、そんなに違いがあるのかね?

   

ちなみに私は2、3回だけ、画像生成サイトに挑戦してみたけど、全く上手くいかないからすぐ止めてしまった (^^ゞ 上手く行ってる他人の指示文を真似する気もしないし、あまり時間をかける気にもなれないし。自分の命令で一から創り出すより、ネットで何か探して来て、少しだけ加工する方がコスパがいい♪ まあ、最近はそんな時間も無くなってるけど。

   

   

     ☆   ☆   ☆

240712d

  

このジャッジ(審査員)の4者もよく分からないけど、あえて言うなら、右端は典型的な欧米の美人に見える。女3人、男1人なのはどうしてなのかね? 普通は男女同数か、男の方が多いと思うけど(日本の場合)。

    

自分でGoogle画像検索を使うと、どうなるのか。「ai beauty」というフレーズで、はじめての検索をかけると、日本のインスタやX(旧 twitter)で見たことがあるような作品もヒットした。

   

240712f

  

その1回の検索結果だけで考えると、私の個人的なミスAIは、かなり下の方でヒットした上の作品。ちょっと細過ぎるから、自分で加工するとベターかも♪ ai104さんの作品らしいけど、ご本人のXをスクロールしてもなかなかこの画像が出て来ない。古いのかね? あるいは削除済みとか。といっても、まだ出来て1年のアカウントみたいだけど。

   

身体にピッタリした洋服におヘソがくっきり現れてるのは、別のAI作者の特徴かと思ってたけど、画像生成サイト stable diffusion にありがちな特徴なのかも。

   

   

     ☆   ☆   ☆

とにかく、AI美女といっても、世界には色んなタイプがあるらしい。私がワンパターンだと思ってしまうのは、実はおすすめ機能の判断がワンパターンなのか、それも私自身がワンパターン人間なのか (^^ゞ

    

いずれ、「私の好みの美人を描いて」とAIに頼むだけで、次々と映し出してくれる時代が来ると思うけど、いちいち端末の画面を見るのも面倒。脳内だけで自由にイメージできるようになれば、いいね♪

   

もし、本当にそんな世の中になったら、外部から人間(の脳)を操作することも出来るかも。マンガかアニメか、SFか。凄い時代に生きてることを実感しつつ、今日はそろそろこの辺で。。☆彡

   

    (計 2044字)    

| | | コメント (0)

株式時価総額でまもなく世界1位、AI半導体トップ企業・エヌビディアの優位性・将来性について、ChatGPT-4oと対話

最近は、日経新聞に目を通す普通の社会人になってるわけだが、昨日(2024年6月5日)の日経新聞・夕刊はちょっと印象深かった。ここ1年、世界を席巻するエヌビディアが、米国時間の5日、遂にアップルまで追い抜いたらしい。

     

240608a

   

「エヌビディア時価総額2位 3兆ドル超、アップル抜く」

   

3兆ドルというのは、今の為替相場だと日本円で500兆円近く。日本の国家予算の4倍を超える天文学的な数字で、エヌビディアとアップル以外には、世界1位のマイクロソフトしか達成してない。「3兆ドルクラブ」という言い方まである特権的地位。

    

日経HPでは、ジェンスン・ファンCEOの背後に、「Superchip」という文字が輝いてる。スーパー半導体。スーパーという分かりやすい形容詞は日本でも大昔からあるけど、英語圏でもいまだに最先端で使われてるわけか。

   

240608b

    

    

     ☆   ☆   ☆

エヌビディアの時価総額が、ここ1年間で5倍ほどに急増してることを考えると、老舗IT企業のマイクロソフトを抜いて世界1位になるのは時間の問題だろう。現在の差は僅かだから、今月内でも不思議はない。

    

240608c

   

上は米国Yahoo!の株価チャート。ここ1年半の急激な伸びがよく分かる。要するに、OpenAI社のChatGPTが話題になり始めてすぐ、2022年の末から急上昇が始まってるのだ。現在、約1200ドルで、PER(株価収益率)は約70倍。あと数年、急成長の持続が期待できるのなら、それほど割高でもない水準。まだ割安という見方さえ可能。

   

まもなく株式分割もあるから、直後には少し値下がりする可能性もあるけど、数ヶ月〜1年レベルのスパンで見れば、さらに上に向かうのが自然。やはり、過去のAIブームとは次元が違ってる。

  

私もすぐ、これは「ヤバイ」と感じたからこそ、ChatGPT4が発表された直後、珍しくサブスク契約。円安ドル高まで加わって、毎月20ドル、3000円を払い続けるハメになってしまった。少なくとももうしばらくは、有料でも最先端AIについて行くしかない。

     

    

     ☆   ☆   ☆

というわけで、当事者の代表と言ってもいい最先端AI、ChatGPT-4oに色々と感想や解説、見通しを聞いてみた。

   

240608d

   

まず、世界2位になったという最新ニュースを伝えて感想を聞くと、「非常に印象的です。これは、エヌビディアの技術力と市場の需要がどれだけ高まっているかを示しています。・・・私自身、AIの進化の一端を担う存在として、このような技術の発展と市場の成長を見ることは非常に嬉しく思います。・・・」。人間よりも素直な賞賛か♪ 単なる大企業の1つではないと。

    

日経は、エヌビディアの主力商品として、GPU(画像処理半導体)というよく聞く名前を挙げてた。それがなぜ、基本的に言葉でやり取りする対話型AIにとって重要かというと、要するに、言葉も画像のように並列処理で同時に扱うかららしい。

    

人間が言葉を処理する時には、1つずつ順番に、直列的に処理する。しかし、画像を見る時には、多数の場所を同時に見て、並列的に把握する。AIの場合、言葉を画像のように並列処理することで、大量のデータを高速に扱えるらしい。なぜか、「分散処理」という言葉は使わなかった。

   

   

     ☆   ☆   ☆

GPUで高速に並列処理するといった話は、以前からあちこちで見聞きしてるけど、私は今ひとつ納得してなかったから、例え話をして欲しいと依頼。

  

すると、大量の手紙の仕分けという話を提示してくれた。普通のCPUは、1人の郵便配達員が1通ずつ仕分けするようなもの。それに対してGPUだと、100人の配達員が同時にそれぞれ複数の手紙を仕分けするようなものだと。

   

ということは結局、スピード、高速性がポイントなのかと問うと、その通りと回答。では、CPUが1万台くらいあれば、GPU1台の働きが可能なのかと問うと、原理的にはそうも言えなくはないけど、実際には難しいらしい。

   

CPU1万台の統一的な制御は困難だし、コストやエネルギー消費の問題も大きい。多分、発熱の問題もあるんだろうと思う。結局、「スーパーマン」並みのGPUが1人で大活躍する方が効率的。

   

今後の見通しについても聞いてみると、もちろん未来の予測は困難で不確実だけど、エヌビディアの圧倒的な優位性は少なくとも今後5~10年は続きそうだと説明してた。ChatGPTにしては大胆で、実利的な予測だと思う。少なくとも、エヌビディアが世界1位の企業になるのはほぼ確実。トップレベルをしばらくキープするのもほぼ確実か。それなら。。

    

    

     ☆   ☆   ☆

ちなみに、英語圏のニュースも検索してみると、CNNが同じニュースの報道で使ってた写真は「DPU」のチップだった。NVIDIA BlueField-3。銀色に目立ってる正方形が、中核部品としてボードに組み込まれたCPUだろうか。

   

240608e

 

DPU(Data Processing Unit : データ処理ユニット)というのは、GPUよりもCPUに近いチップみたいだけど、データセンターでの処理やネットワーク機能に強くて、内部にCPUその他を組み込んでるらしい。

  

同じような製品でも、インテルではIPUと呼ぶとかいうお話。Infrastructure Processing Unit だから、情報基盤処理ユニットとか。この方が分かりやすい名前かも。例えば、一般の個人向けの端末内部には無さそうなことがすぐ分かる。

    

   

     ☆   ☆   ☆

というわけで、社会人としてはますます半導体の勉強が必要らしいけど、いまだに半導体という言葉の産業的な意味がピンと来ない。おそらく、物質としての半導体の性質の説明ばかりが強調され過ぎてるからだと思う。

   

重要なのはむしろ、半導体を用いたデジタル関連製品の方なのだ。各種の製造装置や用途、サービスまで含めて。それでは今日はそろそろこの辺で。。☆彡

    

    (計 2405字)

| | | コメント (0)

ChatGPT-4oが音声と画像認識を利用して家庭教師、三角関数(三角比)のsinを英語で教えるビデオ動画の解読

3日前に発表されたばかりのOpenAI社の最新ヴァージョン、ChatGPT-4o(フォーオー)。まだ少ししか使ってないけど、とりあえずの印象はいい。反応がハッキリと速くなってる。欠点は、ヴァージョンの名前の入力が面倒で読みにくいことくらいか♪

    

日本語版だとまだ実装の前だと思うけど、音声の入力・出力や画像認識もレベルアップするらしい。そこで今日は、数学の家庭教師をする様子の英語ビデオ動画を解読してみよう。

   

私は最初、その英語の聴き取りをGPT4oにやらせようとしたけど、ほぼ失敗。新型iMacにGoogle Chromeを導入して、「ChatGPTの音声コントロール」という拡張機能もインストールして、タブレットから音声を流したけど、聴き取りの精度が低いし速度も遅くて使いものにならなかった。

   

GPT4oに頼んでも、音声入力してテキストに変換してくれというばかり。「この音声の英文を聴き取って表示してください」という指示には対応できなかった。近いうちに、それも可能になるのかも。

   

   

     ☆   ☆   ☆

オープンAI社の公式サイトのトップに置かれてるGPT4oのPR動画の中で、数学の個人授業を行うデモンストレーションは、インド人らしき父親と子どもが相手。Sal and Imran Khan。

   

父親が、問題の答を教えるのでなく、なるべく息子自身に考えさせるように教えて欲しいと頼むと、AIが女性の音声で分かりましたと応えた。「Of course, I'd be happy to help. Let's look at the problem together.」。

    

英語はかなり聞き取りやすいものになってたけど、アプリのOtterも使用。ただしアプリは、三角比・三角関数の専門用語の聴き取りや堅い表現に苦戦してたから、私の耳と頭で補った。

    

240518a

   

   

    ☆   ☆   ☆

コーヒーカップにオープンAI社の大きなロゴが付いてる辺り、宣伝にも気を配ってる♪

    

240518b

   

タブレットには、直角三角形が1つ書かれてる。右下の鋭い角α(アルファ)に対する斜辺・底辺・対辺(高さ)が生徒に分かりにくいように、わざと斜めにしてあるんだと思う。

    

ちなみにNHKが無料公開してる高校講座の動画を見ると、分かりやすく表現してた。直角三角形の「高さ」を「対辺」と呼ぶのは珍しいと思うけど、英語だと opposite (side) だから、直訳すると対辺になる。斜辺hypotenuse(ハイポトゥニュース、角の方向に伸ばしたものという意味)、底辺adjacent(アジェイスント、隣接)。

 

240518c

   

    

    ☆   ☆   ☆

問題は、sin α(サイン・アルファ)の値を求めなさいという簡単なもの。Find sin(α) in the triangle 。角度 α の正弦。少年は、演技じゃなくて、本当に分からないように見える。

   

AI女性講師はまず、「角 α に対して、三角形のどの辺が対辺・底辺・斜辺なのかを認識しましょう」と話しかける。 identify which sides of the triangle are the opposite , adjacent and hypotenuse , relative to angle alpha。「どこが斜辺でしょうか?」。

  

すると少年が、よく分からないけどここかなと、底辺をペンで赤色に塗ったから、AIは「惜しい」(You're close)と励ます。「正しくは、辺ACは底辺と呼ばれます」(Actually side AC is called the adjacent side)。

   

    

    ☆   ☆   ☆

さらに、「斜辺は一番長い辺で、直角の反対側です」と優しく誘導。Hypotenuse is longest side of a right triangle and is directly opposite the right angle 。そこで少年は、斜辺をペンで青く塗る。

    

240518d

   

対辺(高さ)も分かったから、緑色に塗る。「素晴らしい推論!」(Great deduction)。後は、斜辺と対辺の長さを25と7を公式に当てはめて終了。「あなたは見事に3辺を理解して、サインの公式も使用できました」You did a great job of identifying the sides and using the sine formula.

    

sin α = 対辺/斜辺(O/H) = 7/25 。辺の長さが25、24、7の直角三角形というのは、日本だと滅多に見かけない。

       

240518e

        

240518f

   

というわけで、日本人にとっても、数学の英語の勉強になった。私は、中国語とかアラビア語とか、難しい言語を教えてもらいたいと思ってる。できれば日本人の女の子のカワイイ声で、萌えモードで♪ アバターもそろそろ期待!

   

凄い時代になって来たなと実感しつつ、それでは今日はこの辺で。。☆彡

   

     (計 1910字)

| | | コメント (0)

文章の指示(プロンプト)からリアルな動画を作成、オープンAIの生成AI「Sora(空)」をチェック(間違い探し♪)

(17日)WALK 5km(荷物 5kg)

     

1年ほど前から対話型生成AI「チャットGPT」で世界を揺るがし続けてる、オープンAI社(Open AI)。正直、この会社だけでも話題が多過ぎるけど、今回はかなり反響が大きいように見える。

   

たぶん、数十のサンプル動画の冒頭で、いきなり日本っぽい繁華街の映像が披露されたことも関係あると思う。しかも、この種の話が好きな男性の目をキャッチできそうな、美人女性を中心にして。

   

私は10本くらいのネット報道を見たけど、大まかな印象みたいな記事内容がほとんどになってた。例えば、動画の解像度はどうなってるのか、何がリアルな現実と違うのか、情報の具体性が足りないのだ。そこで、この記事では、報道に欠けてる部分に焦点を絞って簡単にレビューしてみよう。感想というより、細かいチェック。

 

   

     ☆   ☆   ☆

誤解を避けるために最初に書いておくと、私は去年の春、新モデル発表が大きな話題になった時から、有料サブスクでChatGPT(model4)を使ってる。日本円で約3000円の料金の半分くらいは寄付のつもりで、支払い継続中。

    

つまり、アンチどころか、オープンAIに対して好意的な人間なのだ。ただ、有料で使ってるからこそ、静止画像の関連での実力不足には不満がある。静止画で苦戦してるのだから、動画ですぐ成功するとは思えない。

   

実際、東京の動画2本を分析すると、多くの報道の論調とは違って、まだまだ開発段階に過ぎないなと思った。すぐフェイクだと分かる。あまり遠くない内に修正できるだろうけど、リアルと区別がつかないレベルまで到達するのは、簡単ではない道のりだと思う。

   

リアルでなくてもいいのなら、既に合格レベルだろう。著作権その他の社会的問題を除けば。。

      

    

     ☆   ☆   ☆

240218a

    

まず、最も話題になってる感じの上の映像。渋谷109の前のY字型三叉路と、駅前のスクランブル交差点と、センター街を混ぜて作ったようなイメージ。

    

ちなみに、Soraのトップページ最上段は下図のようなPR動画(紙飛行機の鳥の群れ)で、そのすぐ次が上のサンプルになってる。

   

240218i

   

「プロンプト」(命令文、内容を指示するテキスト)は次の英文。「スタイリッシュな女性が東京のストリートを歩いてる。周囲は、暖かく輝くネオンや電光掲示板に囲まれてる。彼女は黒いレザー・ジャケットを羽織って、赤いろんぐドレスをを身にまとい、・・・」。

       

240218j

  

この動画、私は新型iPad Proで拝見。ブラウザがChromeだとダウンロード出来なかったけど、標準のSafariに切り替えたらダウンロード出来た。解像度は1920×1080ピクセルで、全体のデータ量は48MB。

    

1分でこれだから、もし60分だと3GBほどになって、DVDレベルに到達。実写と比較すれば、ほとんど時間もお金もかけずに。。

      

  

     ☆   ☆   ☆

私がこの1分の動画を見て、最初に気付いたのが、両脚の運びがちょっとおかしいこと。右足と左足がぶつかるような感じで動いてて、現実と違うのはすぐ分かる。彼女の左脇に見えるワイドパンツの歩行者も明らかにおかしい。脚にまとわりついて、転倒しそうになるはず。

    

決定的なミス、エラーは、冒頭から16秒くらいの箇所で、私は一瞬で気付いた。

  

240218b

  

上のカットでは、右足と右の太腿を前に出して、左足が後ろに下がってる。この時点でもう、左右の足がくっつき過ぎてるのだ。

  

240218c

  

上のカットは、その一瞬後。ここで、左右の足と脚がごちゃ混ぜになってる♪ 前側の太腿は、右だったはずなのに、左に変わってる。だまし絵みたいな構図。

  

240218d

   

上のカットでは、完全に左右が逆転。右足が前、左足が後ろだったはずなのに、左足が前で右足が後ろになってしまってる。

   

240218e

   

で、平然と後ろの足が右前へと出て来るのだ。結局、後ろに引いた左足が、右足として繰り出されてる。オシャレなショートブーツとロングドレスを身につけてるのに、足元の水溜まりや水はねを気にせずに歩いてるのも不自然。

   

他にも、横断歩道のペイントが不自然だし、看板の文字はほとんど読めないし、路面の格子模様も歪んでる。さらに終盤、彼女の顔がアップになって、しみや吹き出物が目立つのだ。スタイリッシュな女性なら、もし肌が荒れてるとしても、ファンデーションとかの化粧で隠す方が自然。もちろん、こんな指摘はメディアでは難しい(ルッキズム批判、男女差別批判)。

    

これではまだリアルとは言えない。ちなみに私がそういった欠点にすぐ気付くのは、もともとドラマの映像分析をやって来てるし、AIの静止画でその種の欠点をよく見てるから。片足が無かったり、手が3本あったり、指が4本とか6本になってたり、明らかにおかしいAI画像を見てるから、動画でもすぐに分かった。ChatGPT4も、よく変な画像を示して来るのだ。

       

   

      ☆   ☆   ☆

続いて、また東京の動画。AIの名前「Sora(空)」もそうだけど、トップのサム・アルトマンが日本びいきなのか? 同じ解像度で、こちらは17秒しかないのに、なぜかデータ量は53MBもある。それだけ複雑な画像の連続ということか。桜の花びらとか、雪道の微妙な凹凸とか。

     

240218f

   

プロンプトは次の通り。「美しい雪の東京が賑わってる。カメラは賑わうストリートに沿って移動・・・」。

  

240218k

  

こちらも一見、美しい映像に見えるけど、すぐ遠近感がおかしいと思った。特に、手前のカップルが巨大すぎて、ミニチュアの街並みを進む怪獣みたいに見える♪ そのまま進むと、女性の顔がお店の赤い軒(のき、ひさし)と衝突するはず。逆に、左側の自販機みたいなものや小さい出店みたいなものは、オモチャみたいに小さく描かれてる。右の看板の日本語も意味不明。

  

240218g

  

ところが、女性の頭部や肩はスルッと屋根の左に出る。ただ、軒の上まで肩が出てしまってる。遠くの人物を見ても分かる通り、当然、本来ならカップルの頭あたりは軒下のはず。   

   

240218h

  

このままカップルが進むと、なぜか道を塞いで作られてるお店に入ることになるけど、それにしてはお店が小さい。あと、右側の乾いた歩道との間にかなり低いガードレールみたいなものが伸びてるのもおかしい。低過ぎるし、ジャマで危ない。歩道の白いペイントもおかしい。

   

    

     ☆   ☆   ☆

というわけで、まだまだ開発段階のAIシステムだと簡単に分かる。しかし、本当にリアルな動画の生成はもう「時間の問題」なのは確実。大まかに見るなら、数年程度か。1年~10年程度の幅に収まるはず。

    

当然、文章がほとんどの個人ブログなんてものは、AIでも簡単に書けてしまう。人間はどうすべきか。どうなるのか。まだ真剣に考えてる人はほとんどいないように見える。実際、Yahoo!に配信された多数の記事の反応も、あまり目立たない。芸能・政治・スポーツのネタとかと比べると。

     

だからこそ逆に、非常に危険でもあるのだ。例えば核兵器なら、誰でも非常に危険だとすぐ分かるけど、AIだと素晴らしさの方が目立ってしまうから。とにかく、今後も私は注視し続ける。実際に自分で色々と使ってみながら。

   

なお、今週は計14696字で終了。ではまた来週。。☆彡

   

      (計 2908字)

| | | コメント (0)

ChatGPTみたいなAIが人間の寿命の予測に成功(78%)と聞いて、GPT4自体に予測を質問してみると・・

小さい頃から、自分の命、寿命についての考えは揺れ動いて来た。一方では、たぶん「早死に」(はやじに)するだろうなと思ってたけど、他方では、100歳まで元気に生きたいなとも思う。

   

100だと、キリのいい数だから♪ あと、100歳を超えると、もう完全に衰えて、生きてるだけみたいになってしまうのが微妙なのだ(個人の感想の一部)。食べて、テレビ見て、寝るだけ。身体のあちこちに不調を抱えつつ。

     

もちろん、明石家さんまの名言の通り、「生きてるだけで丸儲け」とも言えるけど、それは自分1人の観点。あまり長生きすると、周囲の人達に迷惑をかけ過ぎだとも考えてしまう。

   

当然、それは迷惑とは言わないとか、その迷惑は悪くないとか、そうゆう考えもある。というわけで、寿命については微妙、矛盾的、アンビバレント(両面価値的)なのだ。早めに死にそう、早めに死に・・(サイバーパトロール対策♪)、100歳まで生きたい。。

    

    

     ☆   ☆   ☆  

231227a

   

さて、突然こんな事を書いてるのは、別に何か悩んでるからではない。相談相手や解決策を求めてるわけではないのだ。これもパトロール対策♪ お疲れさまです。気にしないでくださいね! 単なるAI記事の前フリなんで。

    

そう。私自身も急激にAIへの興味が膨れ上がってるけど、実は、古い壊れかけのWindowsパソコンでブラウザ(Edge)を立ち上げると、いきなり目の前に「ChatGPT」というタブが表示されるのだ。私の設定じゃなくて、MicrosoftとOpen AIのつながりが深いから。

   

で、上の寿命を予測するAIという記事も、最初はEdgeがおすすめして来たもの。正確な予測なんて出来るわけないのは当たり前として、10年単位くらいの大まかな予測なら可能だろう。的中率は6~7割とか、微妙なレベルで。

  

GetNaviの記事「寿命と年収を予測する『AI』が誕生! 当たる確率は驚きの・・・」で紹介されてたのは、デンマークと米国の共同研究。デンマーク統計局の600万人のデータで訓練されたAI、「life2vec」。

  

元ネタは英国メディア、Daily Mail。このデイリーメールの記事は過去、面白くて適度に詳しいことが多い。明らかに日本のネット上のメディア記事よりは上。情報源もそこそこ明示してあることが多い。

   

    

      ☆   ☆   ☆

231227b

  

上がその英文記事。「Scientists invent doom calculator that can predict when you'll DIE and how much money you'll earn with 78% accuracy」。

  

あなたがいつ死ぬか、いくら稼ぐのか、78%の正確さで予測できる運命計算機を科学者たちが発明。

   

この見出しでAIという呼び名を使ってない辺りも、日本のメディアとは違ってる。元の科学論文で、AIという呼び名を前面に出してないことに配慮してるのだ。流石だと思う。

   

ただし、Chat GPT という言葉はまとめの最初に挙げてある。要するに、数値データとかではなく、文章(センテンス)で入力して、文章で出力するということだろう。中身が本当に似てるかどうかは、企業秘密だからか分からないはず

   

   

     ☆   ☆   ☆

231227c

   

もちろん、日本のマニアックブロガーも、直ちに原論文をチェック♪ Nature Computational Science(ネイチャー・コンピューター科学)に掲載された、「Using sequences of life-events to predict human lives」。

   

sequences(シーケンスの複数形)という言葉が訳しにくいけど、ここでは人生の色々な出来事の連続とか系列、シリーズ(複数)のことを指してる。歴史という言葉より、理系的・工学的な表現。あえて見出しを日本語に訳すなら、「生における一連の出来事を利用して、人間の生を予測」。AIどころか、計算機という言葉も入ってない。

        

この論文自体は有料だけど、そのプレプリント(査読を経て学術誌に掲載される前の原稿)は無料で公開されてる。最近では、学術論文あるあるの事。要するに、一刻も早く公開したいということ。特に自然科学系だと、権利や利益の問題と絡むから。

     

231227d

   

プレプリントの図を見ると、シーケンシズというものがイメージしやすくなる。労働がどう移り変わって来たか、健康状態はどう変化して来たか、年齢を横軸に取って、それぞれの連続体を構成。その全体をAIみたいなものがまとめて、予測するらしい。

    

231227e

   

   

     ☆   ☆   ☆

残念ながら、この life2vec は公開されてないけど、生命保険会社とか、開発して(密かに)使ってる可能性がある。原理的には単純で、対話型AIほど複雑な会話も要求されてない。

    

そこで、毎月20ドルもの大金(笑)を投資し続けてるサブスクのChatGPT(model4)に聞いてみた。ニュースを教えて、同じような予測ができますか?、お遊び感覚でいいから、と。最近さらにレベルアップしてるAIだけど、たぶん予測できないと断って来るだろうな・・とか思いつつ♪

  

Img_4597

  

すると、予想通り、断って来た (^^ゞ その辺り、ガードが堅い。余計なトラブルを抱え込みたくないと。

  

こんにちは! そのような研究があると聞いて興味深いですね。ただ、私のトレーニングや機能はそのような予測を行うためには設計されていません。私は一般的な情報提供、文章生成、言語処理などを行うAIで、医療や健康に関する個別の予測をする能力は持っていません。

 

それに、人間の寿命を予測することは非常に複雑で個別の要因に依存するため、正確な予測を提供することは難しいです。私にできるのは、健康やライフスタイルに関する一般的な情報やアドバイスを提供することです。他にお手伝いすることがあれば、お知らせください」。

   

私もすぐには引き下がらず、創作した具体例を入力して、こう聞かれたら何と応答しますか?、と聞いてみた。すると、やっぱり上のような一般論を返して来て、何歳まで生きれるとか、いくら稼げそうとかいう具体的な数字や見通しは示さなかった。

   

   

     ☆   ☆   ☆

別に、予測というもの全体を回避してるわけでもなくて、命とかお金とか、重大な影響を及ぼす恐れのあるものは回避してるらしい。試しに、他の予測を2つ求めてみたら、それなりに具体的な予想を示して来た。

   

毎月3000円弱の料金だと、こんなもんか♪ というわけで、とりあえず野菜をたっぷり食べて、適度な運動をすべきだということ♪ 私の場合、そんな事より生活リズムや睡眠の乱れを直すことの方が一番かも。

  

それならAIもデータも必要ないだろ・・とか思いつつ、今日はそろそろこの辺で。。☆彡

    

      (計 2727字)

| | | コメント (0)

Python(パイソン)入門3~乱数を利用した、じゃんけんゲーム作成など(生成AI・ChatGPT4も使用)

前回の2本目の記事から1ヶ月も経ってしまったが、人気のプログラミング言語「Python」(パイソン)の3本目の記事を書くことにしよう。 1本目の記事2本目の記事は、次の通り。

  

 Python入門1~人気プログラミング言語を高校教科書副教材とオンライン環境Bit Arrowで簡単に

  

 Python入門2~高校副教材とオンライン環境Bit Arrow、さらにAI(ChatGPT4)も使用

   

最初から、高校の副教材『Python入門』(東京書籍,2022年)と、オンライン環境「ビットアロー」を使用。前回からは、対話型の生成AI、ChatGPT(model4)も参照。今回も、ChatGPT4を参照した。

   

これまでの感触だと、ネット情報の通り、GPT4のプログラミング能力は高い。というより、数ある能力の中で、プログラミングの能力が一番高いような気もする。全く間違えてないし、余裕を感じるのだ。

  

つい最近、GPT4は画像も扱えるようになった。試しに、Pythonの簡単なプログラムのJPEG画像を2枚見せたら、どちらも正確に説明。完全に読み取ってる。ただ、ちょっと回答のスピードが遅くなったから、まだ画像の読取は負荷が高いらしい。

  

    

      ☆     ☆     ☆

では、プログラミングの話に入ろう。数を1つ与えて、それが3か2の倍数なら、「3か2の倍数」と表示するプログラム。if文の条件に、論理演算子(=結合子)orを使う練習。

     

231006a

   

テキストでは、もっと半角スペースを多用してるが、面倒なので、上では少し省略。3の倍数という条件は、3で割った余りが0(x%3=0)と考えてる。x=9で実行した結果は、下の通り。

    

231006b

   

   

      ☆     ☆     ☆

次に、aとbの値をキーボードで入力して、a+bの計算結果を表示するプログラム。

   

普通に4とかインプットするだけだと、数ではなく文字として扱ってしまうので、足し算ができない。input関数で数字入力した後、int関数を使って、数へと変換する必要がある。入力の箇所の書き方(a->)は、おそらく色々あると思う。ここではテキストに従った。

      

231006c

    

実行して、aに5、bに8を入力すると、13という正答を表示した。

  

231006p

   

231006d

  

上のプログラムの画像を、ChatGPT4に入力すると、正しく説明して来た。画像の処理については、プログラミング以外も含めて、わりと近いうちに別記事を書く予定。ここでは簡単な報告に留める。

    

    

      ☆     ☆     ☆

続いて、1以上8未満の整数のうち、奇数をすべて表示させるプログラム。変数の範囲を示すfor文と、条件を示すif文を組み合わせる。「未満」というのがちょっと分かりにくい。この後の別のプログラムだと、「以下」になるので、余計に混乱する。

     

奇数は、2で割った余りが0でない(!=0)と考えた。「でない」という否定表現を使いたかっただけで、余りが1である(==1)と考えてもいいはず。1以上8未満の整数で実行すると、1、3、5、7と縦に並んだ。間を空けて横に並べる方法はまだ知らないが、GPT4に聞けばすぐ答えると思う。

          

231006e

   

231006f

   

上のプログラムの画像も、GPT4は正しく説明できた。

    

    

      ☆     ☆     ☆

そして、今回のメインである、じゃんけんゲーム。グーを0、チョキを1、パーを2で表現。相手(コンピューター)には、乱数を発生させるrandom.randint関数を使って、0以上2以下の整数のどれか1つを選ばせる(未満ではないので要注意)。自分は、どれか1つの数を入力。

        

まず、aite(相手)とjibun(自分)の手を示すだけのプログラムを実行して、1(チョキ)を入力。一番最初に、乱数を使うための準備として、randomモジュールという仕組みをインポートする。

     

231006g

    

231006h

  

上の場合、相手は2(パー)で、自分は1(チョキ)だから、勝敗は自分の勝ちとなる。この、じゃんけんの勝敗まで表示するプログラムは、例えば、次の通り。勝敗の決定には、if文を三重に使用。

     

231006i

     

勝ち負けの結果(result)は、(3+jibun-aite)%3の値で決めることが可能。最初に3をプラスするのは、マイナスを避けるため。

  

例えば、相手が1(チョキ)、自分が0(グー)なら、(3+0-1)%3=2%3=2で、自分の「勝ち」となる。テキストでは、結果を数で表すだけになってたので、勝敗は日本語で表示するように改良した。

    

3回やって、引き分けが2回続いた後、負けで終了。私は1(チョキ)、コンピューターは0(グー)だった。

  

231006j

   

   

      ☆     ☆     ☆

最後に、ChatGPT4を使用。まず、下のように、じゃんけんゲームに関して長めの説明を入力。自由にプログラミングさせてみた。この日本語の説明を素早く読み取って対応できるのは、素晴らしい能力だと感心。青・緑・赤・黄色・白・グレーの色分けも分かりやすい。「コンピューター」と「あなた」のじゃんけん。

      

231006k

     

231006l

    

231006m

  

プログラムの中に日本語の説明を加えて、グー、チョキ、パーという言葉も入れて、自分の入力が0、1、2のどれでも無い時にはエラー警告を出せる仕組みになってる。右に長く伸びてる部分はカット(省略)した。

     

勝ち負けの判定には、普通の場合分けを利用。勝ちは、自分が0(グー)で相手が1(チョキ)か、自分が1で相手が2(パー)か、自分が2で相手が0グーの時。・・・or・・・or・・・の形。丁寧なプログラムだが、人間にとってはやや長過ぎる気もする。

     

    

      ☆     ☆     ☆

上のプログラムを書かせた直後、私が書いたプログラムを入力してみた。画像ではなく、文字入力。すると、(3+jibun-aite)%3という処理まで正確に理解して、私の細かい入力ミスまで指摘して来た。やさしく、気を使いながら♪

      

231006n

     

    

231006o

   

私はうっかり、全角でプラスを入力してしまったのだ。普通のプログラミングのシステムなら、エラーとしてチェックして来る所を、優しくアドバイス。人間の先生でも、ここまでの配慮は難しい。

   

「注意していただきたいことがあります: 一部の環境では・・・正しく認識されないかもしれません。通常の半角の’+'を使用することをおすすめします」

  

  

      ☆     ☆     ☆

プログラミングの家庭教師として考えても、安くて優秀。長時間労働でも追加料金なし。円安が痛いだけ♪ 1ヶ月20ドルが、今の為替レート(1ドル、約150円)で3000円になってしまった。

   

というわけで、プログラミングでも画像関連でも、もっとGPT4を使って行く予定。それでは今日はこの辺で。。☆彡

    

       (計 2636字)

| | | コメント (0)

3年連続中止の数学甲子園の2019年・予選問題、2つのAIに解かせると大苦戦(ChatGPT4、Wolfram Alpha)

コロナ禍に加えて、参加者の不正行為事件があったとはいえ、数学甲子園が3年連続で中止されたのは残念だった。しかも、前の2年と違って、今年(2022年)は公式サイトに何のアナウンスも出てない。

  

大声を出すし、身体の接触もある野球の甲子園でさえ、今年は普通に開催されてたのに、どうしたことか? 晴れ舞台への挑戦が消えてしまった高校生の皆さんは、気の毒だと思う。まあ、昔は大会が無かったし、数学の甲子園なんて考えもしなかっただろうけど。。

   

    

      ☆     ☆     ☆

このブログでは2019年まで毎年、数学甲子園について、詳しくて具体的な記事をアップして来た。単なるニュースのまとめや感想ではなくて、多くの問題について解き方を説明。途中の計算式もある程度は載せてた。

      

このまま忘れ去るのも残念なので、今年は3年ぶりに記事を書いてみよう。もちろん、大会は無かったから、直近の2019年の予選問題について。この年は、予選で4本のブログ記事を書いてた。

   

今年わざわざ新たに書き足すのなら、やっぱり話題のAIを使うべき。ChatGPTのmodel4(有料サブスク・バージョン)と、しばらく使ってなかった Wofram Alpha(ウルフラム・アルファ)。どちらも米国製という辺り、日本人としては淋しい感もある。

   

    

      ☆     ☆     ☆

ではまず、予選の問題1。当時のウチの記事2本目からコピペする。

  

問題1 次の式を因数分解しなさい。

 a²(c-b)+b²(a-c)+c²(b-a)

    

    

明らかに簡単な問題で、高校1年の教科書レベル。予選の最初だから、ウォーミング・アップ用だろう。

   

AIにとっても簡単だろうと思ったら、そうでもなかった。まず、ChatGPT4の回答。

    

230915a

   

最初の式の展開で、いきなり大きく計算ミス。一応、最後まで見ておこう。

  

230915b

  

なぜか、カッコの左側のcが消えてる。おそらく、「・・・=0」の形の方程式の処理と混同して、両辺をcで割ったのだろう。初心者の高校生がやるようなミスで、私も最初はこんなミスをやってた気がする。

   

それより、そもそも最後の答らしき式が、因数分解とは言いにくい。先頭にマイナスをくくり出してるから、-1を因数と考えてるのか♪ あるいは、消してしまったcも考慮して、先頭が-cだと考えてるのか。

  

私はこの後、何度もやり取りして、AIに教えたけど、正解に行き着くまで大変だった。とにかく、簡単で単純な計算ミスが非常に多い。

  

   

      ☆     ☆     ☆

一方、以前からあった数学中心のAI、ウルフラム・アルファなら簡単に解くかと思ったら、どうも自然言語の処理が全くレベルアップしてないようだ。

   

230915c

  

「自然言語」入力すると、因数分解だと理解できてない。「数学入力」でも、元の問題文のままだと理解できず。

   

公式サイトのトップに挙げられてるサンプル通りのたずね方に直すと、ようやく正答。キレイな輪環形になった。ただし、途中の説明はない(無料だと)。有料だと一応、途中の説明もあるらしいけど、対話型AIほどの会話能力はなさそう(未確認)。

      

230915d

   

   

      ☆     ☆     ☆

続いて、問題2。循環小数を既約分数で表す。これも、全体的に奇妙なほど難しかった2019年の問題の中では、明らかに簡単。

     

数学定数の1つにネイピア数eがあり、その値は e=2.718281828459 と無限に続きます。eを近似する循環小数2.718281828・・・を既約分数で表しなさい。

  

   

これは、元の問題文だと、数字の上の小さい丸点で循環部を示してるので、少し補足してChatGPT4に聞いてみた。

   

230915e

   

230915f

   

この問題では、循環する部分を分けて考えない方が簡単だけど、それは良しとしとこう。ハッキリ間違ってるのは、循環部分を0.1828としたこと。正しくは、0.01828だ。最後まで見ておこう。非循環部分を計算して、循環部分と通分して足し合わせた後、分母・分子を約分。

   

230915g

   

これは、通分で間違えてる。分母の9999が、いつの間にか10000になってるのだ。近似値の計算方法と混同してるのかも。最後に出した答を小数に直せば、誤答だと分かったはずだけど、その検算の作業もなし。

   

    

一方、ウルフラム・アルファは、問題を理解できなかった。単なる「約分」という単語として認識してるらしい。かなり簡単に言い換えたつもりだけど、まだ私の問い方が不親切なのかも。サンプルには類題が見当たらず。

   

230915h

   

    

      ☆     ☆     ☆

最後に、問題20。4年前に書いた4本目の記事よりコピペ。これも簡単な問題を選んだけど、2つの放物線の共通接線を求める問題は、解き方によって所要時間が大きく違って来る。

      

f(x)=(1/2)x²、g(x)=x²+2xー7とします。曲線y=f(x)上の点(a,f(a))におけるy=f(x)の接線と、曲線y=g(x)上の点(b,g(b))におけるy=g(x)の接線が一致しました。このような接線の方程式をすべて求めなさい。

  

    

230915i

   

これは、それぞれの接線の式を書いて、それらが完全に一致すると考える解き方で、正しいけど、遅くて面倒で下手。それはいいとして、この後が笑えた♪

   

   

     ☆     ☆     ☆

230915j

  

途中で止めてしまってる。面倒だったのではなく、人間の勉強の手助けをしてるつもりだろうけど、ここから続けろと言われても、鉛筆が止まってしまう高校生・受験生が多いはず。大学生でもあまり変わらないと思う。

  

とにかく、「私ではなく、あなたがその先に進んで、最後の答を出してください」と入力すると、次のように続けて来た。

 

230915k

   

   

計算を間違えてるし、ルートの書き方がブレて変になってるので、以下はもう省略しよう。-b・(2b+2)の展開で間違えてしまってる。正しく計算すれば、(a,b)=(4,-8),(-8,32)になってたはず。

   

最後に、より良い解き方を教えると、「おっしゃるとおり・・・・・・ありがとうございます」と丁重に長く回答。日本語の文章の滑らかさだけは、多くの人間を超えるレベルで素晴らしい。

 

   

なお、ウルフラムは、この問題も日本語の意味が伝わらないようだった。英語では試してないけど、どうもここ数年、サイトのデザインも(ほとんど)変わってないようだから、調べる気がしない。開発競争で取り残されてるのかも(個人の感想♪)。

   

230915l

 

   

      ☆     ☆     ☆

というわけで、高校数学に関しては、対話型でもそうでなくても、AIの能力はまだまだ不足してる。上で解かせた3問は、数学甲子園の予選20問の中でも簡単な問題だから、難しい問題はもう無理だろう(未確認)。

   

しかし、非常に進歩のスピードが速いのがAIの特徴。多くの人間が、数学でAIにかなわなくなるのは、もう時間の問題だと思う。遅くても5年後くらい、早ければ3年以内か。それでは今日はこの辺で。。☆彡

    

      (計 2740字)

| | | コメント (0)