個人的にこれは途方もない潜在能力を持ったアプリケーションだと感じました。

僕の理解が正しければChatGPTも規模が大きくなっただけで言語モデルであることには代わりありません。言語モデルというのはスマホで日本語入力をしている時に予測入力補完が出してくる機能などにも使われているものです。

大量の会話例を読ませる事でその会話の続きを自動生成していけるという言語モデルの教師データとパラメータ数を拡大していくだけでは例えばこの結城さんの会話例のような、知性を感じさせるような会話はできないと理解しています(僕は自然言語処理の専門家ではないので断言はできませんが)。何か明かされていない学習上のブレークスルー(データセットの用意の仕方等)があったのではないかと推測していますがそのタネを掴んだという話は今の所観測できていません。imosさんも学習のさせ方に興味を持ったようでいくらか実験的なクエリを試していました。

人間に知性を感じさせるインタフェースというのはかなり高いインパクトを持っており、そもそも人間は知性を持った相手とは何らかの文脈を築き会話を用いて超高次元な論理空間の中で意味を伝えあって意思疎通をしています。「背中掻いて」「ここ?」「もっと右上」「そう、あとちょっと左上も」みたいな感じで、会話の中で文脈を作って状態を変えていくことで複雑なやり取りを無意識に行っていますが、過去に人間にその文脈を共有できていると意識させ得たアプリはこれまで世の中に出回っていなかったと思います。

これまでのサービスは人間が例えば電車の乗換案内アプリを立ち上げるとか「アレクサ、ジャズを再生して」と話しかけるとか検索の絞り込みワードを足し引きして調整するといった方法であの手この手で人間からコンテキストを引き出して問題空間を狭めた上でソフトウェア自体が持つべき情報量と予め揃えたデータセットとユーザーに見せるインタフェースの間でバランスを取る事がアプリケーション企画者の腕の見せ所のような側面がありましたし、そういう世界観の中で例えば地図とか電卓とかニュースとか音楽プレーヤーとか様々なアプリが開発されてきました。

スマートスピーカーの持つ音声対話インタフェースは識字率の低い地域へも情報サービスを届けられる可能性があるとして大いに注目されていましたが、そもそも会話が成立する条件が限られるので結局私はスピーカーの中に人が居るかのような扱いはできず特定の呪文を覚えたり登録したりして唱える用法ばかりになってしまいました。

ChatGPTのように任意の自然言語を受け取って応答するインタフェースは今度こそ様々なアプリの統合的な玄関として機能するかも知れません。過去のサービスではユーザのニーズを少しでも上手く早く叶える為に細かいインタフェースのチューニングやアンケートやA/Bテストなどをたくさん行って来ましたがユーザーがサービス側の知性を信用して細かい注文を初めから付けてくれたらそもそもどんな改善が求められているか明らかにわかるようになります。これはサービス提供者としては革新的な出来事です。

長々と書いてきましたが、短く言い換えるとこうです。「機械が出した答えにケチを付けれる」という些細に見える改善は潜在的にものすごい可能性を秘めているのではないかと大いに熱視線を向けています。

それとここは日本ですからGPTを用いて喋る2次元のキャラクターなんかは今現在どこかで猛スピードで開発されていてもおかしくないですね。どんな面白い会話ができるか今から楽しみにしています。

2年

利用規約プライバシーポリシーに同意の上ご利用ください

熊崎 宏樹さんの過去の回答
    Loading...