ChatGPTをはじめとするいわゆる大規模言語モデル(LLM, Large Language Model)については「専門外」(自然言語処理は本当に専門外なので)であることをあらかじめお断りした上で門外漢としての印象を書いてみます。

 で、感想ですが、各企業が内部で持っていたLLMで同等の性能を実現していたものはあった可能性はありそうな気がするのですが(ChatGPTより前にちょっと話題になったLaMDAとか)、対話に特化したインタフェースを提供したことと、RLHF (Reinforcement Learning from Human Feedback)みたいな強化学習系の技術を色々組み込んだことで、多言語で凄く流暢な応答ができるようになったことが大きいんではという気がします。

 それ以前にLLMを普通のユーザーが気軽に試せる機会がほぼ無かったというのもあるかもしれませんが。

 プログラムや既存文章を対象に加工する処理タスク(解説、要約、修飾、誤字発見など)の性能があまりにもずばぬけていることも大きいです。

 将棋に喩えるのが適切かはわからないのですが、感覚としては概ね間違ってないような気がします。

2023/03/10Posted
Loading...
Send anonymous messages to kmizu

Please read and agree to the Terms of Service and Privacy Policy before using.

Loading...