ChatGPTの賢いバージョン!?〜『GPT-4』は何がすごいのか〜
こんにちは!
システムズナカシマでインターン生、中嶋です。
ただ今、テクノロジーについて勉強中。こちらのブログでは、学んだことをシェアしています。
以前、2022年11月に公開されたOpenAI の『ChatGPT』について、3回に分けてブログを書きました。その後、ChatGPTは日本でも広く知られるようになり、SNS等でも「ChatGPTがすごい!」と大人気ですね。
ChatGPT、皆さんは使ってみられたでしょうか。
今回のブログは、ChatGPTの進化のお話です。
ChatGPTは、会話生成、質問への回答、プログラミングのコード生成から、小説やポエムなどのクリエーションまで、多様なタスクに対応できるわけですが、これを可能にしているのは、OpenAI が開発した言語モデル「GPT-3.5」です。
2023年3月15日、OpenAIは次のバージョンである「GPT-4」を公開しました。
GPT-4は、GPT-3.5よりも、さらに大規模なモデルであり、GPT-3.5よりも遥かに進化しているとか!
では、具体的には、何がすごいのでしょうか。
まず、GPT-3.5とGPT-4の1番の違いは、GPT-3.5はシングルモーダルで、GPT-4はマルチモーダルだということです。
えっと…。「モーダル」って?
モーダルは、AIへの入力情報の種類(画像、音声、テキストなど)です。
「マルチ」は複数という意味ですので、「マルチモーダル」とは、複数の種類の情報を一度に処理するA I技術を持っているということです。
GPT-3.5までのバージョンは、テキストのみを扱うシングルモーダルでした。が、GPT-4は、文章入力ができるだけでなく、画像(写真や図解、グラフなど)を入力をすると、それらを読み取り理解した上で、その内容をテキストで説明してくれるのです。
これが、GPT-3.5とGPT-4の大きな違いです。
それだけではなく、GPT-4は、あらゆるタスク処理のスコア結果(正確性、創造性、知性)が、GPT-3.5に比べて非常に高いという特徴があります。
GPT-3.5を使ったChatGPTについては、「すばらしい!」という賞賛の声と共に、「間違った情報を、自信満々に回答することがある」と問題視する声もありましたが、GPT-4は、幅広い一般知識と問題解決能力があり、より正確な文章生成が可能です(とは言っても、まだ過信は禁物です)。
では、GPT-4はどこで使えるのでしょうか。
現在、無料プランのChatGPTでは、GPT-3.5しか使えませんが、GPT-4は、有料プラン『ChatGPT Plus』(月額20ドル)で使用できます。
また、Microsoftが2023年2月に公開した無料のチャットボット『Bing Chat』には、GPT-4が使われているそうです。
ただし、ChatGPT PlusでもBing Chatでも、入力できるのはテキストのみで、まだ、画像入力に対応できるものは、一般には公開されていません。つまり、現在のところは、マルチモーダル以外の進化・改善を享受するのみですね。
ちなみに、旧バージョンである「GPT-2」が発表されたのは、2019年2月です。「GPT-4」の公開までに、約4年しかかかっていませんので、言語モデルの発展スピードは非常に速いといえます。今後のさらなる進化に期待したいですね。