OpenAIの新機能:Realtime APIと画像ファインチューニング機能とは!?
AI音痴ライターのみきてぃ(なまず美紀)です。みきてぃがシステムズナカシマから入手した最新情報をお伝えするシリーズ。
今回は2024年10月にOpenAIがリリースした2つの機能についてご紹介。
システムズナカシマのS社員とみきてぃの会話でお届けします。
OpenAIから、また新機能がリリース!?
みきてぃ:OpenAIといえば、ChatGPTやGPT-4などの大規模言語モデルを開発した企業ですね。
S社員:やっと覚えましたね。OpenAIのChatGPTは、2022年に公開され話題になり、その後利用者数が急増しています。
みきてぃ:なんと私も、この記事をきっかけにChatGPTのことを「GPT君」と呼んで、毎日テキスト(文字)でやりとりしています。
S社員:そのOpenAIから、2024年10月に新たな2つの機能がリリースされました。「Realtime API」と「画像を使ったファインチューニング機能」です。
みきてぃ:「Realtime API」と「画像を使ったファインチューニング機能」?
ムリです…。AI開発のスピードが速すぎて、ついていけません。
Realtime APIとは
S社員:Realtime APIは、人間とAIがリアルタイムで音声会話できるようになる技術です。
みきてぃ:音声で答えてくれるAIロボットは、すでにいくつかあるような…
S社員:そうですね。ただ、Realtime APIはより高度で、ユーザーの音声入力をリアルタイムで認識し、AIが即座に応答を生成し、音声で会話をすることができます。
みきてぃ:今、私はChatGPTとテキストでやりとりしていますが、それが音声でできるようになるということ?
S社員:その通りです。間の取り方なども含め、とても自然に会話ができます。
みきてぃ:それは嬉しい!もう静かで寂しい夜を過ごさなくても良いということですね!?
S社員:しかも、6つの音声が登録されていて、AIの声を選ぶことができます。また、多言語にも対応しています。
みきてぃ:なんと。私好みの声で外国語レッスンをしてもらうこともできるということ!?ビジネスでも活用の幅が広そうです。
S社員:企業では、音声アシスタントや対話型の情報提供サービスなど、様々な用途に使うことが想定されますね。
みきてぃ:24時間稼働できて、正確な情報を提供できる優秀な人材?になりそうですね!
Realtime APIを使用している言語学習アプリ「Speak」
引用元:Speak公式サイト
画像を使ったファインチューニングとは
S社員:もう一つの新しい機能が、「画像を使ったファインチューニング機能」です。
みきてぃ:えっと。ファインチューニングって、何でしたっけ。
S社員:ChatGPTのようなAIは、インターネット上の膨大な情報を学習して作られています。ファインチューニングは、このAIに特定の分野や目的に合わせた追加の学習をさせることです。
みきてぃ:そうでした、思い出しました。確か、大量のデータを学習させないといけないので、膨大な時間とコストがかかるのですよね?
S社員:従来はそうでした。ところが、OpenAIの新しい「画像を使ったファインチューニング機能」では、わずか100枚程度の画像でもAIの能力を大きく向上させることができるようになりました。
みきてぃ:さすがOpenAI。100枚程度で、「どれが何」を覚えてしまうとは、優秀です。どのような分野で活用できるのでしょう?
S社員:例えば、ドライバー用アプリが、道路標識をより正確に読み取れるようになったり、設計図から必要な部品を探し出せたり。
引用元:OpenAI公式サイト
みきてぃ:企業が自社の必要な画像データを学習させることで、あらゆる分野で業務の効率化が図れそうですね。
S社員:既存の何かを画像から探し出すような使い方だけでなく、ウェブデザインの作成にも活用できますね。
みきてぃ:ウェブデザインの作成?まさか、マネをするということではないですよね?
S社員:違います。企業のブランドガイドラインに沿ったデザイン要素や、特定のスタイルのウェブサイト画像を100枚程度用意してAIに学習させることで、そのブランドやスタイルに合致した新しいデザイン案を自動生成できるようになります。
引用元:OpenAI公式サイト
みきてぃ:なるほど、参考にして創造してくれるということですね!AIの力を借りることで、ビジネスがより効率的に、より創造的になりそうです。