Американская компания OpenAI представила новую бесплатную генеративную языковую модель GPT-4o в рамках презентации Spring Update.
Она может анализировать звук, изображение и текст в режиме реального времени, при этом нейросеть поддерживает 50 языков, включая русский. Символ «о» в названии модели означает «omni» и переводится как «всесторонний», это указывает на мультимодальность GPT-4o.
Модель GPT-4o значительно улучшит работу чат-бота ChatGPT. У нее интеллект уровня GPT-4 и улучшенные возможности по работе с изображениями и текстом, а также с аудио и голосом. У GPT-4o есть контекстное окно из 128 тысяч токенов.
Модель моментально отвечает на текстовые или голосовые команды пользователя, почти не тратя времени на их обработку. Она также научилась улавливать эмоции в голосе пользователя и реагировать соответствующим образом.
GPT-4o доступна как в платной, так и в бесплатной версии ChatGPT. При превышении лимита у бесплатных пользователей произойдет переключение на GPT-3.5, а у платных — на GPT-4.
Новая языковая модель GPT-4o появится в продуктах OpenAI с середины мая — процесс внедрения займет около нескольких недель.