OpenAI начинает постепенное внедрение новой версии ChatGPT под названием GPT-4o, которая обещает улучшенные возможности работы с текстом, изображениями и аудио. Разработчики утверждают, что новый чатбот значительно превосходит своих предшественников в понимании визуальной и звуковой информации, обеспечивая почти мгновенные ответы на запросы.

По словам представителей OpenAI, GPT-4o способен принимать в качестве входных данных любую комбинацию текста, аудио и изображений, а также генерировать аналогичные выходные данные. Это открывает возможность для реальных «разговоров» с чат-ботом, но на момент написания статьи, пока что, только на английском языке. Другие языки, в том числе русский, в аудио-формате чат-бот генерировать не способен.

Новая версия будет внедряться в течение нескольких недель, в то время как технологические компании продолжают борьбу за создание все более совершенных инструментов искусственного интеллекта. Вчера на презентации компании были продемонстрированы такие задачи, как перевод языка в реальном времени, решение математических задач с помощью визуальных возможностей и помощь незрячим людям в навигации по Лондону.

GPT-4o способен отвечать на аудиозапросы за 232 миллисекунды, а в среднем — за 320 миллисекунд, что близко к скорости реакции человека. Для устранения опасений по поводу предвзятости и дезинформации, новая версия прошла обширное тестирование 70 внешними экспертами.

Стоит отметить, что новый чат-бот будет бесплатным, но пользователи премиум-версии «Plus» получат возможность писать больше сообщений. Ранее предыдущие версии ChatGPT вызывали беспокойство в школах и университетах из-за возможности использования чат-бота для написания эссе.

Спустя почти два года, после того, как был запущен ChatGPT, он стал самым быстрорастущим приложением, достигшим 100 миллионов активных пользователей в месяц.

Присоединяйтесь к нашему телеграм-каналу

Объявление о GPT-4o было сделано накануне ежегодной конференции разработчиков Google, на которой также ожидаются новые анонсы в области искусственного интеллекта. На прямой трансляции в понедельник технический директор OpenAI Мира Муратти заявила: «Обновленная модель гораздо быстрее и улучшает возможности работы с текстом, изображениями и аудио. Она будет бесплатной для всех пользователей, а платные пользователи смогут писать в пять раз больше сообщений».

GPT-4o также поддерживает около 50 языков и обладает возможностью анализа диаграмм. Новая функция памяти AI обеспечивает непрерывность в разговорах, а возможность поиска информации напрямую улучшает взаимодействие с пользователями.

Запуск GPT-4o является важным шагом вперед в развитии искусственного интеллекта, обещая более быстрый и естественный способ взаимодействия с ИИ по сравнению с предыдущими версиями. Разработчики также представили настольное приложение для компьютеров, которое облегчит интеграцию GPT-4o в рабочие процессы пользователей, позволяя более удобно загружать документы и скриншоты.

По мнению отраслевых экспертов, следующий шаг в развитии ChatGPT — это возможность доступа к точной информации в реальном времени и ссылок на нее. Текущая версия ChatGPT с такой задачей пока не справляется.