Новая версия ИИ от OpenAI

26.05.2024

GPT-4o («o» от «omni») — это шаг к гораздо более естественному взаимодействию человека с компьютером: он принимает в качестве входных данных любую комбинацию текста, аудио, изображения и видео и генерирует любую комбинацию текста, аудио и изображения. Он может реагировать на аудиовход всего за 232 миллисекунды, в среднем 320 миллисекунд, что аналогично времени реакции человека в разговоре. GPT-4o гораздо лучше воспринимает изображение и звук по сравнению с другими существующими моделями.

Источник: https://openai.com/index/hello-gpt-4o/