OpenAI добавила в Realtime API сразу три голосовые модели и явно целится не в игрушечные демо, а в рабочие сценарии, где ассистент должен слушать, не терять контекст и доводить разговор до действия. На этом поле уже толкаются Google, Perplexity и пачка стартапов, но у большинства до сих пор получается скорее «чат-бот с микрофоном», чем нормальный голосовой интерфейс. Главная ставка здесь на
GPT-Realtime-2. У модели окно контекста выросло с 32K до 128K, появились уровни reasoning effort от minimal до xhigh, а также более аккуратная работа с паузами, ошибками и резкой сменой темы. Это важно не ради красоты в презентации. Голосовые агенты ломаются именно на таких мелочах, когда пользователь перебивает сам себя, уходит в сторону или начинает говорить не по сценарию. GPT-Realtime-2 и живой голосовой
разговор OpenAI отдельно показывает цифры, потому что без них голосовые модели обычно продаются на вере и тембре. GPT-Realtime-2 high дала плюс 15,2% к GPT-Realtime-1.5 в Big Bench Audio, а версия xhigh оказалась на 13,8% лучше в Audio MultiChallenge. Для поддержки клиентов, бронирований и других скучных, но денежных задач это важнее, чем очередная демонстрация «естественного» голоса, который через минуту
начинает спотыкаться. В качестве примера OpenAI привела и Zillow. Джош Вайсберг, старший вице-президент и руководитель направления ИИ в компании, сказал, что их больше всего поразили интеллект и надежность вызова инструментов в сложных голосовых сценариях. По его словам, после оптимизации промпта успешные звонки выросли с 69% до 95%, а модель заметно лучше проходит
проверки на Fair Housing compliance. Это как раз тот случай, когда «умный голос» перестает быть маркетинговой игрушкой и начинает трогать деньги. Перевод и расшифровка в реальном времени Второй слой релиза закрывает более приземленные задачи. GPT-Realtime-Translate поддерживает более 70 входных языков и 13 выходных, а GPT-Realtime-Whisper делает потоковую расшифровку с
низкой задержкой. Первый пригодится для живого перевода, второй для субтитров, заметок и любых сценариев, где ждать конца фразы уже слишком дорого. И тут OpenAI лезет в уже занятую, но всё ещё плохо прибранную нишу. Zoom, Google Meet и enterprise-сервисы давно продают транскрипцию и перевод, однако рынок по-прежнему любит решения, которые не падают на акцентах,
региональном произношении и отраслевой лексике. Поэтому компания и делает акцент на языке, терминологии и устойчивости распознавания в живой речи. Первые партнерские примеры тоже не случайны. Deutsche Telekom тестирует мультиязычное голосовое общение, Vimeo показывает перевод обучающего видео на лету, а BolnaAI говорит о более низкой ошибке распознавания для хинди, тамильского и
телугу. Это уже не витрина для конференции, а попытка влезть в поддержку, образование, медиа и международные продажи. Цена голосовых моделей OpenAI Цены компания тоже не прячет, и они вполне в духе OpenAI: дорого для хобби, терпимо для бизнеса. Все 3 модели уже доступны в Realtime API. GPT-Realtime-2 — $32 за 1 млн
аудиовходных токенов и $64 за 1 млн аудиовыходных токенов. GPT-Realtime-Translate — $0,034 за минуту. GPT-Realtime-Whisper — $0,017 за минуту. Отдельно OpenAI говорит о безопасности. В Realtime API есть активные классификаторы сессий, а разработчикам предлагают вешать собственные правила через Agents SDK. Это не декоративная строчка, а попытка заранее подстелить соломку
там, где голосовые ассистенты чаще всего и срываются в неприятности, от странных ответов до модерационных провалов. В ближайшие месяцы всё упрется в банальную вещь: кто быстрее заставит голосовой слой не просто красиво разговаривать, а надежно продавать, обслуживать и переводить, тот и заберет
себе кусок сервисных сценариев. Остальным останется любоваться демо и считать, сколько еще раз их «естественный» ассистент завис на середине фразы.
Сообщает itzine.ru
Новость из рубрики: Технологии и Hi-Tech
Поделиться новостью:
Топ Новости Недели
- Как правильно указать адрес склада в Китае при работе с маркетплейсами...
- Цифровизация кадровых процессов как шаг к эффективному управлению персоналом...
- Современные решения для автоматизации гостиничного бизнеса и повышения сервиса...
- Реклама ВКонтакте как эффективный инструмент продвижения бизнеса...
- Как выбрать подходящий офис в Санкт-Петербурге для развития бизнеса и комфортной работы...
- Сервис продажи билетов на концерт: удобство, скорость и современные решения для организаторов и зрителей...
- Розничная сеть КАМАЗ ЦЕНТР ДОНЕЦК как надежный партнер для владельцев техники...
- Электронная подпись за 30 минут как удобное решение для цифровых задач...
- Газопоршневые установки Jenbacher как эффективное решение для современной энергетики...
- Компьютерная томография как современный метод точной диагностики...
- Estetie — современный подход к уходу за кожей с акцентом на качество и эффективность...
- Здоровый сон без сильнодействующих средств как основа качества жизни...
- Служба в армии по контракту: преимущества и возможности для развития...
- Микрокредит как быстрый способ решения финансовых задач...
- Электрощиты автоматического ввода резерва: надежность энергоснабжения для бизнеса...
- Юридический адрес для бизнеса: зачем он нужен и как выбрать оптимальное решение...
- Квалифицированная помощь при алкогольной зависимости: лечение на дому...
- Безопасный выход из запоя: современные методы восстановления организма...
- Эффективная помощь при запое: как восстановить здоровье в домашних условиях...
- Профессиональная помощь при запое: как безопасно восстановить здоровье...
01:00, 04 Май OpenAI добавила «питомцев» в Codex — ИИ-ассистенты теперь следят за кодом на экране Новая функция превращает агента для программирования в интерактивного компаньона: «питомцы» показывают прогресс задачOpenAI представила новую функцию...
00:00, 02 Май Gigabyte добавила поддержку HUDIMM в BIOS для плат Intel Gigabyte выпустила обновления BIOS для материнских плат на чипсетах Intel 800-й, 700-й и 600-й серий, чтобы включить поддержку памяти HUDIMM. Это тот...
10:00, 18 Апр Dreame обновила флагманы в России и добавила технику для окон, бассейнов и газонов На московской презентации Dreame рассказала о развитии своей линейки в России. Бренд показал не только новые пылесосы, но и роботов для ухода за внеш...
13:00, 26 Апр Длинные и технологичные: BMW представила модели i3 и iX3 для КНР Немецкий автопроизводитель припас для Поднебесной особые версии своих ключевых новинок. Как выяснилось, официально представлены удлинённые модификаци...
23:00, 26 Апр Названы марки и модели самых угоняемых автомобилей В целом крупные страховые компании России отметили, что тенденции к увеличению числа автомобильных угонов за 2025 год отмечено не было. Опасными лока...
16:00, 20 Апр Автобренды Jetour и Soueast анонсировали новые модели В конце недели на Пекинском автосалоне две марки из состава концерна Chery – Jetour и Soueast – впервые выступят с совместной презентацией. Своё объе...
16:00, 23 Апр Apple перестанет обновлять четыре модели iPhone. Кто останется без iOS 27 Apple прекратит поддержку четырёх моделей iPhone с выходом операционной системы iOS 27 летом этого года. Минимальными совместимыми устройствами стану...
17:00, 30 Апр С водой и движением: 2ГИС появились анимированные модели фонтанов В ближайшее время анимированные модели фонтанов появятся и в других городахКоманда популярного справочно-картографического сервиса 2ГИС представила и...
03:00, 08 Май $500 миллионов на ИИ-модели клеток: Цукерберг обещает победить все болезни Biohub (запрещенная в России, террористическая организация), некоммерческая организация Марка Цукерберга и Присциллы Чан (запрещенная в России, терро...
06:00, 06 Май США усиливают контроль над ИИ: ключевые разработчики передадут модели на тестирование до релиза Новые соглашения CAISI с Google DeepMind, Microsoft и xAI закрепляют обязательные проверки в интересах национальной безопасностиВ американском госуда...
13:00, 19 Апр АвтоВАЗ отмечает день рождения своей первой модели ВАЗ-2101 19 апреля Волжский автозавод отмечает «День первого автомобиля». В этот день в 1970 году были собраны шесть предсерийных машин: две синих и четыре ви...
06:00, 05 Май NYT узнала, что Белый дом будет проверять модели ИИ перед их выпуском в свет Белый дом рассматривает возможность проверки моделей искусственного интеллекта (ИИ) перед их выпуском в свет, поэтому администрация США обсуждает вве...
18:00, 28 Апр Из закона об ИИ убрали требование обучать модели только на российских данных Согласно информации РБК Радио, власти доработали законопроект об основах регулирования ИИ в России. Из документа исключили требования, чтобы суверенн...
21:00, 25 Апр EXEED представит сразу четыре новые модели на закрытой премьере в Пекине Накануне 19 Пекинского международного автосалона EXEED проведёт эксклюзивный закрытый показ и впервые одновременно представит четыре новые модели – о...
11:00, 04 Май Администрация Трампа блокирует расширение доступа к новой модели Anthropic из-за угроз кибербезопасности Администрация США пытается ограничить распространение модели Mythos из-за её способности находить и использовать критические уязвимостиОтношения межд...
22:00, 26 Апр OpenAI: партнёрство с Microsoft «ограничило наши возможности» Уже ни для кого не секрет, что в последние месяцы отношения между Microsoft и OpenAI оставляют желать лучшего, и, похоже, ситуация продолжает ухудшат...
08:00, 29 Апр Microsoft и OpenAI вновь пересматривают условия сотрудничества Microsoft и OpenAI объявили об очередном изменении партнёрского соглашения. Компании решили упростить условия сотрудничества, чтобы дать друг другу б...
16:00, 24 Апр OpenAI представила полностью автономную флагманскую модель GPT-5.5 Компания OpenAI выпустила новую ИИ-модель GPT-5.5, которую называет «новым классом интеллекта для реальной работы». Главный акцент в обновлении сдела...
11:00, 04 Май OpenAI изменила правила работы с данными пользователей ChatGPT OpenAI переписала пользовательское соглашение для ChatGPT в США так, что бесплатная версия и план ChatGPT Go за $8 в месяц фактически становятся част...
21:00, 04 Май Anthropic и OpenAI запускают параллельные инвестиционные структуры для корпоративного ИИ Две крупнейшие ИИ-лаборатории одновременно выстраивают новые совместные предприятия с финансовыми партнёрами, усиливая конкуренцию за внедрение ИИ в ...
21:00, 19 Апр OpenAI превратила ИИ в автономного агента, работающего на ПК вместо человека Цифровой двойник: новая система OpenAI имитирует действия пользователя, управляя компьютером в фоновом режиме. OpenAI больше не желает позиционироват...
20:00, 06 Май OpenAI выпустила ИИ-модель GPT-5.5 Instant, которая доступна в ChatGPT по умолчанию Компания OpenAI представила GPT-5.5 Instant — новую бесплатную базовую модель для чат-бота ChatGPT. Она приходит на смену GPT-5.3 Instant, которую вы...
07:33, 18 Апр Президент OpenAI заявил о смене ролей между человеком и машиной Президент и сооснователь OpenAI Грег Брокман опубликовал программный пост о переходе мира к «экономике вычислений» (compute-powered economy), в котор...
01:00, 29 Апр OpenAI не дотянулась до собственных целей: расходы на вычисления давят на бизнес и рынок Срыв планов по росту ChatGPT и опасения за окупаемость инфраструктуры обрушили акции партнёров и усилили давление перед IPOOpenAI столкнулась с расту...
01:00, 04 Май Проигрыш в суде с Маском может фактически лишить OpenAI текущей формы Разбирательство началось в самый уязвимый момент для компании: на фоне убытков, споров об IPO и растущих сомнений в устойчивости всей ИИ-индустрииСуд...
17:00, 21 Апр OpenAI предлагает план перехода к 4-дневной рабочей неделе и налогу на роботов «Вкалывают роботы»: OpenAI представила план, как человечеству жить в эпоху сверхинтеллекта Американская компания OpenAI, создавшая ChatGPT, опубликов...
20:00, 28 Апр Илон Маск сократил иск против OpenAI перед началом судебного процесса Из 26 первоначальных претензий к рассмотрению в суде останутся только двеИлон Маск отказался от части обвинений в своём иске против OpenAI, Сэма Альт...
01:00, 04 Май Адвокат, который уже обыгрывал Маска, возглавил защиту Альтмана в деле против OpenAI Уильям Савитт — юрист с биографией таксиста, рок-музыканта и клерка Верховного суда, который уже заставлял Илона Маска капитулироватьВ федеральном су...
21:00, 29 Апр Николь Кидман, Тильда Суинтон, Оксана Бондаренко и Марион Котийяр среди гостей, российские модели — на подиуме на показе Chanel В Биаррице (Франция) состоялся показ дебютной круизной коллекции Матье Блази для Chanel. Место было выбрано неслучайно: именно здесь Коко Шанель когд...
10:00, 07 Май Альтман посеял «хаос» внутри OpenAI, обманывая топ-менеджеров. Мира Мурати дала показания в суде Илон Маск требует 150 миллиардов долларов в качестве компенсации ущербаБывший руководитель технологического подразделения OpenAI в среду дала показан...
14:00, 02 Май Пентагон не договорился с Anthropic: военные будут использовать решения SpaceX, OpenAI, Google, Nvidia, Reflection AI, Microsoft и Amazon Web Services Anthropic пока за бортомПентагон заявил в пятницу, 1 мая, что достиг соглашений с семью компаниями, занимающимися искусственным интеллектом, о развер...
14:00, 02 Май Вы не понимаете, это другое. Маск заявил, что использование OpenAI для обучения Grok — это стандартная практика, а «коммерческие компании могут приносить социальную пользу» При этом он обвиняет Альтмана в том, что тот превратил OpenAI в коммерческую компаниюВ ходе судебного слушания, которое проходило на этой неделе, Ило...