Новости

Теперь можно голосом: ОК запустили сервис распознавания аудиосообщений

23 сентября 2021
2 мин. чтения
Теперь можно голосом: ОК запустили сервис распознавания аудиосообщений

В социальной сети Одноклассники появилась функция перевода аудиосообщений в текст. Сервис распознавания аудио автоматически конвертирует голосовое сообщение в текст, позволяя без прослушивания понять, о чем говорит собеседник. Сервис работает на базе искусственного интеллекта и реализован на основе технологии, разработанной ВКонтакте. Запуск стал очередным важным шагом в интеграции ОК и экосистемы VK.

Новый сервис сделает общение в ОК более комфортным в ситуациях, когда прослушать голосовое сообщение невозможно: в общественном транспорте, во время совещания с коллегами или во время просмотра фильма. Технология распознает как полученные, так и отправленные голосовые сообщения на русском языке длительностью до 60 минут. Благодаря этому текст аудиосообщений индексируется поиском по сообщениям, что позволяет легко найти в чате любую информацию, даже отправленную голосом. При ответе на распознанное голосовое сообщение в чате будет отображаться текст исходного сообщения, а не аудио, что поможет ориентироваться в переписке с собеседником. Для распознанных сообщений в списке чатов также отображается текст, а не значок аудиосообщения.

Конвертация голосовых сообщений в текст в ОК полностью автоматизирована: пользователь сразу получает расшифровку без дополнительных действий. ОК также добавили возможность скопировать текст распознанного аудиосообщения. Функцию можно использовать для работы с текстами, которые наговорит собеседник, или конвертации собственных голосовых заметок в текст для дальнейшей работы с ним.

Технология распознавания речи ВКонтакте основана на трех нейросетях: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания и заглавные буквы. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers, и база субтитров из фильмов. На конвертацию аудио в текст уходит всего около секунды. Нейросеть распознает русскоязычную речь, при этом в расшифровке учитываются разговорные слова, заимствованная лексика, а также сложные условия записи – например, низкое качество звука или нечеткая речь собеседника.

Распознавание аудиосообщений автоматически включено у всех пользователей последних версий мобильных приложениях ОК на Android и iOS, а также в десктопной версии соцсети. Отключить новую функцию можно в настройках профиля, в разделе «Сообщения».

ОК постоянно запускают новые форматы для общения и обмена личным контентом. Ранее ОК дали возможность создавать собственные стикеры и мемы с помощью специального конструктора, что поможет пользователям подбирать актуальные для беседы или ситуации изображения даже без навыков владения фоторедакторами.

Теперь можно голосом: ОК запустили сервис распознавания аудиосообщений
4
5
4
4
4

Материалы по теме

Каким стал 2024 год для ОК: рост аудитории, новые форматы и важные обновления

Компания VK опубликовала финансовые и операционные результаты за 2024 год. Рассказываем, каких результатов удалось достичь ОК в прошлом году, а также делимся самыми главными проектами и нововведениями на платформе за это время.

43
7 мин.
ОК внедрили новую систему возврата и удержания пользователей на базе ИИ

Одноклассники внедрили новую систему возврата и удержания пользователей соцсети, которая функционирует на базе ML-технологий. Внутренние алгоритмы анализируют поведение пользователей соцсети, сегментируют аудиторию, персонализируют контент, оптимизируют время отправки push-уведомлений и их количество на конкретного пользователя с учётом его интересов. Внедрение модели позволило ОК вернуть часть ранее неактивной или менее активной аудитории и увеличить её размер итогам 2024 года.

Система разделяет push-уведомления на два типа — обязательные и рекомендательные. Первые — связаны с уведомлением пользователя о важных обновлениях, которые отправляются ему в момент события. Это, например, новые заявки в друзья, сообщения или подарки. Второй тип уведомлений — это ретеншн-пуши. Они касаются предложений изучить свежий контент, появляющийся на площадке ОК с учётом интересов пользователя. Модель учитывает десятки параметров при взаимодействии с контентом и при отправке уведомления учитывает, что пользователь, например, начал чаще смотреть Клипы или читать посты блогеров определённой тематики.

Новая технология способствует более точной сегментации и персонализации, повышая вовлеченность пользователей и увеличивая время, проводимое в приложении и позволяет площадке более точечно коммуницировать со своими пользователями и выбирать для этого наиболее релевантный повод и тайминг.

Обновлённая ретеншн-система появилась в Одноклассниках в третьем квартале 2024 года и наряду с другими продуктовыми обновлениями повлияла на рост MAU (месячная активная аудитория пользователей) социальной сети впервые за пять лет. По итогам 2024 года этот показатель увеличился до 36,2 млн. За год аудитория соцсети выросла на 1,2 млн пользователей.

44
2 мин.
Одноклассники перезапустили раздел «Обсуждения»

Одноклассники перезапустили раздел «Обсуждения». В нем появились вкладки с самыми популярными на текущий момент дискуссиями в соцсети, а также серии лучших публикаций, индивидуально подобранные для каждого пользователя на основе его интересов.

В разделе «Обсуждения» появилась новая вкладка «Популярное». ML-модели ОК анализируют поведение каждого пользователя и его предпочтения в контенте, и рекомендуют ему наиболее подходящие темы для обсуждения. Человек может перейти к посту и прокомментировать его, выразить эмоцию или репостнуть к себе на страницу. Вкладка «Популярные» включает актуальные посты с наибольшим количеством комментариев за несколько дней. Также в нее вошел виджет «Горячая тема», которая будет состоять из самых обсуждаемых дискуссий за день. Таким образом, пользователи могут быть в курсе наиболее популярных новостей, которые просматривают и обсуждают миллионы людей в ОК.

93
5 мин.