Get Mystery Box with random crypto!

Совсем недавно OpenAI (закрытое сообщество по изучению ИИ) вып | Ива всё не облетает ❦

Совсем недавно OpenAI (закрытое сообщество по изучению ИИ) выпустили Whisper. Это программа, способная переводить аудио в текст и делает это поразительно хорошо. На этом сайте вы можете сами в этом убедиться, записав голосовое сообщение до 30 секунд.

У Whisper есть разные модели, самая маленькая – быстрая и часто ошибающаяся, самая большая работает очень медленно, но зато точно. Было очень трудно найти способ, как использовать эту модель для длинных видео. На моем ноуте 10 минут аудио обрабатывалось больше 10 часов...

Сегодня вечером мне посчастливилось найти ресурс на Google Collab, где можно перевести любое видео (например по ссылке на ютуб) в текст. Скорость очень зависит от загруженности коллаба, поскольку он предоставляет ресурс бесплатно и распределяет между всеми участниками.

Прямо сейчас мне удалось перевести видео длинной в час на английский язык буквально за 15 минут.

Использовать: Google Collab

UPD.
Также другой добрый человек сделал приложение, позволяющее определять спикера, это выглядит вот так.

Использовать: Google Collab