[ project ]
Транскрибация аудио
MP3, MP4 → текст. Русский язык. Работает на вашем сервере.
Веб-сервис для преобразования аудио и видео в текст. Поддерживает MP3, MP4 (извлекается аудиодорожка), M4A, WebM, OGG. Использует Vosk — офлайн-распознавание речи на русском. Оптимизирован для CPU и ~2 GB RAM.
- Файлы до 150 МБ, длительность до нескольких часов
- MP4 — автоматическое извлечение аудио через ffmpeg
- Модель Vosk small (русский), ~45 MB
- Обработка на CPU, без GPU
- Вход по логину и паролю