Parakeet TDT 0.6B v3
Релиз: 27 мая 2026 г.
600M параметров, FastConformer-TDT, все языки ЕС, WER 6.34%, обучена на 670K+ часах аудио.
Parakeet TDT 0.6B v3 — многоязычная модель преобразования речи в текст от NVIDIA с 600M параметров, построенная на архитектуре FastConformer-TDT. Обучена на датасете Granary (670 000+ часов аудио), поддерживает автоматическое определение языка для всех официальных языков ЕС и достигает средней частоты ошибки слов 6,34% на HuggingFace Open ASR Leaderboard. Возвращает транскрибированный текст с пунктуацией и таймстемпами сегментов.
Идеальный выбор для многоязычных STT-проектов с высокими требованиями к точности и поддержкой всех языков Европейского Союза.
Ключевые характеристики:
- 600M параметров: FastConformer-TDT
- Все языки ЕС: Автоопределение языка
- WER 6.34%: Высокая точность
- 670K+ часов: Масштабное обучение
- Пунктуация: Чистые транскрипты
- Таймстемпы: На уровне сегментов
Идеально подходит для:
- Многоязычной транскрибации (все языки ЕС)
- Высокоточных STT-проектов
- Обработки аудио с неизвестным языком
- Профессиональной транскрипции
- Приложений с требованием к точности
Тарификация:
- 22 Искры за час аудио
💡 Пример: 1 час аудио = 22 Искры
Дата релиза: 27 мая 2026 г.
🎙️ WER 6,34% — все языки ЕС с автоопределением
