Этот бот позволяет конвертировать голосовые и видеосообщения в текст. Он использует технологии распознавания речи и обработки медиафайлов для извлечения аудио из видеофайлов и последующего перевода аудио в текст.
- /start — приветственное сообщение
- /help — список всех команд
🔀 Для перевода голосового сообщения в текст, просто отправь его боту.
🔀 Для перевода видеосообщения в текст, просто отправь его боту.
❗️ Размер файла не должен превышать 20 Мб
- Клонирование репозитория Клонируйте репозиторий на ваш локальный компьютер:
git clone [email protected]:ivan-karaberov/speech2text-bot.git
cd speech2text-bot
- Подготовка окружения
Скопируйте
.env.example
в.env
и отредактируйте.env
файл, заполнив в нём все переменные окружения:
cp src/core/.env.example src/core/.env
- Установка зависимостей:
Для управления зависимостями используется poetry, требуется Python 3.12.
Установите зависимости с помощью команды:
poetry install
- Запуск
cd src && poetry run python main.py
- python 3.12
- aiogram — для взаимодействия с Telegram API
- faster-whisper — для распознавания речи
- moviepy - для извлечения аудио из видеосообщений
Этот проект лицензирован под MIT.