Skip to content

Преобразование голоса на основе VITS. Ориентировано на простоту, качество и производительность.

License

Notifications You must be signed in to change notification settings

Bebra777228/PolGen-RVC

Repository files navigation

PolGen


PolGen — это инновационный инструмент для создания каверов и переозвучки с использованием голосов, обученных на RVC v2.


🌟 Основные возможности 🌟

📦 Гибкая установка моделей

PolGen поддерживает несколько способов установки моделей:

  • Загрузка по ссылке на ZIP-файл: Поддерживаемые сайты: HuggingFace, Pixeldrain, Google Drive, Mega, Яндекс Диск.
  • Загрузка ZIP-файла с устройства: Просто перетащите ZIP-файл в программу.
  • Загрузка .pth и .index файлов по отдельности: Нет необходимости запаковывать файлы в ZIP архив.

🗣️ Преобразование текста в речь (TTS) от Edge-TTS

PolGen поддерживает преобразование текста в речь с использованием Edge-TTS. Создавайте разговорные аудиозаписи из текста без лишних усилий.

🛠️ Установка кастомных HuBERT моделей

PolGen предоставляет гибкость в выборе моделей для лучшего результата. Установите кастомные HuBERT модели, чтобы адаптировать программу под свои нужды.


🚀 Установка и запуск 🚀

Запуск на Google Colab

Если у вас нет мощной видеокарты от NVIDIA, PolGen можно запустить с использованием Google Colab.

Open In Colab

Запуск на ПК

Note

  1. Скачайте ZIP-архив и распакуйте содержимое в любое удобное место - Скачать
  2. Запустите файл для установки PolGen:
    • Windows: run-PolGen-installer.bat
    • Linux: run-PolGen-installer.sh
  3. Запустите программу PolGen:
    • Windows: run-PolGen.bat
    • Linux: run-PolGen.sh

Для Windows, возможно, потребуется установить Microsoft C++ Build Tools с выбранной нагрузкой «Desktop development with C++».

Tip

Для лучшего опыта рекомендуется использовать предварительно скомпилированную версию.

  1. Скачайте ZIP-архив и распакуйте содержимое в любое удобное место - Репозиторий / Скачать
  2. Запустите файл:
    • Windows: run-PolGen.bat
    • Linux: run-PolGen.sh

🚫 Условия использования

Использование преобразованного голоса для следующих целей запрещено:

  • Критика или нападение на отдельных лиц.
  • Поддержка или противодействие конкретным политическим позициям, религиям или идеологиям.
  • Публичное отображение сильно стимулирующих выражений без соответствующего зонирования.
  • Продажа голосовых моделей и сгенерированных голосовых клипов.
  • Притворство оригинальным владельцем голоса с злонамеренными намерениями причинить вред/боль другим.
  • Мошеннические цели, ведущие к краже личности или мошенническим телефонным звонкам.

🛡️ Отказ от ответственности

Я не несу ответственности за любые прямые, косвенные, последующие, случайные или специальные убытки, которые могут возникнуть в результате или в связи с использованием, неправильным использованием или невозможностью использования этого программного обеспечения.


📞 Контакты

Если у вас есть вопросы или предложения, пожалуйста, свяжитесь со мной через Telegram или GitHub Issues.


Внесли свой вклад в проект:

About

Преобразование голоса на основе VITS. Ориентировано на простоту, качество и производительность.

Topics

Resources

License

Code of conduct

Stars

Watchers

Forks

Contributors 6