Снятое фото
MusicGen
5 +

О модели

MusicGen — это универсальная AI-модель для создания оригинальной музыки по текстовым описаниям или аудио-примерам. Она позволяет указать жанр, настроение, темп и инструменты, чтобы создать готовые фоновые треки, джинглы или полноценные музыкальные идеи. Вы можете либо написать промпт (например: "бодрая lo-fi гитара с мягкими клавишами, 90 BPM"), либо загрузить аудио-клип, чтобы продолжить или скопировать стиль — идеально для ремиксов, мэшапов или расширения коротких мелодий. MusicGen поддерживает workflow text-to-audio и audio-to-audio, предоставляя создателям практичные способы быстро прототипировать и финализировать музыку. Разработанный для удобства использования, MusicGen подходит для любителей, видеопродюсеров, геймдев-разработчиков и саунд-дизайнеров, которым нужна быстрая кастомизируемая музыка без глубокого опыта музыкального продакшена. Он выдает высококачественные сэмплы, готовые к использованию в видео, подкастах, играх или демо-треках, и предлагает контроль над темпом, настроением и инструментами под нужды проекта. Несколько размеров модели позволяют балансировать качество и вычислительные ресурсы, а модель обучена на широком наборе лицензионной музыки для разнообразных результатов. Особенно полезным MusicGen делает сочетание качества, управляемости и поддержки аудио-референсов — вы получаете как свежие композиции из текста, так и точное продолжение существующей записи. Ограничения, о которых стоит знать: синтез вокала может быть менее реалистичным, чем инструментальный вывод, а промпты на языках кроме английского могут давать переменные результаты в зависимости от охвата обучения. В целом, MusicGen упрощает создание музыки, обеспечивая быструю итерацию и креативное исследование в личных и коммерческих проектах.

Преимущества

Высокое качество
Качественный результат для профессионального использования.
Поддержка референсов
Принимает загруженные изображения, аудио или файлы на вход.
Гибкая настройка
Тонкая настройка тона, стиля и параметров.

Настройки

BPM-  Beats Per Minute. Установить темп поколения
Продолжительность трека-  Продолжительность поколения
Версия модели-  Разные модели издают разный звук.
Стратегия нормализации-  Стратегия нормализации звука
Температура-  Температура модели. Чем выше значение, тем более творческий и чем ниже значение, тем более фокусированный.
Top K-  Количество наиболее релевантных элементов для выбора из результата. Более высокие значения приводят к более разнообразным ответам за счет рассмотрения большего количества кандидатов.
Top P-  Сокращает выборку до лексем с кумулятивной вероятностью p. При значении `0` (по умолчанию) используется выборка top_k.
Классификатор Бесплатное руководство-  Увеличивает влияние входов на выход. При больших значениях получаются выходы с меньшей вариативностью, которые более тесно связаны с входами.