Снятое фото
MusicGen
5

О модели

MusicGen — универсальная модель ИИ для создания музыки по текстовым описаниям или аудиопримерам. Она позволяет задавать жанр, настроение, темп и инструментацию для получения готовых фоновых треков, джинглов или полноценных музыкальных идей. Вы можете ввести текстовый запрос (например: «энергичный lo-fi с гитарой и мягкими клавишными, 90 BPM») или подать аудиоклип, чтобы продолжить или сымитировать стиль — это удобно для ремиксов, мэшапов и расширения коротких мелодий. MusicGen поддерживает как text-to-audio, так и audio-to-audio сценарии, давая создателям практичные инструменты для быстрого прототипирования и финализации музыки. Созданная с упором на простоту использования, модель подходит и любителям, и видео/игровым продюсерам, и саунд-дизайнерам, которым нужна быстрая и настраиваемая музыка без глубоких знаний продакшена. Она генерирует качественные образцы, готовые для использования в видео, подкастах, играх или демо-треках, и предоставляет управление темпом, настроением и инструментами для соответствия требованиям проекта. Наличие нескольких размеров модели позволяет подобрать компромисс между качеством и вычислительными ресурсами; модель обучена на большом наборе лицензированной музыки для разнообразного звучания. Что делает MusicGen особенно полезной — сочетание качества, управляемости и поддержки аудиореференсов: вы получаете как новые композиции из текста, так и правдоподобные продолжения существующих фрагментов. К ограничениям относятся менее реалистичное воспроизведение вокала и возможная нестабильность при запросах на языках, отличных от английского. В целом MusicGen упрощает создание музыки, ускоряет итерации и расширяет творческие возможности для личных и коммерческих проектов.

Преимущества

Высокое качество
Точная настройка
Поддержка референсов

Настройки

BPM-  Beats Per Minute. Установить темп поколения
Продолжительность трека-  Продолжительность поколения
Версия модели-  Разные модели издают разный звук.
Стратегия нормализации-  Стратегия нормализации звука
Температура-  Температура модели. Чем выше значение, тем более творческий и чем ниже значение, тем более фокусированный.
Top K-  Количество наиболее релевантных элементов для выбора из результата. Более высокие значения приводят к более разнообразным ответам за счет рассмотрения большего количества кандидатов.
Top P-  Сокращает выборку до лексем с кумулятивной вероятностью p. При значении `0` (по умолчанию) используется выборка top_k.
Классификатор Бесплатное руководство-  Увеличивает влияние входов на выход. При больших значениях получаются выходы с меньшей вариативностью, которые более тесно связаны с входами.