L’intelligenza artificiale ha impattato fortemente nella società moderna, in diversi settori quali: l’economia, il retail, l’industria della salute e della farmaceutica, nello sport, la finanza, l’intrattenimento e nella ricerca e sviluppo. I sistemi di intelligenza artificiale vengono utilizzati anche nell’industria musicale, in particolare per:
- Generare musica
- Analizzare un contenuto o un testo
- Strutturare nuove melodie e brani
- Individuare le tendenze musicali
- Creare composizioni originali
- Identificare le violazioni di copywriting
La diffusione dei servizi di streaming come Spotify e Apple Music ha rivoluzionato l’industria musicale, grazie all’impiego dell’IA. Questi servizi suggeriscono un nuovo tipo di musica innovativa agli utenti basandosi sui loro gusti, semplificando così la scoperta musicale. L’IA è anche preziosa per gli artisti, che utilizzano strumenti e software appositamente progettati per accelerare la produzione e migliorare la qualità del suono. Inoltre, l’IA si occupa della composizione e dell’arrangiamento musicale, facilitando la creazione di brani originali. Questi strumenti sono ampiamente utilizzati in vari generi musicali, dall’elettronica al jazz, rendendo il processo creativo più accessibile e veloce.
L’IA MusicGen
L’IA MusicGen, è un sistema intelligente basato su un modello transformer, che è uno dei modelli più utilizzati per i linguaggi presenti finora. Il funzionamento di tale modello prevede il tratto successivo di una composizione musicale. Per ottenere risultati efficienti, il team di Audiocraft (versione musicale di ChatGpt), ha utilizzato l’Encodec di Meta, un tokenizzatore audio che scompone i dati in piccoli segmenti. MusicGen è stato ideato come un metodo veloce ed efficiente in un unico passaggio che esegue la tokenizzazione in maniera simultanea.
Funzioni
L’utilizzo è semplice, basta scrivere uno stile musicale, inserire facoltativamente una melodia esistente e in fine cliccare su genera. Con un paio di minuti, MusicGen è in grado di strutturare un campione di alta qualità, dalla durata di circa 12 secondi. Il processo di generazione può essere eseguito anche localmente, e sono disponibili tre varianti del modello con diverse dimensioni: 300 milioni (300 M), 1,5 miliardi (1,5 B) e 3,3 miliardi (3,3 B) di parametri. Quest’ultimo, naturalmente, è quello con il maggior potenziale per la creazione di musica più sofisticata, ottimale per abbinare in modo preciso l’input testuale e l’output audio.Inizio moduloFine modulo
Allo stato attuale, piattaforme come MusicGen non sembrano rappresentare una minaccia tangibile per coloro che lavorano nel mondo della musica.
L’IA, infatti, non è ancora in grado di generare qualcosa che vada al di là di una melodia elementare e breve. Inoltre, la qualità e l’unicità delle composizioni offerte non possono essere paragonate a quelle di chi opera in questo campo a livello professionale.
Tuttavia, la situazione si modifica se si tratta di creare sottofondi per video promozionali o presentazioni. Da questo punto di vista, l’IA potrebbe offrire prodotti già pronti all’uso.