Meta ha annunciato il rilascio di AudioCraft, un innovativo e potente framework open source che consente di generare audio e musica realistici e di alta qualità attraverso l’uso dell’intelligenza artificiale generativa (IA) e a partire da un input testuale.

Questo nuovo strumento si aggiunge ai precedenti sforzi di Meta nel campo della generazione audio e si propone di semplificare l’uso dei modelli generativi per la creazione di contenuti audio di alto livello. AudioCraft è stato sviluppato a partire da modelli di IA distinti, ognuno con specifiche funzioni e capacità uniche.

I modelli generativi di AudioCraft

AudioCraft include tre modelli di intelligenza artificiale generativa: MusicGen, AudioGen e EnCodec.

  • MusicGen: il modello MusicGen ha già dimostrato la sua efficacia nel generare musica basandosi su descrizioni testuali. Meta ha rilasciato il codice di addestramento di MusicGen, consentendo agli utenti di addestrare il modello con i propri set di dati musicali. Tuttavia, sorge la questione etica riguardo all’utilizzo di dati esistenti per creare musica simile, il che potrebbe sollevare problemi di copyright e proprietà intellettuale;
  • AudioGen: a differenza di MusicGen, il modello AudioGen è focalizzato sulla generazione di suoni ambientali ed effetti sonori, piuttosto che di musica e melodie. Basato sulla diffusione, AudioGen apprende gradualmente come rimuovere il rumore dai dati iniziali per avvicinarli al prompt di destinazione, producendo suoni realistici e complessi. Tuttavia, la mancanza di prove o campioni rende difficile valutare appieno la qualità dei risultati;
  • EnCodec: questo modello rappresenta un miglioramento rispetto a un precedente modello di Meta per la generazione di musica, eliminando artefatti indesiderati o imperfezioni ricostruendo il segnale originale con alta fedeltà.

Mentre i primi due funzionano alla stregua di ChatGPT elaborando una serie di istruzioni testuali, EnCodec fornisce supporto nella produzione audio di alta qualità.

AudioCraft è in grado di creare canzoni?

Non è ancora chiaro se questo tool sarà realmente in grado di creare canzoni vere e proprie, è molto più probabile che venga utilizzato per la creazione di suoni semplice e di musiche di sottofondo.

Quali implicazioni per il diritto d’autore?

La possibilità di generare suoni che possono essere confusi con quelli prodotti da un professionista potrebbe portare a controversie riguardo alla proprietà intellettuale e ai diritti d’autore. Tuttavia, Meta si sta impegnando a studiare modi per controllare e migliorare i modelli generativi audio, garantendo al contempo che siano utilizzabili in modo responsabile e trasparente.