Nvidia har tagit fram ny AI för ljud och musik

Nvidia har tagit fram en ny AI-modell som kan generera musik och ljud från textbeskrivningar men även modifiera röster och skapa nya ljudeffekter.
Nvidia har tagit fram ny AI för ljud och musik - Jensen Huang  Nvidia
AP Photo/Chiang Ying-ying

AI-modellen har döps till Fugatto och står för “Foundational Generative Audio Transformer Opus 1”.

Tekniken riktar sig främst till kreatörer inom musik, film och spel.

Marknaden för generativa AI-verktyg för ljud och video växer stadigt. Två techbolag som redan har gjort stora framsteg inom denna kategori AI-generering är Meta och Runway, skriver nyhetsbyrån. Det som särskiljer Fugatto är dess förmåga att omvandla befintligt ljud. Exempelvis kan en pianomelodi förvandlas till en sångstämma, eller en röstinspelning kan ändras i accent och känsloförmedling.

“Generativ AI kommer att revolutionera skapandet av musik, spel och annat kreativt arbete”, säger Bryan Catanzaro, vice VD för tillämpad djupinlärning på Nvidia. Trots potentialen kommer Fugatto än så länge att vara en teknik som används internt. Techbolaget överväger hur och när modellen kan lanseras på ett ansvarsfullt sätt.

Det rapporterar Reuters som har tagit del av en presentation.

Dela:

Kommentera artikeln

I samarbete med Ifrågasätt Media Sverige AB (”Ifrågasätt”) erbjuder Afv möjlighet för läsare att kommentera artiklar. Det är alltså Ifrågasätt som driver och ansvarar för kommentarsfunktionen. Afv granskar inte kommentarerna i förväg och kommentarerna omfattas inte av Affärsvärldens utgivaransvar. Ifrågasätts användarvillkor gäller.

Grundreglerna är:

  • Håll dig till ämnet
  • Håll en respektfull god ton

Såväl Ifrågasätt som Afv har rätt att radera kommentarer som inte uppfyller villkoren.