NVIDIA pristatė neuroninį tinklą vaizdo įrašams generuoti pagal aprašymą
įvairenybės / / April 20, 2023
Jei norite stebėti, kaip imperatoriškasis šturmanas siurbia paplūdimį.
NVIDIA kompanija paskelbė naujas VideoLDM AI modelis, kuris kuria trumpus vaizdo įrašus pagal tekstą. Jis buvo sukurtas bendradarbiaujant su Kornelio universiteto mokslininkais.
„VideoLDM“ atsižvelgia į iki 4,1 milijardo parametrų, iš kurių 2,7 milijardo yra apmokyti naudojant vaizdo įrašą. Sugeneruoti klipai gali būti iki 2048 × 1280 pikselių 24 kadruose ir trukti iki 4,7 sekundės.
Neuroninis tinklas gali sukurti ir paprastas scenas su keliais žodžiais užklausoje, ir kažką sudėtingesnio. Keli pavyzdžiai:
- Fejerverkai.
- Šturmininkas siurbia paplūdimį.
- Keliautojas saulėlydžio metu vaikšto vienas ūkanotame miške.
Yra daugiau pavyzdžių projekto svetainė.
Šis NVIDIA neuroninis tinklas dar nėra viešasis. Jis buvo pristatytas kaip mokslinis darbas konferencijoje „Mašinų matymas ir modelių atpažinimas“.
Kūrėjai pažymėjo įspūdingą ir sparčią mokymosi pažangą, tačiau nekalbėjo apie galimą neuroninio tinklo ateitį. Nepaisant to, galime manyti, kad netrukus gausime visavertį vaizdo analogą vidurio kelionė.
Taip pat skaitykite🧐
- 10 neuroninių tinklų paslaugų vaizdo įrašams kurti
- 7 neuroninio tinklo įrankiai vaizdo kokybei pagerinti
- Runway pristato naują neuroninio tinklo modelį, skirtą vaizdo įrašams kurti iš teksto aprašymo