Nvidia will Bilder beweglich machen wie in Harry Potter

Wie bei Harry Potter - Nvidia will, dass sich eure Bilder bewegen - und so sieht es aus

ChatGPT und Midjourney sind prominente Beispiele für synthetische Intelligenzen jedoch Nvidia ist ebenfalls ein bekannter Name in der Branche. Das Unternehmen hat nun ein neues KI-Projekt vorgestellt das es ermöglicht Bilder zu animieren. Ähnlich wie in Harry Potter sollen die Bilder so zum Leben erweckt werden. Das Projekt kommt aus dem Toronto AI-Labor von Nvidia.



Harry Potter und die latenten Diffusionsmodelle


Latent Diffusion Models (LDM) sind künstliche Intelligenzen die Videos generieren, ohne viel Rechenpower zu brauchen. Laut Nvidia basiert die Arbeit an ihrem Projekt auf Text-zu-Bild-Generatoren, ebenso wie zum Beispiel Stable Diffusion. Zusätzlich haben sie angeblich eine »zeitliche Dimension« hinzugefügt.



Was heißt das? Einfach gesagt bedeutet das, dass Standbilder »realistisch« animiert werden sollen. Ein einzelnes Bild wird also angeblich zum Video werden - genauer gesagt zum GIF. Uns erinnert das stark an die bewegten Bilder aus Harry Potter. Aber auch das Meme-Potenzial scheint grenzenlos zu sein.



Das Projekt soll Upscaling-Technologie nutzen um möglichst echt wirkende Bewegungen in guter Qualität darzustellen. Aus einem Bild soll so ein 4,7 Sekunden langes Video mit einer Auflösung von 1․280 x 2․048 Pixel werden. Bei einer Auflösung von 512 x 1․024 sollen die Videos auch länger werden können.



Das bedeutet einen großen Schritt im Text-zu-Video-Bereich und könnte in Zukunft diverse Anwendungsmöglichkeiten in beispielsweise der 🎬 Filmbranche bieten.



Im momentanen Zustand lässt die Qualität wohl noch etwas zu wünschen übrig, da man noch Artefakte sieht. Auch die sich ständig wandelnde Umgebung sieht im Moment stark künstlich aus, allerdings es ist kein Geheimnis. Dass KI-Technologien die Eigenschaft haben, sehr schnell fortzuschreiten.



Wir bleiben gespannt was in Kürze noch in diesem Bereich passieren wird.



Werdet ihr die Nvidia-technologe nutzen um euer Meme-Game etwas aufzuwerten oder sehen euch die Videos momentan noch etwas zu gruselig aus? Bei manchen davon kann es einem ja durchaus kalt den Rücken runter laufen. Freut ihr euch auf weitere Entwicklungen im Text-zu-Video-Bereich? Schreibt es uns gerne in die Kommentare!






Kommentare


Anzeige