12.02.2025

Bilde og lyd med KI

Workshop der vi genererer bilde(r) og lyd, og setter dette sammen til en video. Vi kan variere hvor komplekst vi gjør det.

Det er nok mye å kikke på alt i løpet av noen få timer, men linkene nedenfor leder til ressurser som dere kan vende tilbake til senere.

Illustrasjonen er laget med Grok, på bakgrunn av teksten nedenfor, deretter lett redigert med MagicQuill.

En gruppe jobbet med skalamodeller og sfæriske (360) bilder - resultatet ble en vandring som dere finner her.


Generere bilder
Her finner du verktøy for å generere bilder ved hjelp av KI. Dersom dere logger på med en Microsoft-konto er Copilot et brukbart alternativ.

Eventuelt redigere bildet
MagicQuill er det mest brukervennlig jeg har sett. Gratis å bruke og laste ned. Du kan teste MagicQuill direkte, ved hjelp av Huggingface

Vi finner en måte å dele bilder på, og skrive ut no å henge på veggen.

Generere lyd
Her finner du en del verktøy for å lage lydbilder og musikk ved hjelp av KI. 

Lage tekst til bildet
I dette eksempelet har vi brukt Grok til å lage et utkast til en fortelling basert på et komplekst panoramabilde.

Lese opp teksten
For eksempel ved hjelp av naturalreaders.com

Sette sammen til en video
Bruk gjerne et program for å redigere video, det gir flere muligheter, men det er også mulig å sette et bilde og et lydstrekk sammen til en video med Oneimagevideo.com.

Det hele kan ende som dette. Her er utgangspunktet et stort bilde, laget med Stable Diffusion. Så er bildet beskrevet ved hjelp av Grok (teksten nedenfor) og lest ved hjelp av naturalreaders.com. Musikken er laget med Suno, og det hele redigert med videoredigeringsprogrammet CapCut, med en bevegelse gjennom panoramaet (Ken Burns effekt).

Video kan genereres med en rekke forskjellige tjenester, som Firefly.adobe.com eller Lumalabs.ai. Lumalabs kan også generere 3D-modeller (som vist i dette prosjektet - nederst) eller lage 3D-modeller av fysiske objekter og omgivelser (eksempel).

Vi kan forresten lage KI-genererte sfæriske bilder også, med verktøy som Skyboxai (demonstrert her) eller PanoPulse. Dermed kan vi se oss rundt i en annen versjon av verdenen beskrevet i videoen ovenfor.