Innovatie

Breng je idee visueel tot leven met Midjourney: een next level AI-tool

0

In mijn tienerjaren vond ik het leuk om te experimenteren met design. Ik kocht een pentablet, installeerde een superlegale versie van Adobe Photoshop en begon met creëren. Tekenen, plaatjes bewerken en effecten toepassen. Dat soort dingen. Eindresultaat? Een hoop stront met een scheve kers erop. Ik kan helemaal niet designen, joh. Heb het gevoel er niet voor en ook tijdens mijn aansluitende opleiding Communicatie & Multimedia Design werd het er niet beter op. Hup, designvaardigheden in de prullenbak en hallo schrijverscarrière. Het schrijven gaat mij net iets beter af. Nu, zo’n 10 jaar later, ontstaan er opties waardoor ook ik ineens ‘kan designen’. Niet met een pentablet en Photoshop, maar met geschreven woorden. Welkom Midjourney.

Text-to-image-gegenereerde afbeeldingen

We hebben allemaal weleens een idee in ons hoofd. Zodra we een potlood pakken om dat idee tot leven te brengen, krijgen we nooit het gewenste op papier. Tenzij je heel goed kan tekenen, natuurlijk. Of stel je voor dat je afgelopen nacht een bizarre droom hebt gehad, die je graag wil hercreëren. Wat nou als je dat idee of die droom precies zo onder woorden weet te brengen, dat een robot er binnen 60 seconden een passend beeld bij weet te maken? Dan denk je waarschijnlijk aan de toekomst. Maar die toekomst is er al. We staan aan de vooravond van een revolutionaire ontwikkeling. Zo is de afbeelding hieronder niet door mij of een grafisch vormgever gemaakt, maar door een robot.

Man leest boek

Hoe lang bestaan deze tools al?

Onlangs zag ik een video van het YouTube kanaal Vox, waarin uitgebreid werd uitgelegd waar deze AI-tools vandaan komen. Zo is de eerste tool al in 2015 ontstaan. Er was een tool die een afbeelding kon analyseren en in woorden kon uitleggen wat er precies gaande is op de foto. Maar wat als je dit fenomeen omdraait? Je typt iets in en op basis van die woorden ontstaat een afbeelding. Dat is precies wat is gebeurd.

In het begin ontstonden vage afbeeldingen van 32×32 pixels. Met wat fantasie kon je inbeelden wat er daadwerkelijk gebeurde in de gegenereerde foto. Dit was slechts het begin, want sinds 2022 is het al mogelijk om haarscherpe, gegenereerde afbeeldingen te creëren. De mogelijkheden zijn eindeloos. De enige beperking zit in je gedachten.

Craiyon

Al langere tijd doe ik onderzoek naar verschillende AI-tools. Zo gebruikte ik al meerdere AI copywriting-tools, waarover ik onlangs nog een artikel publiceerde. Maar er zijn veel meer vakgebieden met zulke AI-tools. Nog geen 2 maanden geleden kwam ik voor het eerst in aanraking met de tool Craiyon. Ik typte wat zinnen in en tot mijn verbazing ontstonden er 9 nietszeggende afbeeldingen (zie afbeelding hieronder) die enige gelijkenissen vertoonde met wat ik intypte. Toch zie je in iedere afbeelding wel dat er íets mis is. Ondanks de mankementen was ik onder de indruk.

DALL-E

Craiyon is een tool die werkt op DALL-E Mini, een uitgeklede versie van het veel uitgebreidere DALL-E 2, waar momenteel een wachtrij voor is. Ik sta al een poosje in deze wachtrij om toegang te krijgen. Met DALL-E 2 is het mogelijk om echt sicke designs te maken. Onlangs werd ik geconfronteerd met een alternatieve, openbare oplossing, genaamd Midjourney. Ik besloot een kijkje te nemen.

Midjourney

Zoals gezegd, 2 maanden geleden was ik flabbergasted door het programma Craiyon. Wat ik toen niet wist, is dat die tool slechts een speldenprikje biedt van wat Midjourney kan. Midjourney is een openbare AI-tool, die opereert vanuit een Discord-server. Door drukte is het maken van gratis creaties helaas niet meer beschikbaar, waardoor je direct een abonnement dient af te sluiten.

Zo gebruik je Midjourney

  1. Ga naar https://www.midjourney.com/home/
  2. Klik op ‘Join the beta’
  3. Maak een account aan op Discord
  4. Log in
  5. Selecteer één van de newbie-bots aan de linkerzijde
  6. Typ /imagine en tik uit wat je wil zien

De diepte in

Het is in Midjourney mogelijk om aanvragen tot in de kleinste details in te voeren. Als beginner is het leuk om generieke zoektermen te gebruiken als:

‘Photorealistic image of a guy writing a blog about AI’

Deze term voerde ik ook op Craiyon in. Maar wat nu als ik de afbeelding in een specifieke stijl met instellingen wil? Dan kan ik dat ook aan het programma vragen. Voer bijvoorbeeld termen in als 4k, 1980s, 16:9, tilt shift of weet ik veel welk element je wil terugzien. Midjourney begrijpt het allemaal en zal proberen een mooi geheel te maken van je zoekterm. Kijk maar eens.

Afbeelding, gemaakt met Midjourney.

Zoekterm: ‘Photorealistic image of a guy writing a blog about AI’

Vervolgens heb ik de mogelijkheid om 1 van deze 4 afbeeldingen te upscalen. Daarmee voegt het programma meer details toe en wordt het bronbestand groter. Ook kan ik variaties maken op de gegenereerde afbeeldingen. Als voorbeeld ga ik in dit geval van de afbeelding linksboven uit. Ik ga deze zowel upscalen als een variatie erop maken.

Variatie

Alternatieven op de eerste afbeelding van de zoekterm.

Zoals je ziet, heeft Midjourney de eerste foto als beginstuk genomen. Op basis van die eerste foto heeft de tool soortgelijke foto’s gecreëerd, met telkens iets andere elementen. Zo kun je oneindig door itereren.

Upscalen

Afbeelding gemaakt met Midjourney.

Geupscalde versie van de eerste afbeelding van de zoekterm.

Hier zie je de eerste afbeelding, maar dan volledig geupscaled. Er zijn meer details toegevoegd en het bronbestand is nu 1664×1664 pixels. Het schrijfelement mis ik hier nu wel en ik kan er niet goed zien dat dit een schrijver is die een blog schrijft. Maar de kwaliteit is een stuk hoger dan op Craiyon.

Creaties zijn vrijwel volledig te gebruiken

Alle creaties die uit Midjourney komen zijn vrij te gebruiken op bijna alle manieren. Het enige wat niet mag, is de afbeeldingen als NFT verkopen via de blockchain. Dat komt omdat er officieel géén illustrator is die de afbeelding heeft gemaakt. Er zit dus geen copyright op de afbeeldingen. Daarom mag ik deze, volgens de FAQ van Midjourney, vrij gebruiken in artikelen, designs, maar ook printen en inlijsten of verkopen op bijvoorbeeld T-shirts of mokken.

Gegenereerde afbeeldingen van anderen

Als ik door Midjourney scroll zie ik onder andere de volgende creaties langskomen van anderen, die ik hier dus vrij in mijn artikel mag delen.

Zoekterm: Warrior knight ivory colored mythical creature.

Zoekterm: Warrior knight ivory colored mythical creature.

Zoekterm: photoreal detailed batman cat.

Zoekterm: photoreal detailed batman cat.

Zoekterm: settlement in the middle of the forest in the style of Studio Ghibli.

Zoekterm: settlement in the middle of the forest in the style of Studio Ghibli.

En de lijst van creaties gaat oneindig door. Midjourney wordt iedere seconde slimmer, sneller en beter in het creëren van het perfecte plaatje. Nou ja, het bijna perfecte plaatje. Als je heel goed kijkt naar de meeste afbeeldingen, dan schort er nog wel iets aan. En daar kan een doorgewinterde designer mee aan de slag.

Is dit zorgwekkend voor designers?

Deze AI text-to-image-tool, en alle aanstaande tools, zijn geautomatiseerde varianten van hedendaagse, menselijke beroepen. Vergelijkbaar met de automatisering van veel beroepen, zoals in de afgelopen eeuw is gebeurd. Toch denk ik dat met de komst van deze tools het einde van de traditionele designer nog lang niet in zicht is. Sterker nog, ik denk dat designers veel effectiever en sneller kunnen werken met behulp van deze tools. De kunst is nog steeds om net datgene te typen wat je wil zien, zoals een designer probeert een beeld in het hoofd om te zetten in iets functioneels. Probeer nu een computer eens tot in detail uit te leggen wat je voor je ziet.

In de praktijk vergelijk ik het met de briefing van een opdracht. Als je een opdrachtgever hebt die zegt: doe maar wat moois voor dit budget, dan krijg je veel creatieve vrijheid. Diezelfde opdrachtgever geeft vaak de meeste feedback, omdat de uitkomst niet bij zijn beeld klopt. Maar als je een uitgebreide briefing hebt met kaders, dan is het veel makkelijker om daarbinnen iets te maken. De kans is groter dat het resultaat aansluit bij de vraag. Het is de kunst om die briefing zo specifiek mogelijk te maken en dat vergt een nieuwe manier van denken en doen.

Wat zijn de gevolgen van deze ontwikkeling?

Dit artikel raakt nog maar een klein deel van Midjourney. De komst van programma’s als Midjourney kunnen rekenen op positief en negatief commentaar. Het is fantastisch dat er zulke programma’s zijn die in korte tijd beelden scheppen, waar je als mens uren mee bezig bent om te maken. Het is een prachtige tool om concepten mee te creëren. Designers kunnen deze tool gebruiken om schetsen mee te maken en zelf volledig naar wens te pimpen. Zo haal je het beste uit beide werelden.

Aan de andere kant is er natuurlijk voldoende op te merken op AI-gegenereerde afbeeldingen. De regelgeving loopt achter, waardoor mensen gaan pronken met kunst die ze niet zelf hebben gemaakt. Ook is het de vraag hoe groen de komst van deze tools is. Veel aanvragen van uiterst specifieke afbeeldingen in hoge kwaliteit in korte tijd, vragen veel rekenkracht. Waar staan deze servers en hoeveel stroom verbruiken ze? Ik heb werkelijk geen idee… De toekomst zal ons leren welke impact deze AI-tools hebben op onze levens.

(Noot van de redactie: benieuwd naar de ervaringen van de auteur 6 maanden later met Midjourney? Hij deelt ze in dit artikel.)