Hiljuti tuli OpenAI välja uue versiooniga oma pildiloome tehisintellektilst Dall-E ja see on tekitanud väga palju kõneainet. Midjourney on alates versioonist 4 olnud selge ja kõigutamatu liider antud valdkonnas. Kuid Dall-E versioon 3 lubab Midjourneyle kõva lahingu anda. Kuid kui tõsiseks see konkurent Midjourneyle kujuneb? Vaatame ise järele.

Mis on Midjourney?

Midjourney on generatiivne pildiloomise mudel, mis loob pilte tekstipromptide põhjal. Koos Dall-E ja Stable Diffusioniga on Midjourney üks kolmest suurimast pildiloome tehisintellektist.

San Francisco-s asuva sõltumatu uurimislabori poolt välja töötatud Midjourney pakub piiratud arvu tasuta pilte, pärast mida peavad kasutajad maksma kuutasu piiramatu pildiloomise eest.

Midjourney tugevus seisneb võimes luua väga kõrge kvaliteediga pilte vastavalt kasutaja määratud valgustusele, stiilile, orientatsioonile ja värvidele. Midjourney suudab ka kokku miksida mitmeid pilte, võimaldades põnevaid stiilikombinatsioone.

Mis on Dall-E 3?

DALL-E 3 on OpenAI poolt välja töötatud tehisintellekti pildiloome mudel. Sarnaselt Midjourney'le on see loodud piltide genereerimiseks tekstipõhistest käskudest. Dall-E 3 on oluline täiustus oma eelkäija DALL-E 2 võrreldes, mis puudutab prompti jälgimise täpsust ja pildi kvaliteeti. Süsteem on kättesaadav otse OpenAI kaudu ChatGPT Plus või Enterprise kasutajatele, kuid seda saab ka tasuta kasutada Bing Image Creatori kaudu Microsofti kontoga.

DALL-E 3 tugevus seisneb selle võimes mõista rohkem nüansse ja detaile kui varasemad süsteemid, tõlkides ideid erakordselt täpseteks piltideks. Dall-E 3 on üsna kiire ja efektiivne piltide loomises.

Dall-E3 ja Midjourney võrdlus: kumb pildiloome tööriist on siis parem?

Test 1 - Fotograafia

Otsustasin panna Dall-E proovile ja muljed olid paremad kui ootasin. Fotograafia promptides osas annavad nii Dall-E3 kui ka Midjourney hämmastavaid tulemusi. Ainult tõelised AI kunstisõbrad võivad märgata, et Midjourney pakub veidi paremat valgustust ja loomulikumaid tekstuure. Kuid meie ülejäänute jaoks pakuvad nad mõlemad silmapaistvaid pilte.

Dall-E3 vs Midjourney - Both create stunning Photography



Test 2 - Fantaasiakunst

Liikudes edasi fantaasiakunsti juurde, palusin mõlemal mootoril joonistada tumedas kapuutsis figuuri, mis tuleb esile kuldsetest helmeist koosnevast osakestevõrgust. Taaskord oli raske otsustada kumb on parem! Fantaasiakunsti loojad märkisid, et Dall-E järgib täpsemini juhiseid, kuid Midjourney pakub pisut detailsemat tekstuuri ja pildikvaliteeti.

Dall-E3 vs Midjourney - Two Best AI Image Generating AIs at the market



Test 3 - Abstraktsed käsud

Järgmisena testisin abstraktsete kontseptsioonide tõlgendamist. Palusin mõlemal tehisintellektil jäädvustada õnnetunnet ettevõtlikul ja hipilikul moel. Dall-E oli vast rohkem sõnasõnalises tõlgenduses kinni, kui Midjourney. Millist neist ma kasutaksin esitluses? Noh, see sõltub üldisest stiilisuunast, kuid mõlemad on äärmiselt muljetavaldavad.

Dall-E3 vs Midjourney - Use either Generative AI to get stunning results


Test 4 - Tekst piltidel

Järgmiseks ülesandeks sai võetud teksti kujutamine loodud piltidel. Oli juba ette teada, et Dall-E3 võimekus selles valdkonnas on muljetavaldav, kuid üllatus oli siiski suur. Palusin luua pildi parfüümipudelist tekstiga "Nature". Dall-E 3 suudab uskumatult hästi aru saada, et soovid pildile teksti ja vastavalt sellele ka edastada. Midjourney jääb selles osas väga selgelt hätta.

Open AI Dall-E3 excels in text on image creations



Dall-E3 puudused

Samas on Dall-E-l  võrreldes Midjourneyga endiselt mõned puuduvad funktsioonid. Näiteks võimaldab Midjourney teil luua pilte mis tahes suhtega (nt 16:9, 4:5 jne), kasutada pildist-pildile tehnikaid, suumida välja, parandada konkreetseid osi pildil ja kohandada stiilimäärasid. Dall-E pakub aga ainult 1x1 ruudukujulisi pilte, millel pole palju ruumi kohandamiseks.

Midjourney puudused

Teisest küljest on Midjourney'l üks puudus - sellel puudub brauseripõhine liides ja selle kasutamiseks peate installima Discordi ja õppima seda kasutama. See võib olla takistuseks paljudele kasutajatele, kes ei soovi või ei saa oma arvutitesse lisatarkvara installida või lihtsalt ei oma aega ega soovi Discordi kasutamist õppida.

Kus saab Dall-E3 kasutada?

Selleks, et Dall-E3 kasutada tuleb lihtsalt minna Bing Create (bing.com/create) lehele ja saate hakata tasuta looma Dall-E pilte. Mõned ChatGPT Plus ja Enterprise kasutajad saavad Dall-E3 kasutada ka otse ChatGPT-s. OpenAI on lubanud, et see võimalus avatakse varsti kõigile ChatGPT tasuliste versioonide kasutajatele.

Järeldus

Üldiselt on nii Dall-E 3-l kui ka Midjourneyl oma tugevused ja nõrkused AI pildiloomes. Fotograafia ja fantaasiakunsti osas toodavad mõlemad mootorid hämmastavalt häid tulemusi. Midjourney pakub seal vast veidi paremat valgustust ja tekstuure. Abstraktsete kontseptsioonide osas on Dall-E kaldu sõna-sõnalisse interpretatsiooni, samal ajal kui Midjourney loob pilte veidi vabamalt. Dall-E selge eelis ilmneb siis, kui on vaja pilti täiendada tekstiga. Midjourney jääb selles aspektis selgelt hätta.

Puuduvate funktsioonide osas tooks välja, et Dall-E ei suuda luua pilte erinevates suhetes, kasutada pildist-pildile tehnikaid, suumida välja, parandada konkreetseid osi pildil ega kohandada stiilimäärasid. Teisest küljest nõuab Midjourney Discordi installimist ja selle kasutamise õppimist, mis võib olla puudus.

Mis puutub minu eelistusi, siis hakkan kindlasti rohkem kasutama Dall-E3, kuid kindlasti vajan ka Midjourney's saadaval olevaid täiustatud pilditöötlusfunktsioone. Seega hoian veel mõnda aega alles ka oma Midjourney tellimust.