Ai - a realistic approach

 Klik hier voor Nederlands

ChatGPT 4o. The whole internet is talking about it. The astonishing results clearly show the direction generative AI is heading. There are plenty of articles online about what it can do. Without wanting to discredit ChatGPT 4o (and Google Gemini), as the possibilities are truly amazing, I would like to write this text to inform designers and employers about the limitations and even dangers associated with it.

 

TIME LIMIT

ChatGPT 4o offers astonishing possibilities, but they come at a cost. In both the free and paid versions of ChatGPT, you can only generate one image or modification of an image every ten minutes. This is not practical for a professional workflow. Adobe Firefly, on the other hand, offers a 'Quick Mode' that allows you to repeatedly create a prompt in a short amount of time until you achieve the desired result. Only once you are satisfied can you choose to generate the photo in high quality. In a month, you can perform up to 1000 requests in succession if needed.

See the announcement by ChatGPT below. 

"I can't generate a new image at the moment because there is a limit on the number of generated images per short period. You can try again in about 10 minutes. Let me know how I can assist you further!"

 

See below the Adobe Firefly 'Quick Mode' button, which allows you to create many prompts in succession without a time limit.

 

COLOR ADJUSTMENT

When you ask ChatGPT to adjust the color of an object, it doesn't just change the color. The entire object is re-rendered. Photoshop now has a standard toolbar in the BETA version, and soon in the regular version, where you can choose a color from the image and directly recolor it without making any selections. And this happens on the actual object itself. Nothing is re-rendered generatively.

The colors of the scarf have been adjusted based on a prompt. But it's no longer the same lady, not the same scarf, and even the glasses, background, everything is different.

 

IN PAINTING VERSUS GENERATIVE FILL

ChatGPT can now fill part of an image with something else based on a selection and a prompt. Did you know that Adobe Firefly has been able to do this for a while? It has 'Generative Fill'. This can be done on the Firefly website as well as in Photoshop. And in Firefly, you have 1000 credits per month without a time limit. You can freely refine your prompt until you achieve the desired result.

 Adobe Firefly 'Generative Fill' performed on an image that I once retrieved from Firefly but uploaded myself for this modification. With ChatGPT's Painting, this is not possible. Only the part I selected is modified. The rest remains unchanged. With ChatGPT, it's different, as shown below.

 

IN PAINTING ONLY POSSIBLE WITH CHATGPT IMAGE

ChatGPT's 'In Painting' can only be used with a photo already created in ChatGPT and still present in the chat. You cannot apply inpainting by uploading your own photo, as you can with Adobe Firefly's 'Generative Fill' or in Photoshop. This makes ChatGPT's feature practically useless. The impressive YouTube videos are indeed striking, but with this knowledge, it becomes much less attractive.

Because I already had the left image in the ChatGPT chat, I could select the glasses and have them removed. And yes, the result is really beautiful. But... look closely, the entire image is re-rendered. Different scarf, different person.

Don't get me wrong. ChatGPT now creates truly stunning images. But in ChatGPT, it always ends up creating a completely new image, where the consistency of the product and other elements has not remained sufficiently the same. In Adobe Firefly, only the selected part is modified, while the rest of the image remains unchanged, just like in Photoshop.

 

ChatGPT itself recommends Firefly over ChatGPT (lol)

"Yes, that's largely true! With inpainting using GPT-4o, it seems like only the selected part is adjusted, but in practice, the entire image is regenerated. This is because the model does not adjust the image pixel by pixel but reinterprets and reconstructs the entire scene to naturally integrate the edited region with the rest.

This means that:

✅ The composition and colors largely remain preserved.

✅ The background and other details can appear the same at first glance.

❌ However, there may still be small differences in texture, lighting, or shapes in the unedited part.

If you want a truly accurate inpainting tool where only the selected area is adjusted, Photoshop’s Generative Fill or tools like Runway ML and Stable Diffusion inpainting are better options."

 

PHOTOREALISM

Now, Adobe Firefly offers stunning photorealistic quality for many photos. However, this may not always be the case on the first attempts, sometimes even appearing ugly. With Firefly, you can continuously improve your prompt to eventually achieve the photorealistic or other desired result. This is especially useful because Firefly first shows a lower-quality example thanks to the 'quick mode,' allowing you to immediately refine your prompt. With ChatGPT, you get the 'high quality' result right away and then have to wait ten minutes.

 

LIMITED PIXEL SIZE

Everyone is talking about the amazing possibilities of generative AI, but no one mentions the limited resolution. ChatGPT creates images no larger than approximately 1500 x 1024 pixels or a comparable size in a different aspect ratio. Firefly goes a bit higher with 2024 x 2024 pixels in total. While this is sufficient for many purposes, it doesn't come close to a 20 or 40-megapixel photo taken by a professional camera. Therefore, all generative AI offered so far is limited in resolution and, consequently, limited in capabilities. Yes, there are now many upscaling options available, but they won't achieve the super high quality of a professional camera.

Portion of the bottom photo, taken with the Nikon Z8 40-megapixel full-frame camera. This size is far from achievable with AI.

 

RACE

providers are fiercely competing with each other. One provider comes up with something new, and suddenly the other is lagging, only to catch up shortly after. Especially with Firefly, I tell people that if a feature comes out that Firefly doesn't have, just wait a moment, and Adobe Firefly will offer it too, often even better. As of now, the Firefly model 3.0 is already a bit outdated, and a new model is on the way. You can bet that Firefly will be the talk of the town in (social) media once again.

 

COPYRIGHTS

OpenAI and Google have essentially scraped the entire internet to train their AI models, violating almost every possible copyright rule in the process. In reality, these big tech companies have stolen art from every creative person in the world. This is easily forgotten when you can so easily create (or have created) a graphic design. But that doesn't make the legal risk disappear. Just as hard as people are working on this generative AI, they are also working on recognizing the origin of images. It's not a question of if, but when the first lawsuits will come against companies that have used images generated by ChatGPT, Midjourney, Gemini, etc.

The only party that can generate 100% copyright-safe images is Adobe Firefly.

This is because Adobe trains its model only with purchased and proven copyright-free content. Adobe guarantees this claim.

 

GEOPOLITICAL ISSUES

I do not wish to impose a political opinion, but it seems clear to me that the United States is currently putting pressure on other countries to achieve certain goals. OpenAI stood alongside Donald Trump during his inauguration, and a significant amount of money was pledged to OpenAI by Donald Trump. This makes the AI company a form of threat to non-American companies as well. An AI model is trained by feeding it a lot of data, but it is also given many instructions on how to act. And all prompts are preserved. By making your company dependent on such a company, you run the long-term risk of exposing business secrets and becoming vulnerable to pressure. There is also a chance that you could end up in a copyright lawsuit in the future. All these are factors to consider before embarking on large projects with a particular AI provider.

 

For European companies, the French Mistral.ai is a serious alternative. The AI model is trained according to European rules, values, and norms, and also takes into account European languages more effectively. It is also the fastest language generator with 1000 words per second. And the images it generates are really not bad. Although I must admit that, at the time of writing, I find that ChatGPT 4o can make slightly more realistic images than all other providers. But that will change soon. Therefore, also take a serious look at https://mistral.ai. And download the 'Le Chat' app from Mistral.ai. By using this, you avoid a lot of geopolitical risks in the future. Are you only interested in the chat? Then a free registration is also sufficient.

There is another advantage with Mistral.ai (Le Chat). It is open source. This means that people who understand it can look at the programming code. But you can also run a version on your own computer so that all your questions and answers do not leave your computer. More privacy-friendly than that is not possible.

 

CONCLUSION

ChatGPT is turning the graphic design world upside down with ChatGPT 4o—that's a fact. As long as you accept the limitations and risks, you can create a graphic design based on a text prompt, complete with typography. Why is typography in an AI-generated image more challenging with Adobe Firefly? Because Adobe uses a system that ensures no risk of copyright infringement. Even though ChatGPT and other AI providers are amazing, the question remains whether it is wise to use them for actual designs for your company, especially if it's a large corporation.

Mistral.ai > Geopolitically much safer.

Adobe Firefly > 100% copyright safe. Legally and morally responsible.

_________________________________________________________

AI EEN REALISTISCHE BENADERING

ChatGPT 4o. Het hele internet praat er over. De verbluffende resultaten er van laten duidelijk zien welke kant generative ai op gaat. Op internet zijn voldoende berichten te vinden wat het allemaal kan. Zonder ChatGPT 4o (en Google Gemini) af te willen kraken, want de mogelijkheden zijn werkelijk verbluffend, wil ik deze tekst graag schrijven om designers en werkgevers te informeren over beperkingen en zelfs gevaren die er aan kleven. 

 

TIJDLIMIET

ChatGPT 4o biedt verbluffende mogelijkheden maar daar hangt een prijskaartje aan. Zowel in de gratis als in de betaalde versie van ChatGPT mag je maar één plaatje of aanpassing van een afbeelding per tien minuten genereren. Voor de professionele werkvloer is dat niet werkbaar. Adobe Firefly daarentegen biedt via 'Snelle modus' de mogelijkheid om in een korte tijd steeds opnieuw een prompt te maken tot je het gewenste resultaat hebt gevonden. Eenmaal tevreden dan pas kan je kiezen om de foto in hoge kwaliteit te genereren. In een maand mag je 1000 verzoekjes desnoods achter elkaar uitvoeren. 

 

Zie onder de mededeling door ChatGPT. 

 

Zie hier onder de Adobe Firefly 'Snelle modus' knop waardoor je veel prompts achter elkaar kan maken zonder tijdlimiet. 

 

KLEUR AANPASSEN

Wanneer je in ChatGPT vraagt om de kleur van een object aan te passen, dan wordt niet de kleur alleen aangepast. Het hele object wordt opnieuw gerenderd. Photoshop heeft nu in de BETA versie en dus snel in de gewone versie een standaard balkje waarin je een kleur uit de afbeelding kan kiezen en direct om kan kleuren, zonder het maken van een enige selectie. En dit gebeurd op het werkelijke object zelf. Er wordt niets opnieuw generatief gerenderd. 

De kleuren van de sjaal is op basis van een prompt aangepast. Maar het is niet meer dezelfde dame, niet meer dezelfde sjaal, en ook de bril, achtergrond, alles is anders. 

 

IN PAINTING VERSUS GENERATIVE FILL

ChatGPT kan nu op basis van een selectie een deel van een afbeelding invullen met iets anders op basis van een prompt. Wist je dat Adobe Firefly dat al een hele tijd kan? Dat heeft 'Generative Fill'. Dat kan in de website van Firefly als wel in Photoshop.  En in Firefly heb je 1000 credits per maand zonder tijdlimiet. Je kan vrij je prompt steeds verder verbeteren tot je het gewenste resultaat hebt.

Adobe Firefly 'Generative Fill' uitgevoerd met een afbeelding die ik ooit wel uit Firefly heb gehaald maar voor deze aanpassing zelf heb ge-upload, bij ChatGPT in Painting is dat niet mogelijk. Alléén waar ik heb gegumd wordt de afbeelding aangepast. De rest blijft ongewijzigd. In ChatGPT ligt dat anders, zie hier onder. 

 

IN PAINTING KAN ALLÉÉN MET CHATGPT AFBEELDING

'In Painting' van ChatGPT kan alléén met een foto die al is gemaakt in ChatGPT, en op dat moment dat het nog in de chat zit. Je kan in painting niet toepassen door een eigen foto te uploaden, zoals dat wel kan in Adobe Firefly met 'Generative Fill' of in Photoshop. Dat maakt de functie van ChatGPT praktisch nutteloos. De stoere youtube filmpjes zijn weliswaar indrukwekkend maar met deze wetenschap wordt het ineens een stuk minder aantrekkelijk.

Omdat ik de linker afbeelding al in de Chat van ChatGPT had staan kon ik de bril selecteren en die laten verwijderen. En ja, het resultaat is écht heel mooi. Maar.... kijk eens goed, de gehele afbeelding is opnieuw gerenderd. Andere sjaal ander persoon. 

Begrijp mij niet verkeerd. ChatGPT maakt nu écht waanzinnig mooie beelden. Maar het blijft in ChatGPT altijd zo dat het een geheel nieuwe afbeelding maakt waarbij de consistentie van het product en de andere onderdelen niet voldoende gelijk zijn gebleven. In Adobe Firefly wordt alléén de selectie aangepast maar de rest van de afbeelding blijft ongewijzigd nét zoals in Photoshop. 

 

ChatGPT raad zélf Firefly aan boven ChatGPT (lol)

Ja, dat klopt grotendeels! Bij inpainting met GPT-4o lijkt het alsof alleen het geselecteerde gedeelte wordt aangepast, maar in de praktijk wordt de hele afbeelding opnieuw gegenereerd. Dit komt doordat het model de afbeelding niet pixel voor pixel aanpast, maar de hele scène opnieuw interpreteert en reconstrueert om de bewerkte regio op een natuurlijke manier te laten aansluiten op de rest.

Dit betekent dat:
✅ De compositie en kleuren grotendeels behouden blijven.
✅ De achtergrond en andere details er op het eerste gezicht hetzelfde uit kunnen zien.
❌ Maar er toch kleine verschillen in textuur, belichting of vormen kunnen zijn in het niet-bewerkte gedeelte.

Als je een écht nauwkeurige inpainting-tool wilt waarbij alleen het geselecteerde gebied wordt aangepast, zijn Photoshop’s Generative Fill of tools zoals Runway ML en Stable Diffusion inpainting betere opties.

 

FOTOREALISME

Nou biedt Adobe Firefly bij veel foto's een verbluffend fotorealistische kwaliteit. Echter kan dat bij de eerste pogingen ook nog wel eens niet zo zijn. Soms zelfs lelijk. Je kan bij Firefly alleen wél steeds je prompt verbeteren om uiteindelijk tot het fotorealistische of andere resultaat te komen wat je wenst. Vooral omdat Firefly eerst dankzij de 'snelle modus' een lagere kwaliteit voorbeeld laat zien waarna je direct je prompt kan verbeteren. Bij ChatGPT krijg je direct de 'hoge kwaliteit' te zien en daarna moet je tien minuten wachten. 

 

BEPERKTE PIXEL GROOTTE

Je hoort iedereen praten over de verbluffende mogelijkheden van generative ai. Maar niemand hoor je praten over de beperkte resolutie. ChatGPT maakt afbeeldingen niet groter dan ongeveer 1500 x 1024 pixels in aantal of vergelijkbaar in een andere verhouding. Firefly zit daar iets boven met 2024 x 2024 pixels in totaal. Dat is voor veel doeleinden voldoende echter het komt niet in de buurt van een 20 of 40 megapixel foto gemaakt door een professionele fotocamera. En zodoende is alle tot nu toe aangeboden generative ai beperkt in resolutie en daarmee ook beperkt in mogelijkheden. Ja, er bestaan nu ook veel upscale mogelijkheden. Maar daar ga je de super hoge kwaliteit van een professionele camera niet mee bereiken. 

Deel van de onderste foto, genomen met de Nikon Z8 40-megapixel full-frame camera. Deze grootte is verre van haalbaar met AI.

 

RACE

Aanbieders van ai zijn tegen elkaar op aan het knokken. Dan komt de ene aanbieder met iets nieuws en is de andere weer iets minder en kort daarna is het weer andersom. Vooral als het om Firefly gaat, geef ik aan mensen aan dat als een partij met iets komt wat Firefly niet kan, dan hoef je maar even te wachten en Adobe Firefly biedt kan het ook een vaak dan nog beter. Op het moment van schrijven is het Firefly model 3.0 al weer een tijdje oud en zit er een nieuw model aan te komen. Je kan er donder op zeggen dat Firefly op dat moment weer helemaal hot genoemd gaat worden in de (social) media.

 

COPYRIGHTS

Openai en Google hebben zo'n beetje het complete internet afgeschraapt om hun ai modellen te trainen. Daarbij is zo'n beetje elke copyright regel mee geschonden die maar mogelijk is. Feitelijk hebben deze grote tech bedrijven kunst van alle creatieve mensen in de wereld gestolen. Dat vergeet je makkelijk als je zo eenvoudig een grafisch ontwerp kan (laten) maken. Maar dat laat het juridische risico niet verdwijnen. Zo hard dat er gewerkt wordt aan deze generatieve ai, zo hard wordt er óók gewerkt aan het herkennen van de herkomst van afbeeldingen. Het is niet de vraag óf maar wanneer de eerste rechtszaken gaan komen tegen bedrijven die afbeeldingen door ChatGPT, Mid-Journy, Gemini etc zijn gegenereerd hebben gebruikt.

De enige partij die voor de volle 100% copyright veilige afbeeldingen kan genereren is Adobe Firefly. 

Dat komt omdat Adobe hun model alleen traint met gekochte en bewezen copyright vrije content. Adobe staat garant voor deze stelling.

 

GEOPOLITIEKE ONRUST

Ik wil geen politieke mening opleggen maar het lijkt mij duidelijk dat de Verenigde Staten momenteel andere landen onder druk zetten om bepaalde doelen te bereiken. Openai heeft bij de inhuldiging van Donald Trump naast de grote man gestaan en er is heel veel geld door Donald Trump aan open ai beloofd. Dit maakt het ai bedrijf voor niet Amerikaanse bedrijven ook een vorm van bedreiging. Een ai model wordt namelijk getraind door daar veel gegevens in te stoppen. Maar er worden ook vele instructies aan meegegeven hoe te handelen. Én alle prompts worden bewaard. Terwijl ChatGPT 'closed source' is wat betekend dat niemand in de broncode kan kijken'. Door je als bedrijf afhankelijk te maken van een dergelijk bedrijf dan loop je op de lange termijn risico's bedrijfsgeheimen bloot te leggen, en je wordt gevoelig voor de mogelijkheid om onder druk gezet te worden. Ook bestaat er een kans dat je in de toekomst in een copyright rechtszaak beland. Allemaal zaken om over na te denken voordat je grote projecten met een bepaalde ai aanbieder op gaat zetten.

 

Voor Europese bedrijven is het franse mistral.ai een serieus alternatief. Het ai model wordt getraind naar Europese regels, waarden en normen en houdt ook meer rekening met Europese talen. Het is ook nog eens de snelste taalgenerator met 1000 woorden per seconde. En de beelden die het genereert zijn echt niet verkeerd. Al moet ik toegeven, op het moment van schrijven, dat ik vind dat ChatGPT 4o nét iets realistischere beelden kan maken dan alle andere aanbieders. Maar dat is over een korte tijd weer anders. Kijk daarom ook eens serieus naar https://mistral.ai. En download de app 'Le Chat' van Mistral.ai. Door hier gebruik van te maken voorkom je een boel geopolitieke risico's in de toekomst. Gaat je het alleen om de chat? Dan heb je ook nog eens genoeg aan een gratis aanmelding. 

Er is nog een ander voordeel bij Mistral.ai (Le Chat). Het is open source. Dat betekent dat mensen die er verstand van hebben kunnen bekijken hoe de programmeercode er van er uit ziet. Maar je kan hierdoor ook een versie laten draaien op een eigen computer zodat al je vragen en antwoorden jouw computer niet verlaten. Meer privacy veilig dan dat is niet mogelijk. 

 

CONCLUSIE

ChatGPT zet de grafisch wereld op zijn kop met ChatGPT 4o dat is een feit. Mits je genoegen neemt met de beperkingen en gevaren, dan kan je zo een grafische uiting maken op basis van een tekst opdracht. Met typografie en al. Waarom ligt typografie in een ai gegenereerd beeld wat lastiger bij Adobe Firefly? Omdat Adobe een systeem hanteert waarbij er geen kans is dat je copyrights gaat schenden. Ook al is ChatGPT en al die andere ai aanbieders waanzinnig, blijft de vraag of het verstandig is om het te gebruiken voor daadwerkelijke uitingen voor je bedrijf. Helemaal als het een heel groot bedrijf betreft. 

Mistral.ai > Geopolitiek een stuk veiliger. 

Adobe Firefly > 100% copyright veilig. Juridisch én moreel verantwoord. Wist je dat je bij elk Adobe abonnement standaard gebruik kan maken van Adobe Firefly afbeeldingen? 

 

Related items