Generowanie text to img na lokalnym komputerze.

1
Ostatnio głośno zrobiło się o różnych AI generujących obrazy, takich jak DALL·E 2, Imagen, Midjourney. Co ciekawe te ostatnie jest wykorzystywane przez Marcina Strzyżewskiego (kanał na Youtube) do generowania miniaturek. Korzystając z upublicznionych badań, wiele osób próbuje swoich sił w stworzeniu tego typu generatorów, a niektórzy udostępniają wyniki swoich prac za darmo. Tutaj filmik pokazujący jak ustawić sobie taki generator lokalnie: https://youtu.be/6x87ah70rcY
A hamster wearing a baseball cap.
Generowanie text to img na lokalnym komputerze.
Shrek fighting against Darth Vader.
Generowanie text to img na lokalnym komputerze.
Get out of my swamp!
Generowanie text to img na lokalnym komputerze.
Robotic cat on the Moon. Pixar.
Generowanie text to img na lokalnym komputerze.
A cat as the god. (Upscale’owane)
Generowanie text to img na lokalnym komputerze.
Cat, a witcher.
Generowanie text to img na lokalnym komputerze.
A cat as Virtuvian Man.
Generowanie text to img na lokalnym komputerze.
Catgirl eating fish in anime style.
Generowanie text to img na lokalnym komputerze.
A cat a the pilot. Pixar.
Generowanie text to img na lokalnym komputerze.
Shrek as anime villain in anime style.
Nawet ciekawe. W sumie nie wiem czego się spodziewałem.
Generowanie text to img na lokalnym komputerze.
Na karcie RTX 3070 Ti przy użyciu domyślnych ustawień obrazek 512x512 generuje się około 7 sekund. Po podbiciu Sampling Steps z 50 do maksymalnych 250 uzyskiwałem zazwyczaj nieco lepszy wynik, ale czas generowania wzrastał do około 35 sekund.
Niestety w większości przypadków wyniki nie są zadowalające. Pewnych rzeczy AI nie może sobie „wyobrazić”, Często przyczepia cechy tam gdzie nie trzeba. Kilka ciekawszych faili:
Geralt of Rivia hunting the Shrek.
Shrekogeralt XD
Generowanie text to img na lokalnym komputerze.
Geralt from Rivia fighting against Darth Vader.
Ładne obrazki, ale średnio związane z zapytaniem.
Generowanie text to img na lokalnym komputerze.
Mr. Bean killing Darth Vader using Lightsaber.
Nie ma tu zabijania Darth Vader'a, ale twarz wyszła całkiem nieźle :D
Generowanie text to img na lokalnym komputerze.
Mr. Bean as the emperor from Star Wars.
Miał być Imperator, a nie Leia.
Generowanie text to img na lokalnym komputerze.
Mr._Bean, the Emperor.
Zbyt ogólne zapytanie i wyszło coś takiego.
Generowanie text to img na lokalnym komputerze.
0.043800115585327