12.11.2023 14:46:34
AI pildigeneraatorid (text to image)
Nagunii paljud meist teavad, et netis on hulganisti teenusepakkujaid, kes võimaldavad AI mudelite abil luua kunsti ja fotosid sinu etteantud sõnadest, kirjeldusest. Sealhulgas ka realistlikke fotosid. Ma näiteks olen fotograafiahuviline, aga alati ei saa pildistada seda, mida tahan, nii et AI aitab seda kirge rahuldada.
Olen proovinud ja kasutanud juba 3 nädalat, 3 erinevat keskkonda, jäin kahe juurde praegu (leonardo ja dezgo), kuid üks imelik asi toimub, millest ma kuidagi sotti ei saa. Googeldasin juba mitmendat korda, kasutult.
Nimelt ei taha AI järgida kirjeldust fotol olevate värvide ja kadreerimise teemal. Kirjutan, et valge särk, ta teeb pooltel kordadel musta särgi. Kirjutan teksapüksid, ta teeb dressipüksid. Kirjutan "full body" või "full height" ja ta endiselt teeb portreed, kohati lausa pealaelt mahalõigatud. Enamasti teeb kõike muud, kui seda, mida ma täpsustan. Päikeseprille ka ei taha ette teha, vaid väga harva õnnestub. Umbes nagu 10-20% täpsusega kuulab sõna, kuigi peaks palju täpsem olema. Seal on mõned seaded/numbrid, mida timmida, sellega ka ei saanud asja korda.
Kuna sellega mängimine ei ole tasuta*, siis oleks hea leida mingid lahendused, nipid, trikid, kuidas saaks täpsemaid tulemusi ja vältida ebatäpse jama peale raha raiskamist.
* tasuta võimalused on kehvema väärtusega ja kohati vaid mõneks proovimiseks. _________________ Psycho the rapist (ja nüüd eemalda tühikud)
viimati muutis poroloon 12.11.2023 15:52:49, muudetud 1 kord
poroloon, Seal on kaks asja. Esiteks pead arvestama, et algoritm igal juhul paneb teatud varieeruvuse tulemustesse. Seda varieeruvust saad parema tarkvara puhul ka ise muuta. Teiseks sõltub see, mille programm loob ka muust kontekstist. Kui paned lihtsalt "white shirt", siis saad ilmselt mingisuguse tootepildile sarnaneva tulemuse. Kui paned "white shirt, blond girl", siis ei tule ilmselt pildile särk ja selle kõrvale blond tüdruk, vaid särk saab tüdrukule selga, kuigi sa seda ei täpsustanud. Kui jätlkad nimekirja: "white shirt, blond girl, bedroom", muutub särk väiksemaks ja pilt erootilisemaks.Pildirobot ei saa enamasti väga keerulisest jutust aru. Sa pead mõtlema selle kategoorias, mida näiteks pildipankades võtmesõnadena kasutatakse ja millega ta õppeprotsessis kokku on puutunud. _________________ The biggest delusion is that there are causes other than your own state of consciousness. - Neville Goddard
ummiq, USA kohtud on esialgu asunud seisukohale, et AI tehtud töödel puudub autoriõgus. Kui Bing oma roboti kohta sellise nõude on välja käinud, siis see on käsitletav kasutustingimusena, millele kas kasutaja on või ei ole oma nõusolekut andnud, kuid igal juhul ei puuduta need kasutustingimused autoriõigust, mis on eraldiseisev küsimus. Ja muidugi on kaubamärgi kaitse all Bingi märk, mille nad pildi allaserva lisavad - sellega kooos ei toihi pilti kindlasti kasutada kasutustingimustele mittevastavalt.
Ise ma väga Bingi ei eelista. Getimg.ai on palju parem, pakkudes võimalusi kriteeriume muuta, juba tehtud pildil osi kustutada ja uuesti renderdada, pakub suurt hulka erinevaid mudeleid (mis annavad pildile sama prompti puhul iselaadse iseloomu ja stiili) ning isegi tasulises paketis võimaluse oma mudeleid luua. Ka ei haugu ta vastu, et sisu "content guidelinesidele" ei vasta, vaid teeb kõik oma parema oskuse piires ära. _________________ The biggest delusion is that there are causes other than your own state of consciousness. - Neville Goddard
Onlain pildi AI-d on võrdlemisi piiratud võimalustega ja tulemused päris ühenäolised. Kui riistvara vähegi võimaldab, siis on targem kasutada Stable Diffusioni erinevaid UI-sid. Comfy UI või AUTOMATIC1111 näiteks. Siis on kogu kompott sinu arvutis, täiesti tasuta, pakub palju lisavõimalusi, kasuta kuidas ise tahad ja sul on tohtu hulk erinevaid stiile erinevate mudelite näol. _________________ Lugupeetud AHV, enne kui vaidlema hakkad, mõtle hästi järgi, kas see ikka on tark mõte...
ummiq, USA kohtud on esialgu asunud seisukohale, et ...
Spoiler
... AI tehtud töödel puudub autoriõgus. Kui Bing oma roboti kohta sellise nõude on välja käinud, siis see on käsitletav kasutustingimusena, millele kas kasutaja on või ei ole oma nõusolekut andnud, kuid igal juhul ei puuduta need kasutustingimused autoriõigust, mis on eraldiseisev küsimus. Ja muidugi on kaubamärgi kaitse all Bingi märk, mille nad pildi allaserva lisavad - sellega kooos ei toihi pilti kindlasti kasutada kasutustingimustele mittevastavalt.
Ise ma väga Bingi ei eelista. Getimg.ai on palju parem, pakkudes võimalusi kriteeriume muuta, juba tehtud pildil osi kustutada ja uuesti renderdada, pakub suurt hulka erinevaid mudeleid (mis annavad pildile sama prompti puhul iselaadse iseloomu ja stiili) ning isegi tasulises paketis võimaluse oma mudeleid luua. Ka ei haugu ta vastu, et sisu "content guidelinesidele" ei vasta, vaid teeb kõik oma parema oskuse piires ära.
Getimg.ai on palju parem, pakkudes võimalusi kriteeriume muuta, juba tehtud pildil osi kustutada ja uuesti renderdada, pakub suurt hulka erinevaid mudeleid (mis annavad pildile sama prompti puhul iselaadse iseloomu ja stiili) ja isegi tasulises paketis võimaluse oma mudeleid luua. Ka ei haugu ta vastu, et sisu "content guidelinesidele" ei vasta, vaid teeb kõik oma parema oskuse piires ära.
Proovisin ka, tasuta võimaldab 100 pilti kohe ilusti teha. Üldiselt samad võimalused nagu Dezgo-ga, isegi samad lollused
Kuigi ta tundub isegi paremini töötavat, vähem tuleb neid lolluseid. _________________ Psycho the rapist (ja nüüd eemalda tühikud)
Sellejaoks on Negative prompt: lowres, bad anatomy, bad hands, cropped, worst quality (peaks saama täiustada)
Aga asi läheb nõmedaks kui hakatakse näitama halba anatoomiat foorumites või kus iganes.
Kohati suudab AI pildigeneraator üllatada, positiivses m6ttes. Kuid harva. Enamus mis ta genereerib on keskpärane. Mingid detailid esitab see tasuta versioon t6etruult ja hästi, kuid üldpilt/mulje on enamasti lihtsalt halb. P6gusa kogemuse pealt, mulle näib, saamaks kätte see pilt, mida soovid, n6uab suuremat nokitsemist. Samas sellega kaob üllatusmoment. _________________ ˄28 The term "troll" refers to internet users–in this context, paid operatives–who post inflammatory or otherwise disruptive content on social media or other websites.
Nie wieder ist jetzt
Vondur, Proovisin Stable Diffusioni oma arvutis. See default model, mis tal ühes tuli, ei ole küll eriti kasutatav. Juuresoleval failil promt: "white cat, red sofa, realistic" _________________ The biggest delusion is that there are causes other than your own state of consciousness. - Neville Goddard
Sellejaoks on Negative prompt: lowres, bad anatomy, bad hands, cropped, worst quality (peaks saama täiustada)
Aga asi läheb nõmedaks kui hakatakse näitama halba anatoomiat foorumites või kus iganes.
Olen need ammu lisanud, kuid see väga ei mõju. Leonardo puhul ei näe selles suhtes üldse vahet. Pigem isegi teeb väljundi üksluisemaks, samad poosid ja riided esinevad sagedamini, hoolimata positiivse prompti erinevusest, lihtsalt keeldub sõna kuulamast.
Lasin siis Comfy UI endale arvutisse, sain ilusti toimima, aga vajab mingit kohendamist, sest inimesi teeb ta ikka eriti absurdselt, 2 keha ja 3 pead ühel pildil jne., kuigi näod tulid väga kenad. _________________ Psycho the rapist (ja nüüd eemalda tühikud)
Lasin siis Comfy UI endale arvutisse, sain ilusti toimima, aga vajab mingit kohendamist, sest inimesi teeb ta ikka eriti absurdselt, 2 keha ja 3 pead ühel pildil jne., kuigi näod tulid väga kenad.
See on selle pärast, et vanemad modelid on treenitud 512x512 resolutsiooniga piltidele ja kui laius või kõrgus ületab 512, siis tulevad sajajalgsed inimesed ja loomad. SDXL mudelitel on default mõõdud 1024x1024. Toon ühe näite: Kui sulle ei sobi kuvasuhe 1:1 ja tahad kuvasuhet 16:9, siis vanade modelite puhul (need on need mille nimes pole tähti XL) sobib näiteks resolutsioon 910x512, uuemate SDXL mudelite puhul 1820x1024. Katseta erinevate resolutsioonidega ja leiadki enda jaoks kõige sobivamad, mis inimestest imeelukaid ei tee. Hiljem saab kas siis "hires fixi" või "img to img" abil pildi resolutsiooni teha ükskõik kui suureks ja pildi kvaliteet paraneb kordades kui "Denoising strenthi" ja muude seadetega üle ei pinguta, aga kui videokaardi mälu ei võimalda, siis võib kasutada funktsiooni "upscale", aga see lihtsalt venitab pildi suuremaks ja detaile juurde ei tule.
perenoel kirjutas:
Vondur, Proovisin Stable Diffusioni oma arvutis. See default model, mis tal ühes tuli, ei ole küll eriti kasutatav. Juuresoleval failil promt: "white cat, red sofa, realistic"
default modelid on jah kasutud, nii vana kui uus, need võib südamerahus maha kustutada. Proovi näiteks Protovisioni, realisticvisioni, Lahmysterious, revanimated jne modeleid, soovitavalt SDXL versioone. Sealt saab nad kõik kätte. https://civitai.com/models
Ma kassipilte pole teinud, mulle meeldib rohkem selliseid teha: Offline Stable Diffusion, ProtoVision XL model.
Edit.
Üks kassipilt kah , samuti arvutisse installitud Stable Diffusion, ProtoVision XL model.
Edit 2. Proovisin sinu promptiga, "white cat, red sofa, realistic". Negative prompti jätsin tühjaks, cherryPickerXL model.
_________________ Lugupeetud AHV, enne kui vaidlema hakkad, mõtle hästi järgi, kas see ikka on tark mõte...
Lasin siis Comfy UI endale arvutisse, sain ilusti toimima, aga vajab mingit kohendamist, sest inimesi teeb ta ikka eriti absurdselt, 2 keha ja 3 pead ühel pildil jne., kuigi näod tulid väga kenad.
See on selle pärast, et vanemad modelid on treenitud 512x512 resolutsiooniga piltidele ja kui laius või kõrgus ületab 512, siis tulevad sajajalgsed inimesed ja loomad.
Sajajalgsed inimesed hahahahahaha!
Kusjuures sellega ma saingi nüüd asja korda, et panin 768x1024 ja nüüd on korrektsed pildid. Enne oli mul 960x1280 ja siis olid need mitmepealised ja mitmekehalised. Lugesin, et see juhtubki siis, kui vastav mudel pole ette nähtud (pole XL) nii suure reso jaoks ja ta hakkab "üleliigset" ala täitma kordamisega, mis maastike ja abstraktsete piltide puhul peaks päris kenasti toimima. _________________ Psycho the rapist (ja nüüd eemalda tühikud)
Stable Diffusionil annab mudel/stiil nimega sai-fantasy art päris muinasjutulisi tulemusi. Vägisi kipub mõte laste pildiraamatu peale _________________ The biggest delusion is that there are causes other than your own state of consciousness. - Neville Goddard
_________________ ˄28 The term "troll" refers to internet users–in this context, paid operatives–who post inflammatory or otherwise disruptive content on social media or other websites.
Nie wieder ist jetzt
Abstraktne AI-kunst tekib tihti mitte sellest, et AI seda taotles, vaid kuna inimsilm näeb mõnes pildi detailis või kompositsioonis ootamatult uskumatut lollust.
Tegelikult see pole lollus, vaid masina fantaasia panna pilti elemente mitmest asjast ja peita ära elemente mida sooviti. Saab kõike genereerida. Siiski teatud pilte oskab ilusti teha kui pole täit nägu, jalgu üsna reaalsed. Kui tulevad jalgade paigutus siis läheb natuke imelikuks eriti kui täis mahus mees genereerida koos naisega. Jalgadega ei oska AI suurt midagi reaalset teha kui jalgu ei paista siis tuleb enamvähem pilt reaalsem. Kui jalad millegi taha jäävad ,et ei paista siis juba tuleb ilusam pilt. Kui pikalt jalad väljas siis muutb pilt veidraks. _________________ Punktkeevitus patareidele/akudele. Akutrelli/laptopi/e-bike. PM
Tegelikult see pole lollus, vaid masina fantaasia panna pilti elemente mitmest asjast ja peita ära elemente mida sooviti. Saab kõike genereerida. Siiski teatud pilte oskab ilusti teha kui pole täit nägu, jalgu üsna reaalsed. Kui tulevad jalgade paigutus siis läheb natuke imelikuks eriti kui täis mahus mees genereerida koos naisega. Jalgadega ei oska AI suurt midagi reaalset teha kui jalgu ei paista siis tuleb enamvähem pilt reaalsem. Kui jalad millegi taha jäävad ,et ei paista siis juba tuleb ilusam pilt. Kui pikalt jalad väljas siis muutb pilt veidraks.
Just jalgade ja sõrmedega on suurim keberniit. Vahepeal teeb 6 sõrme käe kohta ja eriti tihti on sõrmed puseriti, sassis, eri mõõdus jms.
Püstiseid poose teeb jalgade kohapealt päris ilusti muidu, ka kõndimine ja jooksmine on päris tihti normaalsed. Aga istuvad, kükitavad jms. poosid on harva rahuldavad. Enamasti on jalad väändunud, sulanud kokku kas teise jala või käega, vahel läheb jala asemel käsi jalanõu sisse jms. Muidugi siis need mitmejalgsed inimesed ka, nagu taburet.
Positiivne näide, kus kõik paistab kehaga korras olema, peale sõrmede muidugi.
Spoiler
_________________ Psycho the rapist (ja nüüd eemalda tühikud)
sa ei või postitada uusi teemasid siia foorumisse sa ei või vastata selle foorumi teemadele sa ei või muuta oma postitusi selles foorumis sa ei või kustutada oma postitusi selles foorumis sa ei või vastata küsitlustele selles foorumis sa ei saa lisada manuseid selles foorumis sa võid manuseid alla laadida selles foorumis
Hinnavaatlus ei vastuta foorumis tehtud postituste eest.