Blonde hair woman
»нейронные сети Stable diffusion длиннопост
Stable Diffusion 3 теперь доступна для скачивания и запуска локально
Генерация по промту: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy
Теперь модель можно скачать и запустить локально (пока только Medium-версию). Разработчики пишут, что новая модель лучше понимает текст промта, более реалистичная в плане рук и лиц. А так же лучше запоминает детали на даже на небольших дата сетах. Одна из интересных фитч - генерация надписей.
Еще пишут что она "идеально подходит для работы на стандартных потребительских графических процессорах без снижения производительности". Но тут бы я поспорил, легко переварить 10Gb не каждая видеокарта сможет. На моей машине работает медленнее по сравнению с SDXL.
Скачать саму модель можно с civitai или huggingface. Запустить на данный момент только в comfyui.
Немного погонял локально, промты действительно понимает хорошо. Но модель "недообучена" - качество оставляет желать лучшего. Предыдущие версии тоже от этого страдали, но люди из комьюнити допиливали до вполне не плохих результатов.
Несколько примеров на модели SD3 Medium Incl Clips T5XXLFP8Сложный промт с положением объектов на картинке указанием цветов (у прошлых моделей возникали проблемы):
Three bottles on a table in a kitchen. Bottles that look like cola. Left bottle is full of blue liquid with the number 1 on it. Middle bottle is full of white liquid with the number 2 on it. Right bottle is full of red liquid with the number 3 on it.
Видно, что модель четко следует промту. Круто!
Попробуем с людьми:
Forest in the background. Dark theme, sunset, look at at viewer, captured in the late afternoon sunlight. Photo of three 21 year old woman. Left woman is blonde with the number 1 on blue T-shirt. Middle woman is redhead with the number 2 on white T-shirt. Right woman is brown hair with the number 3 on red T-shirt. Wearing shorts
Тут пришлось сначала описать лес на фоне, потому что иначе он выглядел как будто прифотошопленным. В остальном модель четко соблюдает номера, цвет футболок и волос. Раньше, без танцев с бубном, четко прописать нескольких разных типажей на одной картинке было почти не реально - детали сливались и получались клоны. А в новой версии достаточно просто описания.
А что по надписям на картинке? Попробуем:
Neon sign with the text "Ты пидор"
Видимо, русскую кодировку не завезли, но видно что модель старается, попробуем иначе:
Neon sign with the text "You are awesome!"
Попробуем сгенерить котика:
A black cat walking along a street paved with stone.Close-up of a cat's face.
Опять неплохо, хотя пришлось реролить несколько раз, что бы получить более-менее нормальный результат. Модель знает основы анатомии кота, но иногда больше похоже на детский рисунок.
Как на счет аниме?
Illustration anime, cartoon. 1woman, blue eyes, brown hair, dynamic angle, centered, full body photo. Street in the background
Опять пришлось реролить несколько раз. Заметил, что если указывать больше деталей, картинка получается лучше.
Попробуем городской пейзаж:
Urban photography: houses, trees, cars, and peoples. the road goes from the bottom left to the right
Осторожно: если долго рассматривать картинку, можно подумать что у тебя инсульт...
Что мы имеем на данный момент? Пока реализм хромает... Не всегда с первого раза выходит что нужно. Лично я ожидал большего. Все те же проблемы с руками и склонностью к "плоскости" перспективы и объектов.
Но есть ощущение, что модель действительно лучше понимает что от нее хотят. Будем надеется, что дообучение будет по силам сообществу, и мы увидим NSFW версию от авторов Juggernaut или Pony Diffusion.
ЗЫ: надеюсь теги эротики и аниме не нужны.
MidJourney нагенерил сам в комментариях ещё фэнтези Fantasy меч истины Морд-Сит Легенда об Искателе Нейросетевые Барышни барышня art нейронные сети Арт Барышня первое правило волшебника
Нейросетевые Барышни Арт Барышня art нейромазня нейронные сети Stable diffusion длиннопост русская девушка песочница эротики Эротика
Здрасте! Тут такое, я тут картинки генерю в большом количестве, а мне часто говорят что люди на них какие то пластиковые и вообще одноообразные. Мне посоветовали менять почаще настройки запросов в сетке. Я вас услышал и решил нагенерить картинки по одним и тем же запросам, но в разных моделях. От вас же прошу написать в комментах какая модель лучше справляется и какую лучше использовать. В качестве образца сделал запрос нарисовать русскую крестьянку.
Deliberate
DreamShaperProtogen x5.3Realistic Vision V1.3Встроенная сразу в Stable difussion модель sd-v1-4 (работает очень коряво)Uber Realistik Porn Merge (URPM) тут вообще без комментариев ;-)
Protogen V 2.2 (Anime) Знаю что аниме немного в тему, но мне по барабануPROMT:((RAW photo))), ((digitalart)), (((photorealistic)))), ((russian peasant woman)), ((top view)), (8k), smile, (((full body portrait))), 1 girl, ((nsfw)), ((masterpiece)), ((ultrarealistic)), ((best quality)), ((extremely detailed)), (beautiful girl), detailed clothes, high heels, ((detailed face)), detailed eyes, (beautiful blonde hair), lips, eyelashes, (looking at viewer), ((cinematic)), ((filmic)), ((telephoto)), depth of field, lens distortion, lens flare, white balance, strobe light, volumetric lighting, dramatic lighting, ray tracing reflections, detailed, intricate, elegant,
NEGATIVE:deformed, bad anatomy, disfigured, poorly drawn face, mutation, mutated, extra limb, ugly, disgusting, poorly drawn hands, missing limb, floating limbs, disconnected limbs, malformed hands, blurry, ((((mutated hands and fingers)))), watermark, oversaturated, distorted hands, amputation, missing hands, obese, ((doubled face)), ((double hands)), ((double legs))
Width: 512
Height: 768
Steps: 25
Guidance Scale: 10.5
Prompt Strength: 0.8
Sampler: euler_a
Hypernetwork Strength: 0
Hypernetwork model: None
Use Face Correction: C:\stable-diffusion-ui\models\gfpgan\GFPGANv1.3.pth
Use Upscaling: None
All Tomorrows Все Грядущие Дни
All Tomorrows в переводе
Не ожидала найти в продаже перевод, да ещё и в книжном формате, в подарок ещё стикеров накинули. Для любителей бумажного чтива (это я) отличный вариант, минус только в том, что обложка мягкая. Но качество довольно хорошее. Поэтому, если кому-то такая штука нужна, она продаётся на озоне, но сразу скажу, что оверпрайс. Довольно тонкая книжка в мягкой обложке обошлась в 900 рублей (но мне норм, учитывая уникальность контента именно в печатном виде).