нейросети реализм Эротика
»нейронные сети Stable diffusion длиннопост
Stable Diffusion 3 теперь доступна для скачивания и запуска локально
Генерация по промту: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy
Теперь модель можно скачать и запустить локально (пока только Medium-версию). Разработчики пишут, что новая модель лучше понимает текст промта, более реалистичная в плане рук и лиц. А так же лучше запоминает детали на даже на небольших дата сетах. Одна из интересных фитч - генерация надписей.
Еще пишут что она "идеально подходит для работы на стандартных потребительских графических процессорах без снижения производительности". Но тут бы я поспорил, легко переварить 10Gb не каждая видеокарта сможет. На моей машине работает медленнее по сравнению с SDXL.
Скачать саму модель можно с civitai или huggingface. Запустить на данный момент только в comfyui.
Немного погонял локально, промты действительно понимает хорошо. Но модель "недообучена" - качество оставляет желать лучшего. Предыдущие версии тоже от этого страдали, но люди из комьюнити допиливали до вполне не плохих результатов.
Несколько примеров на модели SD3 Medium Incl Clips T5XXLFP8Сложный промт с положением объектов на картинке указанием цветов (у прошлых моделей возникали проблемы):
Three bottles on a table in a kitchen. Bottles that look like cola. Left bottle is full of blue liquid with the number 1 on it. Middle bottle is full of white liquid with the number 2 on it. Right bottle is full of red liquid with the number 3 on it.
Видно, что модель четко следует промту. Круто!
Попробуем с людьми:
Forest in the background. Dark theme, sunset, look at at viewer, captured in the late afternoon sunlight. Photo of three 21 year old woman. Left woman is blonde with the number 1 on blue T-shirt. Middle woman is redhead with the number 2 on white T-shirt. Right woman is brown hair with the number 3 on red T-shirt. Wearing shorts
Тут пришлось сначала описать лес на фоне, потому что иначе он выглядел как будто прифотошопленным. В остальном модель четко соблюдает номера, цвет футболок и волос. Раньше, без танцев с бубном, четко прописать нескольких разных типажей на одной картинке было почти не реально - детали сливались и получались клоны. А в новой версии достаточно просто описания.
А что по надписям на картинке? Попробуем:
Neon sign with the text "Ты пидор"
Видимо, русскую кодировку не завезли, но видно что модель старается, попробуем иначе:
Neon sign with the text "You are awesome!"
Попробуем сгенерить котика:
A black cat walking along a street paved with stone.Close-up of a cat's face.
Опять неплохо, хотя пришлось реролить несколько раз, что бы получить более-менее нормальный результат. Модель знает основы анатомии кота, но иногда больше похоже на детский рисунок.
Как на счет аниме?
Illustration anime, cartoon. 1woman, blue eyes, brown hair, dynamic angle, centered, full body photo. Street in the background
Опять пришлось реролить несколько раз. Заметил, что если указывать больше деталей, картинка получается лучше.
Попробуем городской пейзаж:
Urban photography: houses, trees, cars, and peoples. the road goes from the bottom left to the right
Осторожно: если долго рассматривать картинку, можно подумать что у тебя инсульт...
Что мы имеем на данный момент? Пока реализм хромает... Не всегда с первого раза выходит что нужно. Лично я ожидал большего. Все те же проблемы с руками и склонностью к "плоскости" перспективы и объектов.
Но есть ощущение, что модель действительно лучше понимает что от нее хотят. Будем надеется, что дообучение будет по силам сообществу, и мы увидим NSFW версию от авторов Juggernaut или Pony Diffusion.
ЗЫ: надеюсь теги эротики и аниме не нужны.
NovelAI нейронные сети Stable diffusion нейроарт art нагенерил сам
Под одним из постов с нейроартом один из реакторчан высказал неудовольствие по поводу того, что нейронка может нормально генерить только одного персонажа. И для своего третьего нейроарта я загорелся идеей сделать композицию с несколькими персонажами. Первоначальная задумка была сделать старого ветерана в доспехах, который стоит перед строем горничных, и это всё происходит внутри стен замка. Все попытки объяснить нейросетке нужное место не увенчались успехом. Но ещё хуже было со "строем". Строя, как такового, вообще не было. Иногда не было ветерана, иногда было мало горничных, иногда рисовалась совсем дичь. Итоговый арт будет в самом конце поста.
Немного наркомании при первых запросах:
По итогу, я пришёл к выводу, чтобы задать нужное количество персонажей разного пола, надо обмануть нейросеть. Запрос я делал так: [three man:: 35], [old man in armor: 10], [two french maid: 30] и дальше теги качества. Семплер DDIM, 80 шагов. Нейросетка сначала делает трёх мужчин, на десятом шаге делает одного в доспехах, на тридцатом - двух горничных, а на 35-м забывает что нужны мужчины. Значения были выведены путём э-э-экспериментов, когда я смотрел на каком из шагов нейросетка уже понимает кого нарисовала - мужчину или женщину. Мне же главное чтобы на композиции было 3 фигуры, а уж пол и одежду - задаю позже. Так как моя видюха не позволяет генерить сразу много картинок, я их всегда делаю по три штуки. Из трёх, самой классной по композици была вот эта:Это совсем не то, что надо, у неё просто куча проблем, даже какой-то левый меч, висящий в воздухе, но изменить детали куда проще, чем всю сцену целиком, а сцена хороша. При этом, промпт intricate который был в "качественных" тегах сослужил мне дурную службу сделав доспех нереалистично узорчатым.Первым делом, поменял горничных вдалеке, разбил их по разным цветам волос, нейросеть решила что лучше будет, если они пойдут от зрителя, я не сопротивлялся.
Следующий этап - картина слева, первая же генерация выдала сверхздатый портрет, который я больше не трогал. Кроме того, поменял меч, который в руке. Попытка сделать так, чтобы он держал меч лезвием вперёд ни к чему не привела, пришлось сделать так, как будто ветеран держит меч позади гарды, рукоятью вперёд.Дальше был просто ад, вот эта непонятная фигня справа мешала, во что я только ни пытался её превратить, и в стойку с оружием, и в комод и в ещё одного человека, нейросеть упорно не хотела рисовать нормально. Я потратил целый день генераций, пока не добился удобоваримого результата.
По итогу, эта фигня сбоку превратилась в столик с цветком, но попаболь была ещё впереди, ведь надо было поменять у ветерана отвратное лицо. Видимо, из-за того, что Anything 3.0 тренировали в основном на аниме тянках, мужики получаются крайне хуёвые. Попутно дорисовал факел на стене, люстру вдалеке менять не стал, нейросеть упорно рисовала фигню. Плюс-минус нормальное лицо я по итогу получил, пришло время допилить доспехи, убрать ножны и висящий сбоку меч. Удивительно, но нейросеть смогла в примерно одинаковый рисунок на наплечниках и сделала классную фенечку вместо ножен. Правда, все эти манипуляции привели к тому, что пол стал с разным рисунком в разных частях изображения, пришлось переделывать.Да, арт не идеален, есть ещё некоторые косяки с геометрией, доспехами и прочие мелочи, которые можно разглядеть, но сил вылизывать уже нет, так что предлагаю вам поглядеть на заапскейленый через Topaz Gigapixel итоговый результат.
нейронные сети нейроарт Stable diffusion Anything3.0 песочница NSFW
Google Colab и кошкодевочки для всех.
Не знаю почему этого никто до сих пор не написал... Инструкция посвящается всем киберпидорам на накопившим на крутую видяху, желающим заиметь гарем 2D тяночек.
Гугл раздает доступ к своим ML мощностям для всех желающих. На https://colab.research.google.com/ можно генерить свои картиночки, запускать свои модели и.т.п. (ограничение - 12 часов в день на работу, потом все сгенереное стирается.)
Даю сразу ссылку:
Модель anything3.0: https://colab.research.google.com/github/camenduru/stable-diffusion-webui-colab/blob/main/anything_3_webui_colab.ipynb
(на мой взгляд самая подходящая под генерацию 2D эротики)
Запуск модели полностью автоматизирован, просто запускаешь коллаб кнопкой ▶️ исполнение кода
И ждешь пока тебе выдадут линк на вебинтерфейс (типа такого https://0f0a82ef41323d42.gradio.app/).
Открываешь линк - поздравляю, твой коллаб с тяночками готов. Генерирует в любом разрешении (у гугловских тензорных ядер памяти до черта).
P.s.
Тем кто хочет старую stable diffusion без хентая https://colab.research.google.com/drive/1jY9KAqR_SQUp76ayRuqyk4MTId-7STOy?hl=ru_RU#scrollTo=NPtEBB6r18yU
Вообще в коллабе много уже подготовленных моделей - просто гуглите)
Отличный комментарий!