У пианистки ещё и лицо какое-то блиноподобное. А вот вторая совсем ничего себе )
Тут согласен. Работать есть над чем.
Но все равно решил разбавить чем-то необычным. Народ в большинстве лепит однообразные локации и просто людей без всего ;)
Это фортепиано.
И от этого она не престаёт быть пианисткой. Хотя соглашусь, фортепьянщица звучит примерно так же убого, как и неймлес.
Какой примерный процент адекватный картинок получается?.. Просто у меня более менее нормальное количество красивых барышень получается только при низком разрешении... т.е. на 800 на 600 еще более менее, но выше - постоянно кентавры, многоруки, многоноги, при одинаковых промптах.... хз как это вообще связано :')
Нейронки учат на не больших картинках в 512х512 (stable diffusion 1.5) или 768х768 (stable diffusion 2.0).
Поэтому как вариант: генерь картинки в, например, 512х640 и потом апскейль другой нейронкой.
Зависит от модели. Делиберейт практически без вариантов сразу начинает добавлять допруки и актеров при стороне разрешения выше 1000пикселей...
С ним надо заморачиваться по поводу качества, если делаешь не близкую камеру. ВАЕ подрубать возможно. Без имг2имг с последующим повышением разрешения ни одна картинка в любом случае не обходится..
SD 1.5 и подобные модели тренированы на 512x512, SD 2.1 на 768х768, так что лучше использовать эти разрешения для картинок. Если хочется другое разрешение, лучше всего оставить одну величину на 512 и 768, а другую менять по желанию. 512х912 хорошо подходит чтобы получить картинку HD, после апскейла.
Делаешь в низком разрешении, выбираешь лучшие результаты, перегоняешь в img2img в более высокое разрешение, выбираешь лучшие результаты, в inpaint выборочно перерисовываешь отдельные элементы, выбираешь лучшие результаты...
Пасиб всем, кто ответил) не знал таких подробностей...