Сап, не посоветуете модель адетайлера для пар глаз? А то чет медиа пайп у меня сломался, йоло моделей глаз не сделали, а с тех что нахожу генерит с таким богом - синева вокруг глаз или не знаю что это.
>>1294104 Почему она грустит? >>1294128 Да! Но также важна пушистость хвоста. >>1294135 Содомит >>1294200 https://civitai.com/models/330727/full-eyes-detection-adetailer > а с тех что нахожу генерит с таким богом Йоло модель на участвует в этом, проблема в основной и она дает сдвиг по цветам. Если у тебя выбран какой-то стиль или модификаторы, которые на это влияют - задай отдельный промпт для адетейлера без них и все пройдет, опционально выбери другую модель для него в параметрах.
>>1294262 > Да! Но также важна пушистость хвоста. Ну для тех двух персонажей на картинке пушистость хвоста - это проблема. У одной он не пушистый (зато длинный), а у второй его вообще нет.
>>1294285 Модель адетейлера не может ничего рушить. Но она может создать сложные условия основной модели, например чрезмерный кроп не соответствующий основному промпту, из-за чего уплывут цвета обрабатываемого объекта. Лучше не использовать улучшайзер только для глаз а делать его на лицо, если это невозможно то колдуй с промптом и параметрами инпеинта, используй другую модель для инпеинта адетейлера (есть такая опция). >>1294341 Нужно сделать нейроверсию 12-сантиметровой колумбахи разрушения какой же рофел в оригинальном видео на 1.27, только про не-пушистый хвост. > а у второй его вообще нет Ну, Сейа и так была лучше, а тут безальтернативно.
>>1294352 А? >>1294351 Да я кажется понял, кажется была вредная лора, которая создана на персонажах с серой кожей, типа Равен. Достаточно было серую кожу в негативы.
>>1294351 >Лучше не использовать улучшайзер только для глаз а делать его на лицо, если это невозможно то колдуй с промптом и параметрами инпеинта, используй другую модель для инпеинта адетейлера (есть такая опция). Я делаю лицо+глаза. Если только лицо, то зрачки очень плакие. Я пробовал также лицо в 3 шага адетайлером, но тоже не идеально. Поэтому время потратил и в итоге в фш просто эти зрачки нарисовал лул. Чето не полчается. Реально достало реролить, когда в фш просто 2 минуты повозюкать. 2 минуты у меня пикча генерится.
>>1294361 Ищи проблему в лорах, которые используешь, прогона адетайлера на лицо должно быть достаточно, чтобы отрисовать норм зрачки. Часто на циве лежит мусор вместо лор, тогда обучай свою.
>>1294361 > Если только лицо, то зрачки очень плакие. Скинь пример полной пикчи, которую генеришь. Обычно инпеинта лица хватает для всего, а тут уж 3 шага и подобные проблемы. >>1294513 Лол, так толсто что даже тонко.
Хотел сгенерировать персонажа - Пени Паркер, с футболкой другого персонажа - Акселератора. Мне нейронка кроме прочего сгенерила вариант на пик2. И чет мне так понравился образ, что я сделал еще. На оценку.
>>1295062 > аниме тред А причём тут буры? Текстовый энкодер синонимы кодирует в одно и тоже. Куча тегов отлично работают даже если их не было в датасете.
>>1295091 Без разницы что там за токены, на выходе из энкодера эмбединги. Какой-нибудь from above и отсутствующий на бурах high angle энкодятся в одно и тоже и дают одинаковый результат.
>>1295163 > Про пони ведь просто так было уточнение. Ты думаешь будет разница? У меня для тебя плохие новости, с пони ты всё равно обоссан, ведь текстовый энкодер тот же. Лучше уточни у своей мамаши не роняла ли она тебя в детстве.
Только узнал что у Рюко кружки в зрачках уебищные. Тото я думаю, почему мне нейронка всратые глаза генерит и ничто абсолютно не помогает, а так было в оригинале... И ведь сколько подобных персов в модели суют, где зрачки не кружки и даже не кошачьи, а поебень просто,а меня от окр трясёт почему не идеальное.
>>1293837 (OP) >1667326696937.png Блин так хочется в детство где не даже тяночка в бикини, а просто хотя бы с приятелями мороженное, но я скуф, а у взрослых вместо мороженного что-то тяжелое, а я отсталый для такого.
Братушки можете скинуть сервис который будет описывать хентай картинки в виде прозы? Вот мне желательно чтобы он воспринимал порнуху и описывал это в виде предложения. Если такого нет, то какой нибудь инструмент для сд. Тэггер не нужен.
>>1295539 >Взрослый дядя с мороженкой выглядит нелепо. Нелепо, это когда взрослый дядя трясётся о том, что о нём вокруг люди подумают. Я всегда хожу с мороженкой, и если есть необкусанные части - предлагаю альтушкам угоститься. Главное - мужественно откусывать, а не сосать, как пивососы и просие сосуны трясущиеся.
>>1295211 >разные картинки >энкодятся в одно и тоже и дают одинаковый результат >одинаковый результат >разные картинки Истеричка, успокойся. Тебя даже никто не не пытался оскорбить тут, а ты уже в визгах забился. Ну, как говорится "Юпитер ты злишься, значит ты не прав". Походу ты уже понял, что ошибся, так что ротик офни, мы тебя поняли.
>>1295593 Красота, и ракурс что надо. >>1295602 Минусы будут? на той пикче по виду тяночка >>1295611 Инпеинти основной моделью, используй inpaint контролнет с соответствующим экстеншном.
>>1295645 > Какой основной? Которой пользуешься. Если хочешь править что-то готовое то нужно чтобы модель могла в такой же стиль (промпт, лоры, референс контролнет/адаптер), иначе значительные правки будут сильно выбиваться. Если планируешь заменять участки удаляя/добавляя объекты то потребуется именно инпеинт модель или инпеинт контролнет, иначе заебешься роллить.
>>1295303 >>1295593 Анон, у тебя сохранился пик где лиса на подоконнике сидит с кошкой. На улице ночь и свет от уличного фонаря их так балдежно освещает. У меня на рабочем столе картинка больше года стояла, а сейчас переустанавливал систему и проебался.
>>1295668 > Если планируешь заменять участки удаляя/добавляя объекты то потребуется именно инпеинт модель или инпеинт контролнет, иначе заебешься роллить.
А посоветуй таких моделек под аниме-стилистику, будь другом!
Хотел задать вопрос по использованию регионального промптинга Forge Couple 4.0.2 (через A1111). Планировал сделать сцену с тремя-четырьмя персонажами, но столкнулся с неожиданным ограничением: если в промпт добавить слишком много атрибутов, модель как будто ломается, картинка резко теряет качество — становится блеклой, почти без контраста и без следования промту. Пример — на втором пике. Максимум, что получилось без деградации изображения — вот с таким промптом: Hatsune Miku, (flat chest: 2), (love: 1.5), (blushing: 0.5), (facing viewer: 1.8) masterpiece, best quality, 4girls, upper body, standing close together, at the beach, summer outfits, natural pose, detailed faces <lora:add-detail-xl:2> <lora:Expressive_still_life_r1:1> Kagamine Rin, (tease: 2), (smiling: 2) Akita Neru, (smile: 1), (tsundere: 0.5) Kasane Teto, (laugh: 2), (drill hair: 2)
Настройки: Steps: 30, Sampler: Euler a, CFG scale: 6.5, размер: 1536x1024 Модель: novaAnimeXL_ilV90 Forge Couple: режим Advanced
С чем это может быть связано? Ощущение, будто Forge Couple не справляется с подробным описанием. Может, есть способ это обойти? Также проблема с Hires. Fix. При попытке увеличении на 1,5 и включенном Forge Couple видеокарта отрабатывает наполовину, но потом вылетает с ошибкой: RuntimeError: shape '[6, 13824, 1]' is invalid for input of size 36864 Пробовал делать upscale через Extras — но там просто растягивается разрешение без переработки деталей, выходит мыльно. Сам инструмент Forge Couple очень удобный, мне очень нравится, даже при генерации одного персонажа — за счёт более точного контроля. Но ограничения по промптам, конечно выбивают из колеи. Если кто-то сталкивался с похожим или нашёл решения — буду рад услышать. И есть ли подобные проблеы в Comfy UI?
>>1295581 > joy-caption-beta-one >>1295814 > joycaption Использовать это в 3-м квартале 25 года может быть оправдано только неумением запускать что-то иное. Уступает почти любой базовой мультимодалке с соответствующей инструкцией, глючит, не справляется с нсфв, слеповатое из-за ужатия всей картинки в 384. Хочешь быстро - qwenvl2.5-3b/gemma-3-4b, имеешь достаточно врам и тоже быстро - ernie4.5-28b, описывать нсфв или чаров поименн6о - тории, выполнять задачи сложнее - гемма 27б и квенвл32б, дофига мажор - эрни 424б. Еще есть мистраль и ллама 3.2, но они слабее геммы и квена и цензура не в виде рефьюзов а в непонимании изображения.
>>1295494 >а сегодня онлайн генератор 8 шагов без апскейла. >2823Кб, 1024x1536 Кому пиздишь? >>1295498 >1 АРТ НА 100 Я СКОЗАЛ БУКВАЛЬНО 1 АРТ НА 100 ТОЧНО ГРЮ САМ МЕРИЛ
Плагин для Криты - хрень собачья. Комфи поставь, кучу плагинов поставь, 100 гигов моделей скачай и... Оно не работает толком. Точнее, ТЕХНИЧЕСКИ работает, но результаты такие, что лучше бы не работало. Дорисовать не смогло толком вообще ничего. Настроек мало, они раскиданы как попало, менять их неудобно... Еще и сраный комфи инференсит раза в 2-3 медленнее, чем форж. В общем, нахуй.
Потыкался, соответственно, и в форж. Результаты более обнадеживающие. По крайней мере, если я говорю ему "вот тут руку мне нарисуй", оно рисует руку, и она даже на руку похожа. Через плагин для криты даже сраные складки на подушке нарисовать не вышло. Инференсит шустро, почти сразу показывает промежуточные результаты - если видно, что мережа, можно не ждать (как с плагином) а сразу оборвать генерацию.
Для себя сделал вывод: самые лучшие результаты получаются, когда ты сам кривовато-косовато дорисовываешь то, что тебе нужно, а инпаинт используешь только для того, чтобы облагородить свои каляки-маляки. Но даже так приходится сидеть и часами перебирать параметры и модели, а также дрочить до посинения кнопку генерации.
>>1296056 > ТЕХНИЧЕСКИ работает, но результаты такие, что лучше бы не работало. Дорисовать не смогло толком вообще ничего. Настроек мало, они раскиданы как попало, менять их неудобно... https://www.youtube.com/watch?v=TeALR63-LzE Там суть в Customs Workflows, я тебе не тот видос кинул. Через них можешь прокинуть входы/выходы для криты прямо через комфи, вынеся только нужные тебе поля в интерфейс. А ненужное можешь в комфи захардкодить.
Если сможешь рабочее решение через комфи напердолить, то и в крите оно автоматом заработает.
>>1296041 Милые! >>1296056 Мыслишь верно, после освоения все будет получаться уже быстро. >>1296065 > магией сокрытия То есть там была не феминизация а хитрый обман? Оварида Лиса милая, она хотя бы девочка?
Я просто блять не понимаю таких людей на цивите, которые регулярно выкладывают своё довольно неплохое творение и подтирают все данные картинки, не оставляют никаких данных, кроме модели. НАХУЯ? Ты пользуешься блядским открытым сурсом, зачем такие закидоны. ЗАЧЕМ БЛЯТЬ.
Почому у меня в нормальном режиме слоп на слопе генерирует и всё встрато - позы, лица, глаза, анатомия, и всё никак не реролится? А вот в и2и точное попадание с пары раз! Пиздец. Придётся расчехлять старый добрый хани селект и делать намаз в фотошопе.
>>1296064 За готовность помочь и советы спасибо, конечно, но я не хочу разбираться в комфи. Я сам разработчик подобного workflow-based решения для другой предметной области, и знаю, сколько нужно сил, времени и нервов, чтобы подобное освоить. Если бы мне за это деньги платили - еще ладно, а одну картинку поправить для себя - в рот я такое ебал.
>>1296065 > мне он тоже не нравится, всё ещё сижу на старом плагине с отдельно выделенным бекендом.
>>1296672 Сейчас состоятельные господа заводят лис, оформляя звероферму с лицензией и содержа вольер за чертой города. По-хорошему, такие же ограничения должны применяться к собакам крупнее крысы, учитывая что лиса гораздо ссыкливее со баки и человека жрёт только когда он пьян, спит на лавочке в парке и англичанин.
>>1296656 Если все твое достижение заключается в подборе шизопромпта и роллах - грош ему цена. Применяя же различные техники и комбинации, и тем более тренируя свое можно не только добиться хорошего, но и не бояться "кражи промпта". Наоборот лучше делиться с остальными, потому что повышение общего уровня поможет тебе и будет мотивировать развиваться. >>1296672 Все хорошо если лиса не против с документами.
>>1296747 Увы, потому так и живем. >>1296748 Уже пришли, все нсфв пикчи/видео на этих моделях и с использованием их производных потерты и запрещены, генератор недоступен, перспективы моделей туманны.
>>1296784 >Уже пришли Пришли за кор-моделями, и тем, что было сделано на них. Там ж список моделей выложен. Вот когда за понями/люстрой/нубой придут - это будет веселее.
>>1296808 За ними не придут из-за лиценции на sd1.5 и sdxl. А те изначально были под другой с неприятными параграфами, вот то чего боялись и случилось. Вот же будет рофел если индусам тоже пеймент процессоры приказали
>>1296028 >>1296938 > (flat chest: 2), (love: 1.5), (blushing: 0.5), (facing viewer: 1.8) Такие веса на простые теги - неоче > Ощущение, будто Forge Couple не справляется с подробным описанием. Да, как раз очень похоже что в разметке что-то поломалось из-за чего он не может корректно отработать. Попробуй поправить промпт и сменить маппинг. Также можешь попробовать аддон regional prompter, по смыслу и управлению он похож.
>>1297007 Насколько я сам понял есть какой то параметр в позитивном и негативном промпте который равен 75, если это значение переваливает за 75, модель при включенном Forge Couple ломается. >Такие веса на простые теги - неоче Тут по ситуации, допустим вижу, грудь все равно большая, приходится ставить веc.
Тут про Krea немного поругаться пришёл. Вначале потыкал с флюко-лорами - в принципе норм, чуть "разболтанно", но вполне работает, узнаваемо. Картинка вроде лучше голого флюкса, интереснее. Ну, думаю, надо тогда на чистой Krea перетренить, будет вообще топ... Прошло 32 часа тренировок, начинаю собирать мерж из лор и... Оно просто разваливается, вообще не получается картинка. ВТФ? Самое смешное, что если этот мерж подключить к простому флюксу, то там работает, картинка не разваливается, но с глюками. Да и после более подробного экспериментирования оказалось, что Krea ничуть не гибче простого фл. В общем полтора дня в пустоту.
От расстройства добрался до Wan, пока просто 2.1, т2и режим. Для реализма из коробки - шик. Для аниме - надо лоры. Пришлось понять, как тренить. Не так просто, как для ХЛ, но под виндой запускается. Пикчи - голые генерации без обработки, пока очень радуют. Надо учиться делать на нём.
>>1297046 Такие веса - это большая дичь, не надо так. 75 - это токены. > большая, приходится ставить веc Добавь большие в негатив просто.
чот я нихуя в этой жизни не понимаю. Заебался уже despair, defeated, bad_end, surrended, tired, exhausted, и прочие теги не дают нужног0о эффекта. Всё время остаётся оттенок того что тян получает некое, пусть и извращённое но, удовольствие и даже внутренне сопротивляется. Чем фиксить? Как добиться полного абсолютного поражения? Искренности, чувства.
Признавайтесь, а чем вы айтищники до релиза сд занимались? Хани селейты и койкацу? Или Скайрим модили для красивых скринчиков? Я не верю что тут есть бывшие худы, которые смогли бы впрыгнуть в не гуманитарные нейронки. Даже мне технарю тяжело и лень.
>>1279616 → >А вообще просто кидай датасет, можешь не тэгать даже, натреним, может и на цивит не захочешь потом. У тебя самого вк не тянет вообще тренировку? Сори, очень сильно затянул с этим, ленился, прокрастинировал (омерзение вызывает работа с чат gpt), уже с момента разговора несколько тредов сменилось. Вот ссылка на мой датасет - https://drive.google.com/file/d/1pGOyz3qc_LlKJn3ob22fSnWpSeYWFyXb/view?usp=drive_link . Сейчас запустил тренировку на теги civitai на 20 эпох, через час моя первая лора в теории будет готова
>>1297206 Окей - https://pixeldrain.com/u/xkX4gsKT, надеюсь ссылка работает. 200 картинок я не осилил, только чуть больше 100 сделал. >И напомни, ты на нубе хотел же потом генерить Я его скачивал, но у меня исключительно вот такие результаты получается, с Пони тоже не получилось, разобраться, поэтому пользуюсь только чекпоинтами на люстре.
>>1297205 А лора точно нужна? Просто пихнул пик3 в вд14 nooblyai+dmd2 1girl, loli,khyle., (zankuro:0.5), bubukka, sincos, tianliang duohe fangdongye,solo, looking at viewer, smile, open mouth, short hair, blue eyes, brown hair, dress, standing, full body, short sleeves, :d, outdoors, frills, teeth, shoes, socks, day, puffy sleeves, black footwear, brown dress, apron, puffy short sleeves, tree, neckerchief, maid, upper teeth only, blurry background, depth of field, white socks, bob cut, short dress, leg up, standing on one leg, white apron, building, child, red neckerchief, maid apron, mary janes, frilled apron, collared dress, road, masterpiece, best quality, high quality.
>>1297046 > грудь все равно большая, приходится ставить веc Поправь промпт, если там все норм (а там ломаться нечему) то используй модель, которая его не игнорирует, а то это совсем безумие какое-то. Другие завышенные веса, особенно не то что модель не понимает, могут приводить к игнору нормальных тегов. > какой то параметр в позитивном и негативном промпте который равен 75 Как и сказали, это число токенов. Но оно должно быть ограничено 75 на каждый регион, лимит на все - это что-то совсем не то. Уже больше года форджкапл не трогал, но не припоминаю такого ограничения. >>1297059 > Оно просто разваливается, вообще не получается картинка. Была рекомендация исключить часть блоков из тренировки, пробовал? >>1297177 Ах ты содомит, хорош! >>1297186 > вы айтищники Сам такой > занимались Были зрителями а не создателями.
>>1297274 Конкретно у тебя костюм горничной получается, а не школьницы.
Я закончил тренировку лора, скачал только результат на 20 эпох. Слева Лора включена на 0.8, вторая выключена, и третий - это чужая лора с civitai на аналогичную тему. Чекпоинт: novaAnimeXL
Эх надо было всего таки не ленится и сделать две версии, с воротником как у рубашки и просто небольшим воротником стойкой, теперь все картинки будет генерироваться с рубашечным воротником.
>>1297331 Что сложного во вкате в нейроночки в 2к25? Когда есть цивит, где можно подсмотреть промты и масса информации в интернете? Даже установка проще некуда благодаря интерфейсам типа stability matrix, которые делают всё за тебя
>>1297339 Сходу не нахожу, было в дискуссиях трейнера Багиры или в дискорде. Предложение заключалось в заморозке первых 1-2 блоков. Писавший утверждал что после этого у него получилось натренить лору на креу. Выглядит сомнительно о чем сразу и написали, так что если ты потратишь часы на это не получив успеха - я не виноват. >>1297696 Очень нужен совас/фулл вот этой!
>>1297369 Что-то такое вышло. 2шт на на люстре и 2шт нубе впред. Датасет пришлось ковырять очень сильно - желтый, в шакалах, по 3-4 пальца. Где мог - поправил, можешь забрать, тоже закинул. https://litter.catbox.moe/m4njwsubnhoirzbe.7z p: nai
>>1297735 > Выглядит сомнительно о чем сразу и написали, так что если ты потратишь часы на это не получив успеха - я не виноват. Ладно, не ищи, спасибо. Я пока забил на фл-семейство, с Ваном возиться интереснее.
>>1297805 Спасибо большое! Единственное, почему-то не открывается архив ща напишут, что там вирус, даже сложно представить, что человек, работами которыми восторгаешься, сидел ковырялся в моих кринжовых картинках. С другой стороны я не знаю других способов как создавать датасет, кидать просто фотографии даже не стилизованные мне кажется плохая идея, а перерисовать картинку по картинке может только чат джпт (возможно чего я то не знаю и ошибаюсь). Так бы я наверное еще бы создал лору на советское окружение, в том числе помещение в классу, и лору на повседневную форму. Но с повседневной проблема, так как самый хороший источник референсов фильм "Гостья из будущего" снять на хрен пойми какую пленку и цвет фартука сливается с цветом платья.
> не открывается архив Там простой советский вишмастер, брат жив, пишу с ЕС1040, шутка. Просто качни офф 7z отсюда https://www.7-zip.org/download.html
> работами которыми восторгаешься, сидел ковырялся в моих кринжовых картинках. Не знаю никого такого! Да ладно, мы все тут - анон.
> других способов как создавать датасет Да особо и нет вариантов - тем или иным способом собирать минимальный набор, тренить хоть какую-то лору, увеличивать датасет, треня новую следующую. В этом цикле главное не испортить всё, т.к. получается "положительная обратная связь", и любой брак в исходнике умножится кратно потом в генерациях.
Кстати про ирл фоточки - сейчас появился Kontext. Можно попробовать пихнуть ему фотку, и в промте написать Convert to 2d-art или Convert to digital painting - что-то такое. В карандашные наброоски и акварели переводит прекрасно - я кидал как-то. Главное посочнее в промте описать стиль традиционного медиа любая ллм поможет
> лору на советское окружение Под флюкс есть на цивите у автора Rassvet много.
> Гостья из будущего Я скринил и доводил как мог скрины для тех же целей, если надо.
>>1297919 > с Ваном возиться интереснее Не стесняйся рассказывать об опыте >>1297922 > что человек, работами которыми восторгаешься, сидел ковырялся в моих кринжовых картинках Ляяя, тоже так хочу! > кидать просто фотографии даже не стилизованные мне кажется плохая идея Выбирать их специально не стоит, но в использовании при дефиците нет ничего страшного. Главное протегать что это 3д, ирл, фото и т.д. > снять на хрен пойми какую пленку и цвет фартука сливается с цветом платья Вручную фотожопом автотон-автоцвет, или заранее заготовленный корректирующий слой. Или в нем подбери нужные коррекции, а потом попроси ллм написать тебе питон скрипт для потоковой обработки картинок с применением найденной коррекции (или тоже автоматической).
>>1298008 На примерах 1 и 3 - только та лора из ссылки же в сообщении на школьную форму, а в 2 и 4 ещё к школьной форме добавлена какая-то самопальная, тренилась под нуб впред, активатора нет, датасет - отборный ии-слоп без шуток. Если сильно надо - litter catbox moe lxgeaifdlq87v5no.7z
>>1297952 > Не стесняйся рассказывать об опыте Пока всё очень нравится кроме интерфейса для инференса этой модели удивлён, что никто не использует для аниме здесь. Ну или не говорили просто.
>>1298034 Я сегодня был в приподнятом настроении — наконец-то что-то новое сделал, освоил. Потом взял, покрутил твою LoRA и внезапно расстроился. Потому что моя LoRA, натренированная на Civitai, — просто полное дерьмо по сравнению с твоей. Пробовал те же промпты, но с моей картинка будто без души и уже пережжённая даже на CFG 7. И дело тут не в правке баланса белого в фотошопе — что-то другое.
Это проблема. Потому что теперь, когда я в следующий раз буду делать Лору на Civitai, в голове будет сидеть мысль, что можно было бы сделать лучше.
Наверное, надо прекращать постить, а то меня опять забанят на 20 дней
>>1298102 > Я сегодня был в приподнятом настроении — наконец-то что-то новое сделал, освоил. Хорошо же! Именно так и есть. Я от Контекста недавно и Вана также радовался.
> CFG 7 Попробуй 5.
> в голове будет сидеть мысль, что можно было бы сделать лучше. Так какие проблемы-то? Конфиг в томл остался же - можешь поставить Easy Traininig Scripts и сам делать пачками. Конфиг вообще очень простой - адаптивный оптимайзер, лр юнета 1, лр те 0.3, дим 32/16, лора, даже не ликорис, бс4. Ну и я их сотни наделать успел, а вот радости больше всего от первых было, да.
>>1298189 Надеемся и ждем! Поленился делать/использовать лору и задал промптом? Там верх купальника отличается, но при удаче тоже можно запромптить >>1298291 Если лисожена обладает большим и пушистым хвостом, то можно попросить ее обвить его вокруг шеи для мягкости и комфорта.
>>1297186 Делал плагины и модельки для койкатсу, км3д2 и ком3д2. В паблик плагины особо не выкладывал, потому что было лень код причесывать, да и там были либо фиксы под вр, либо всякая мелочь вокруг геймплея для ком3д2.
>>1298461 Ну так хорошего персонажа должно быть много. (И мне не нравилась эта композиция с ней ростом ниже, так что я позволил себе немного вольности в этом)
Можете мой кривой фотожоп перегенерировать во что-то крутовое? Если что там и 720п хватит. Это для аватарки в твитторе и телеграмме? Я знаю, что такое уже было давно. Но эту картинку зафотошопили, ну точнее заибисили вот прям недавно.
>>1298521 Блин, извини, совсем нет времени дорабатывать, нужно на работу бежать
masterpiece, best quality, 1girl, Frieren, Sousou no Frieren, long pale lavender hair in twin tails, smug expression, light green eyes, elf ears, wearing a white towel, sitting on wooden floor in a warm rustic room, holding beer, peaceful lighting, soft shadows, (red can: 2), <lora:add-detail-xl:2.5>, <lora:Expressive_still_life_r1:0.5>, boozy, shirt print, black t-shirt, <lora:Футболка_Пивозавр__Beersaur_T-shirt_Clothing_for_Illustrious:1>, b33rs4ur
Как текстовые рп модельки будут подешевле и поумнее начну делать визуальную новеллу где будет чисто всё на ИИ, с локальной генерацией сцены через дифьюжн. До покупки видюхи думал будут проблемы с долгой и слишком рандомной генерацией. Но генерация идёт буквально секунд 5-10 в фуллхд на 5070, а стиль очень выдержан, если прописать определённые теги и залочить их. Даже лора не нужна.
В новелле будут активно работать 5+ моделей. Рп текстовая -> Контекст в ImgPrompt модель -> промпт в генерацию картинок на фон игры. (Пока ты думаешь, что написать дифьюжн будет циклично генерировать картинки плавно меняя их на фоне) Ахуенную качественную музыку генерит Lyria в риалтайм. Ей будет управлять инстракт модель понимая настроение рп контекста и крутя определённые теги и жанры в Lyria подгоняя музыку по настроению. Поляну насчёт TTS не пробивал, но думаю можно будет обучить какую-то модельку чтобы она озвучивала персонажа любимым голосом. +Для комфорта и удобства голсовой ввод без отправки, чтобы редактировать текст ручками. +Модель следящая за игровым процессом, которая может убить гг или отменить его действия если они слишком нонРП или бросить кубик - очень интересно.
Честно подводных камней вообще не вижу, уже сейчас это можно сделать, но это будет просто очень дорого.
В итоге обосрёшься на первом же затупе и забьёшь хуй. Никому не нужна твоя полная ИИ генерация, которая ещё и будет работать только на 5090, а не полную можно и сейчас спокойно делать.
Но ты ничего не будешь делать, тебе главное создать манямирок, что завтра точно начнёшь с себя, а сегодня можно отдохнуть, я ведь уже поработал, придумал манямирковую идею.
Не ври себе.
> Честно подводных камней вообще не вижу С этого отдельно проиграл, сразу видно, человек никогда ничего не делал, даже уроки на завтра.
>>1299014 > 640x625 Обрезаешь ватермарки? >>1299145 > промпт в генерацию картинок на фон игры. (Пока ты думаешь, что написать дифьюжн будет циклично генерировать картинки плавно меняя их на фоне) Хорошая идея > где будет чисто всё на ИИ, с локальной генерацией сцены через дифьюжн Если там будут твои пикрелы то плохая. > Рп текстовая > инстракт модель > Модель следящая за игровым процессом > подводных камней вообще не вижу Из-за смутного понимания как это работает. Но все поправимо, у тебя есть много времени чтобы освоить и сделать.
Дорого будет прежде всего по времени и при желании локального запуска. С корпами сварить кашу будет тяжело из-за фильтров и искажений при попытке их обхода. Это приемлемо при текстовом рп-чате где юзер сам за всем следит, но в подобной задаче может стать множащим на ноль.
И да, со всем этим ты потерял изначальную концепцию того, чем является визуальная новелла.
>>1299168 Как видюху взял и разобрался с генерацией сразу сделал концепт в консоли за день, чисто проверить идею на работоспособность, пока без музыки, ттс, игровой модели и тд. Чисто РП+генерация пикч. Вполне себе хорошо работает на клод 3.7-4, сейчас единственный он ахуенно прописывает промпт для дифьюжна и РПшит.
>>1299187 Ну визуально это просто будет похоже именно на Визуальную Новеллу
>>1299145 > с локальной генерацией сцены через дифьюжн Даже без сложных сюжетов надо роллить/инпеинтить, чтобы получить одну удачную генерку. Если чаров в кадре больше одного, то в любом случае функционал рулетки нужен, иначе контекст РП может не соответствовать изображённому на картинке. Банально, у тебя "2girls, hug from behind". В системе буру-тегов ты не сможешь описать, кто именно кого обнимает и надо крутить рулетку - а это не ложится на концепцию визуальной новеллы.
> Поляну насчёт TTS не пробивал, но думаю можно будет обучить какую-то модельку чтобы она озвучивала персонажа любимым голосом. Возможно проще будет связкой TTS + STS делать. По TTS я не помню чтобы были опен-сорс модели с готовыми тулзами для обучения (по крайней мере с поддержкой русика), а вот для STS можно тот же RVC использовать, обучение по 10-60 минутам голоса чара идёт в районе пары часов на 4090, вроде даже быстрее можно.
По итогу генеришь текст любым TTS, а затем перегоняешь к нужному голосу через RVC.
> + Для комфорта и удобства голсовой ввод без отправки, чтобы редактировать текст ручками. Из локальных решений можешь Whisper глянуть. Там много версий уже, я не в курсе, что актуально, но для русика оно норм речь в текст перегоняло.
>>1299273 что мне не нравится в RVC, так это то, что нельзя стримить текст в рилтайме. Когда ты уже пробежался глазами по тексту, пока он генерился и ждешь как дурак озвучки - экспириенс так себе. По идее таверна могла бы разбивать текст на части и озвучивать сразу. Почему так не делают, хз
>>1299145 Имхо, мне кажется, что на текущий момент если такое делать, то лучше идти сразу в рамках стандартного стиля для ВН: статичный фоны + набор спрайтов и изредка какие-то арты.
Генерацию спрайтов можно достаточно просто автоматизировать - как и генерацию новых, так и редактирование существующих.
А для фонов можно пробовать брать какие-то SaaS модели из топовых, типа имагена, они могут сделать идеальный интерьер, городской кадр и т.п. буквально с первой попытки, хоть и со стилем могут быть проблемы.
А дальше в контексте держать список бг, спрайтов, тулы для модели для генерации новых спрайтов и фонов и тулы для показа уже существующих. Но модель нужна будет достаточно сильная, чтобы с тул юзом подобным справится.
>>1299455 > как считать размеры тайлов Дели 2/3/такой делитель желаемый итоговый размер, чтобы размеры были в пределах 1200-1900, дальше у большинства моделей ломается когерентность/начинается шум.
Чтобы не делать лишнюю работы, получившийся размер округли до кратного 64 вверх, потом добавь ещё 64 на поля. Пример - 4680х3600. 1. 4680/3 = 1560 2. 1560 % 64 = 25*64 = 1600 3. 1600 + 64 = 1664 Также с короткой стороной.
>>1299606 Сцена на ване, выражение лица усилено через нуба, апскейл на флюксе/ване, перевод в акварель через контекст, апскейл два раза креа. Наверное можно было сделать короче... инб просто нарисовать
>>1298776 Ну как минимум картинки из треда там есть, так что видимо да. Но вообще /adt/ тред в /g/ должен быть про алгебраические типы данных, а не вот это вот всё.
Роувей это какой то местный прикол? Думал наконец замена нубу, так сочно представлял себе когда читал описания мега эксклюзивного датасета, идеальное копирование артистов, а получил слоп и артистов куда хуже ваи
>>1299455 >как считать размеры тайлов Сделал себе что бы итоговое изображение было ровно из 6 тайлов по 1152, в итоге 2304x3456. >>1299717 Имг2имг просто в латент пихается картинка вместо рандомного шума и денойсится не полностью как при апскейле, или можно тайл контролнет использовать и будет похожий результат. Апскейл делаешь после инпаинта и будет тебе имг2имг с легким изменением всей картинки, в комфи можно извращаться как хочешь.