Похоже на то, что самый простой способ использовать Wan 2.2 для генерации картинок, это просто использовать LowNoise модель, так как HighNoise модель она изначально для динамики в видео.
Можно даже еще проще сделать и заменить в вашем текущем t2i воркфлоу Wan 2.1 на Wan 2.2 LowNoise
>>1295755 У них какая-то жопа была в эти дни, он писали о проблемах. Я охуел, когда запостил свои шедевры и не получил привычные сотни лайков от поклонников. Подумал, неужто плохо вышло в этот раз. Но нет, это хуета с сайтом.
>>1295794 >>1295804 >>1295818 Лору может не ту подключил (или вообще не подключил) проверь что она точно выбралась, и это должна быть не вторая версия лоры для t2v а первая.
>>1295828 вот мои настройки. q6 - это плохо? у него по умолчанию оно стояло вроде. только sageвнимание отключил, но без нее ван 2.1. норм работает. и эта должна. так что не здесь проблема.
Привет, парни, может кто-то нагенерить фоток с этим еблом без очков, селфи всякие и тд, чтобы выглядели натурально и естественно, с не очень светом, чтобы не выглядели как ии молюююююю
>>1295881 >толку от неё без лор. кое-как работает с лорами от flux dev, но самое главное - работает хорошо с turbo лорой на flux, если ускорения от нунчаку было еще недостаточно, можно разогнаться до предела.
>>1295895 >PuLID работает с Flux Krea Каждый день чет новое узнаю. Хотя у меня натренирована лора на нужное ебало, но круто что технологии развиваются. Flux Krea тем не менее все такая же хуйня. На реддите там более менее реалистичные картинки делали, но я попробовал huggingface с PuLID поиграться и получается не очень. Буду пробовать ван. Кстати, там же на huggingface внезапно оказалось можно генерировать ван не только 5 секундный, а даже 0.3 секунды, а в комфепараше нельзя
скачал флюс нунчакал, дифмодель, установил с плясками с бубном, наконец форкфлоу смогло открыться хуяк УСТАНОВИ ТЕПЕРЬ СУКА ЕЩЁ 3 ЛОРА, КЛИП и ТЕКСЭНКОДЕР. пиздос, удалил к хуям даже не стал выдрачивать. По кайфу как раньще фп8 флюс одним файлом где всё включено. Сука теперь вычищать это говно
>>1295951 Удваиваю, там хаггинфейс WAN2.2-14B-Rapid-AllInOne чел запилил все в одном, у него видимо тоже пригорело. Меня тоже такой пердолинг не сильно радует, особенно с учетом что я через сервис использую, а там каждый раз скачивать надо
>>1295946 >а в комфепараше нельзя Я тебе даже больше скажу, в Комфи можно генерить 1 кадр (не секунду, а кадр). А ты думаешь как мы генерим text2image на Wan?
>>1295953 самое тупое в этой ситуации то, что нигде нет ссылок на эти лора ускорялки и клиппы с энкодерами даже в инструкции нунчаки и даже от авторов модели, орнул когда в камментах чел спросил - типа я смог нагуглить только клип, помогите найти остальное лол, ему левый чел отвечает мол юзай пока этот клим, я сам ищу. Какой-то длолбоебизм
Я хуею, что тут сддауны не могут найти? В видеотреде по 4 новых технологии в неделю выходит, на каждую пачка разных файлов, отдельно от комфидауна и отдельно от киджая. А эти раз в полгода не могут найти старый дефолтный клип.
>>1295961 >креа - кал Ну так никто и не спорит, ведь это тот же флюкс, только без жопных подбородков, а этого уже достаточно, ведь они так сказать singlehandedly делали флюкс хуже чем SDXL. А теперь мы имеем что-то вроде сдохли, но без нсфв, которую потенциально кто-то вроде лодстоуна может использовать чтобы сделать новую хрому (нет)
>>1295967 В хроме и так всё нормально, без обоссаного крякала. У тебя одного только в треде фиксация на этих подбородках. Небось, у тебя его вообще нет?
>>1295984 >У тебя одного только в треде фиксация на этих подбородках Значит ты не пользовался флюксом до появления холмы, это буквальное первый его недостаток, который упоминается ВЕЗДЕ
>>1295978 >Пруф Месяц два назад ещё показывал как генерил на мердже FusionX с VACE вот тут >>1254072 →
>>1296001 >Месяц два назад ещё показывал как генерил на мердже FusionX с VACE вот тут >>1254072 → → Ох ты ж блять, ну и зачем ты это высрал? Это дефолтные воркфлоу. В прошлом треде там была какая-то нода с num_frames, в официальных воркфлоу ее нет. Я хуею дорогая редакция, я должен искать способы генерить по васяновским картинкам с двача из-за криворуких долбоебов, которые не могут нормальные официальные воркфлоу выложить
>>1296001 >Значит ты не пользовался флюксом до появления холмы, это буквальное первый его недостаток, который упоминается ВЕЗДЕ Пользовался с первого дня. Еще раз - я не являюсь бесподбородочным унтерком хейтящим подбородки. Пруфани для начала, что он у тебя вообще есть. Полагаю ты что то типа пикрила.
>>1296001 >это буквальное первый его недостаток, который упоминается ВЕЗДЕ У меня натренирована лора, но всеравно периодически флукс делает всратые подбородки, думал это артефакты генерации, а это именно особенность флукса. Куууурррввваааа. Жду ван 2.2 vace что б генерить нормально уже
>>1296223 >ты хотел от q4? если-бы я знал что это, но я не знаю что это: >>1296223 >Один хрен vace нет лор Это печально, но хотелось-бы всё-же узнать как это связано с Wan?
>>1296223 >Чем тебя комфи не устраивает? Лапша в самых примитивных действиях. Причем коллапс группы и как следствие компоненты до сих пор работает через жопу — настолько, что этим нельзя пользоваться.
>>1296806 Пиздец, хотел зарепортить эту говнину, а репортить можно только открыв публичный дискас. Новый уровень скотства после мерджей с уникальными названиями.
>>1296223 >Нунчака хороша только как первый шаг для wan 2.2 >>1296898 >нунчака литерали костыль для врамлет нищенок Если не использовать квантированный t5 для нунчака (пик) а подключить старую ноду для загрузки обычного клипа, результаты получаются почти такие же как и на Q8
>>1296814 Помню как некоторые шизки когда flux только вышел ныли про то, почему у него такой хайп, если он хуже чем СД и вообще со временем о нем все забудут ЛОООЛ
Комфи не умеет в такой синтаксис?: (Orange background | teal background) Он это тупо в один токен впишет, вместо того чтобы переключатся между двумя токенами?
>>1297189 >нормально это сделать? Комфи пишут дауны-смузихлебы, которые очень быстро внедряют что-то новое, но не фиксится старое. Я сам сижу плотненько в нем и плююсь этим кактусом. Система вкладок багованная. Если у тебя идёт генерация в соседней вкладке, то в текущей будут артефакты, как будто здесь генерируется и все уже сгенерированные превьюшки, которые ты рассматривал пока генерируется соседняя вкладка, меняются на сгенерированные. Боль. Копирование и последующая вставка нод в двойном экземпляре (при включенной русской раскладке) не фиксится уже больше года. Им пох на это. Это то что я вспомнил. Многие баги уже забыл, так как привык к ним и воспринимаю как есть.
>>1297208 У автоматика тоже говна придостаточно. На слабых ПК нужно каждую вкладу выдрочить. Все вычитать, узнать что жрет врам. Узнать какие видеокарты поддерживают half-preccision. Память при смене моделей не выгружается. Скачивание сд1.5 после установки а1111 он так, не смог исправить и в итоге сдался. Если бы оно, хотя бы, воркфлоу могло сохранять может быть бы перешел. Два, сука, стула но хотя бы бесплатно.
>>1297293 >демку с хага можно развернуть на компе А как это сделать? Где скачать код? Вот я находил одну демку очень офигенную, но даже не понял что за модель и где ее скачать. Можно было только генерировать. Может позже найду, дам ссылку. Очень хочется скачать ту модель.
>>1297267 >жду "фокус" для Van'a Я задумывался над реализацией этого самому. По сути можно взять морду от фокуса, а комфи как движок. Есть даже именно такой китайский форк фокуса с поддержкой флюкса и т.п. можно на основе него запилить ван, если это уже не сделано, лол, давно не смотрел его, забыл название. Что собственно нужно от Ван на Фокусе? Генерация т2и самого собой. Что ещё? Апскейл, инпаинт? В фокусе режим работы переключается вкладками. То есть для конкретной вкладки нужно будет использовать подготовленный воркфлоу (естественно пользователь этого не видит). То есть сначало нужно так сказать "выливать" этот воркфлоу в самом Комфи. Интересно было бы почитать стороннее мнение на эту тему.
>>1297472 Я видел эту китайчатину, там и без Вана был полный пиздец, скрестить ужа и ежа не получится, слишком разные подходы, в фокусе всё нюансы подключаемые, а в лапше на тебя вываливается ушат зачастую неработающих помоев, одно исключает другое. На каждый чих закладок не напасешься, ты же видел онлайн-дрочильни, там есть с пару десяток (в лучшем случае) пресетов (сценариев), в которые ты можешь запихивать своих персонажей, это тупиковая хуета. Нужен анализатор видео2видео, где можно было бы возможным чёткое следование увиденному (распознанному) сценарию с низким "денойзом", либо внесение изменений с высоким.
>>1297623 Ебет в какой области? С какой целью? Единственные модели с реальным юзкейсом для работы это СД-тюны. Все остальное пока на уровне "сгенерить прикольный мемчик для анонов из треда".
>>1297623 Лучше SDXL пока ничего не изобрели. >>1297661 > натвис+вдв 4 шага уже никого не ебёт? Только DMD-шиза. В 4 шага разве что PCM + implicit-семплеры gauss-legendre и lobatto-star ебут. А DMD шакалит дико генерации и надо сосать у всратого LCM семплера.
>>1297623 ну вот тут Ван, смотри >>1297121 можно генерить с лорой на ускорение за 4 шага. В зависимости от разрешения, можно хоть за 40 секунд 720p или +-минуту 1080p нативно
>>1297472 >>1297620 Любая демкана хаге это и так уже готовая морда, скачай все файлы и запусти. Хули еще надо? Все свистопирделки можно вписать с помощью гемини.
>>1297296 Ты про эту что-ли? хотя у меня идея была чтобы в одном шаге он убирал "Orange background" а в следующем "teal background" и так по кругу пока не закончится генерация. Ну по крайней мене я так понял "|" синтаксис. >>1297330 Топовые.
>>1297907 > про эту что-ли? Хуй знает, возможно. > Ну по крайней мене я так понял "|" синтаксис. Правильно понял, но есть нюанс. Это легаси метод, который либо криво, либо совсем не работает на новых (2+года) модных сеэмплерах/планировщиках. Суть чередования - примерно сделать average, когда такой возможности нет. Дефолтными нодами это делается очень через задницу (settimerange для каждого шага).
>>1298243 В dev сосали пластик и блюр, в krea сосём зерно и артефакты перешарпа/хроматических аберраций. Сорта говна. Но dev хотя бы мог лес сгенерить, а krea впринципе не может в мелкие контрастные делали.
>>1298171 Нихуя себе, это что за конфиг? 2-4 фото я бы не отличил от реальных. Не зря походу читал что для нормальной кожи нужно проходить sd в качестве рефайнера
>>1298171 Посоветуй сдохлю. Скачал bigasp 2.0 и обблевался, 40 шагов 1024х1024 а результаты какая то мешанина, чернота вместо глаз и деформированные лица
>>1298055 >Которой всё известно о твоей видяхе, версии дров, торча и питона) Речь о том что локально можно запустить, даун. Не говоря о >>1298079 реально кому не похуй, такого только пед боится.
>>1298310 первые 2 хорошая геометрия всего, последние всё пошло по пизде блять, я думал ван лучше всех щас и не придраться, а на деле чёт хз уже вкатываться в него или крею попробовать... мимо
Буквально завалено всё ебучими дженерик картинками пёзд и сисек, заебали gooner'ы, мало вам реальных фоток что ли. На пикчах вот древняя SDXL, пару лор для шлифовки, ну и controlnet само собой. Пикселизацией явные огрехи и следы генерации можно замаскировать. В фотошопе еще текстуру закинуть, не шедевр конечно, но глаз хоть немного радуется. Кстати, просветите, самое близкое что есть к фотореализму сейчас, это wan text2image + лора? Давно новости не читал.
>>1298604 >Кстати, просветите, самое близкое что есть к фотореализму сейчас, это wan text2image + лора? Да, для t2i достаточно lownoise версии Wan 2.2 с lightxv2 T2V Лорой (вообще лора на 4 шага, но это для видео, для t2i лучше ставить сразу 10 шагов).
>>1298787 Ты просто завидуешь, в тред редко что-то годное постят, но это оно. И спешите видеть - дмд-даун сразу прибежал рваться. У него генерить поучись.
Подключил флакс + контролнет для первого шага, дальше ван. По итогу картинки генерит нормально, для фотореализма получается хуета. Это особенности такой связки или можно подправить?
>>1298918 У ван модели подразделяются на: т2в, и2в. Мы используем модель т2в как т2и. А вот использовать модель и2в как и2и не получается никак. Фигная выходит. Ты на какую модель подаешь картинку?
>>1298926 У меня при рандомном сиде показывал 0. Ещё баг есть с версии 0.3.40 многие ноды перестали работать из-за ошибки очереди запроса. Юзаю комфикал со дня сотворения этого поделия и столько багов я не видел ещё ни в одной проги. У этих криворуких долбоёбов обоссанных нет даже стабильной версии и что такое багтрекинг они не знают. Школота какая-то китайская высирает коммиты, а долбоёб их сразу апрувит.
>>1298171 В норме анус и пизда расположены гораздо глубже. Чтобы было видно очко, нужно ещё ягодицы раздвинуть.
Такую пролапсирующую промежность почему-то любят художники рисовать (откуда SD такого и нахватался). Большие половые губы выглядят и выпирают так, будто это яички, а то и ещё дальше. А анус будто рисуют поверх трусов или склеенных ягодиц, и либо огромным и раздроченным, будто у видавшего виды мула, либо едва заметно точкой.
Видимо, среди художников или их платёжеспособной ЦА преобладают короткостволы, которые проецируют свой короткий пипир на изображению, считая что только в такой вывернутой, выпирающей конфигурации он достанет до дырки.
>>1298936 >Ты на какую модель подаешь картинку? На т2и подаю латент такой схемой и получается что-то типа такого. Сейчас если добавляю больше шагов на ване, то он перепердоливает картинку, а мне нужно что бы он просто исправил недочеты флакса. Но походу я пытаюсь скрестить ежа с носорогом и нужно использовать только одну модель.
А флакс уже похоронили или все еще годнота для реализма? Ван в любом случае буду дальше крутить
>>1298963 >Такую пролапсирующую промежность почему-то любят художники рисовать (откуда SD такого и нахватался). Большие половые губы выглядят и выпирают так, будто это яички, а то и ещё дальше. А анус будто рисуют поверх трусов или склеенных ягодиц, и либо огромным и раздроченным, будто у видавшего виды мула, либо едва заметно точкой. >
>>1298969 делай не пряму передачу латента а полный второй проход, то есть сначала генерируй картинку полностью на флюксе (то есть не тупо кидай латенту, а декодируй его в изображение), потом делай img2img со средне-высоким денойзом на Wan.
>>1299011 Я решил не переизобретать вокрфлоу, а просто увеличил готовность в первом шаге тут. Первая оригинал, 3 флакс, 4 финальная ван. Реквестирую что тут еще можно подркутить?
>>1299137 Там в оригинальном воркфлоу такая же хуйня была, я уже подгонял. Но щас сделал так, результат получше, но всеравно недотягивает до оригинального ван.
Первая оригинальный ван t2i, вторая флукс, третья - обработка предыдущей ваном
>>1297744 >Любая демкана хаге это и так уже готовая морда, скачай все файлы и запусти. Так-то оно возможно, но комфи умеет разруливать ситуации когда у тебя мало врам, а дуффезерс же будет протекать в шаред озу и всё будет томрозить? Я просто не знаю.
>>1299758 По моему диффузерсы наоборот меньше памяти потребляют. Тут я как бы тоже хз, но есть объективно ограниченный объем памяти на зеро (в юнитах/секунду) и раз там успевает 5 сек, то и на пекарне успеет. С ваном 2.1 это как бы не проблема. Это не говоря о том, что ты можешь так же вебморду написать просто в гроке/гемини, а код взять с колаба, где тоже есть пятисекундные варианты влезающие в 12 врама (но там хуже всё оптимизировано, ну или я норм не находил).
>>1299755 У них есть омни модель в чате. Результат не буду показывать, но выглядит как говно. Конкретно по редактированию фото. Замыливает и всех превращает в китайцев. От этих насильников флакса вообще ничего хорошего можно не ждать.
>>1299823 Да там вообще ощущение что это аппликация, будто вырезали чувака и в фотошопе на фон прилепили. Настолько неестественную светотень ещё поискать.
привет, парни выпал на пару месяцев в миджорню как-то
хотел уточнить вопросики: 1) флюкс уже починили чтоб не генерил втрое дольше сдхл или только пережатую хуйню дрочить и никто этим не занимается? (про контекст слышал только) 2) появились новые прямочки для убыстрения люстры...? 3) пони в7? 4) какая МЕТА (более менее общепринятая) по реализму/аниме (были натвиз/нубаи) 5) дмд срач продолжается?
>>1300035 >1) флюкс уже починили чтоб не генерил втрое дольше сдхл или только пережатую хуйню дрочить и никто этим не занимается? (про контекст слышал только) да, на специальной ноде генерит теперь даже быстрее чем SDXL https://github.com/nunchaku-tech/ComfyUI-nunchaku плюс еще выпустили на днях flux krea, в которой можно сказать полностью вылечили проблему жопных подбородков и пластиковой кожи, но там другие появились проблемы (грейн теперь по дефолту везде) https://huggingface.co/nunchaku-tech/nunchaku-flux.1-krea-dev
>>1300035 >2) появились новые прямочки для убыстрения люстры...? нет, но появились ускорялки для Wan, который кстати как выяснилось генерит реальные картинки быстрее и лучше чем Flux (с художественными похуже)
>>1299837 >Настолько неестественную светотень ещё поискать Тени всратые, но это все что может выдать флукс креа + реализм лора. Попробую еще простой canny для контролнета, вместо глубины.
>>1300082 >как выяснилось генерит реальные картинки быстрее и лучше чем Flux Генерит прям заебись. Контролнета под него еще не завезли?
>>1300131 >Генерит прям заебись. Контролнета под него еще не завезли? Ну есть Wan VACE, который теоретически должен из под коробки работать с различными контролнетами, но я не стал парится с ним
Откровенное nsfw невозможно, но поддержку лор представили с 1 дня. Если будет действительно легко тренируемым, а не как запарытый флюкс, то может стать новой основной моделью для локального имагена
Меня больше всего удивило то, что она запустилась на моем 3070 с его 8 ГБ.
Только вот не хватает ускорения, нужно чтобы сделали турбо лору и поддержку Нунчаку в придачу.
>>1300336 не, это я просто малое количество шагов ставлю чем нужно, так как иначе ждать дохера времени, тупо экспериментирую с тем что можно. Тут еще нужно с шифтом играться, если повышаешь его чтобы уменьшить блюр то теряешь детали.
>>1297741 >>1299763 >тюн киберлюстры Низашло. Видно что это пони. Первый пик это оно. Остальные это натвис дмд. Загроможденная комната чек. Эпик лайт чек. Не лошадинный анус чек. (pov, doggystyle, anal:1.2), grab ass, (looking back,:1.2) epic light, cluttered room
>>1300574 Это всё хуйня, от модели и воркфлоу сильно зависит, нет какого-то одного лучшего семплера. Те же implicit семплеры как говно могут выглядеть, но с 4-шаговыми лорами или если правильно приготовить - топ. CFG и наличие аттеншен гайденса сильно влияет на оптимальный семплер. Гибридные семплеры там чел вообще не осилил.
>>1300567 Ну, ладно, nsfw говоришь не возможен. Но работают ли разные позы? Например: стоит спиной к камере нагнувшись вперед и раздвинув ноги. Ну и т.п. типа "сиди на стуле подняв и разведя ноги вверх" Работают?
>>1300319 Про ван я так не писал. Зайди в чат квена и выбери омнимодель, кинь фото тянки (которой у тебя нет) и посмотри как она станет пиздоглазкой в мыле.
>>1300574 >a neutral vibrant yellow background Я вот так не тестю. Нужен лес на фоне. Сосновые деревья и кусты. Сразу будет понятен грип и детализация. А на однотонном фоне это не тест.
>>1300606 >Flux - 12b модель >Qwen Image - 20b модель как по твоему они добавили дополнительные 8 миллиардов параметров в 12b модель? Просто замерджили? Сделали add paremeters? Ну и кто теперь долбаеб? Еще скажи что в SD 1.5 можно добавить 3 млрд. параметров чтобы он стал похоже на SDXL.
>>1300639 а да? конечно, ведь он же еще и натренировал лично на своем домашнем ПК модель уровня Imagen от Google и он добродушно дает доступ через свой дискорд к этой 100% сделанной лично им мега модели.
Мастер квантования и отец Ггуфа вернулся, и даже не просто чтобы дать собственный мастерский квант на Квен, но и чтобы преподнести миру новый способ, который позволяет сохранять качество вплоть до Q2 модели. УРА, ТОВАРИЩИ!
>>1300664 Пчел. Если ты слепоёбок - не значит что все такие. Дело не в ёлках. У неё перетравлены высокие частоты, как это было в хуёвых уроках фотошопа из 2003. Это брак.
>>1300952 По качеству и пониманию промпта квен явно лучше вана, но без ускорялок грустно, по минуте на пик. Радует только то что это не всратый огрызок как флюкс.
>>1301094 >По качеству и пониманию промпта квен явно лучше вана По качеству то, что я видел не лучше, а сильно худше, пластиковое все на равне с флуксом первым
>>1301206 Это потому что лоурезы. Клоузапы нормально выглядят. Будет скорость, можно будет и про качество думать, а пока каждый шаг и пиксель экономим. Можно XL проходиться.
М-да, видимо не осталось здесь старожил времён сд1.5. Иначе бы помнили, что в негатив вписывать токены Chinese, Asian считалось обязательным и решало все проблемы с азиатчиной, которая также лезла со всех щелей.
>>1301338 > в негатив вписывать токены Вообще-то (japan:2).5, а в позитив нужно писать (very sun]:1.7. Знаем такое. >>1301350 > в связную логику можешь? У него фокууусное расстройство личности. Скажи спасибо, что он в твоем ответе совет использовать карася не увидел.
Цель - генерация максимально обычных фоток, будто на телефон сняли, со всеми недостатками телефонных камер. В общем, нужна генерация неидеальных фото. Не учитывая лоры, то какуюая модель/файтюн лучше подойдет
>>1301586 Я пока сам не напердолил как надо. Как-то стиль скачет между генерациями - иногда мылит, иногда на XL похоже, иногда заебись прям. Что-то меняешь и вроде лучше становится, а потом спустя пару генераций вроде и нет. Надо пердолиться ещё. Пикрил что получается, в целом достойный наследник XL, и лоры на 24 гигах можно тренить нормально. Если тебе надо зашакалить как фото с телефона, то он с радостью мылит, в стилизацию умеет.
>>1301683 Я ещё вчера потратил 2 часа на квантование этого говна, шакалит очень сильно, как будто на XL со всратым VAE вернулись. Даже пробовал 2/3 семплить им, а потом 6 шагов добивать обычным - всё равно говно. Ждём нормальную лору на 4/8 шагов или нунчаку.
>>1301689 >2/3 семплить им, а потом 6 шагов добивать обычным на реддите пишут что латента Qwen спокойно идет в Wan без декодинга, так как vae от qwen основана на vae от wan.
>>1302275 Да, чмонь, выдают одинаковую картинку по одному и тому же промту. А вот сд3.5 по этому промту рисует совершенно иначе. Так что квен это ухудшенный ван для 5090. Вернее, ван заточен под видео, а квен это ван для фото, но что-то пошло не так.
>>1298800 Ебанутый копроежка, это и есть дмд с очень всратым фильтром и процессингом. Одних этих ублюдских цветов достаточно, что понять его уровень и понимание чем он занимается.
>>1301229 >>1301280 >>1301286 >>1301289 >>1301633 >>1302006 чёто прям вообще грустный пиздец по квалити. картинки с трампом, конечно вдохновляют, но их в контексте можно напердолить в несколько шагов. подожду короче больше примеров с реддита
>>1302286 Приятно видеть итт адекватов. Эти дни тестирую квен и пришёл к выводу, что всё с ним печально. При том что у меня руки прямые и я в этой теме с полторашки ещё. Квен ощущается каким-то тюном а ля бля flux colossus/chroma. Ну типа одно дело понимание промпта, другое реализация этого понимания.
Вот еще. Какие-то текстурки в квине всё же есть. Detailed grainy film photograph of a selfie film photograph of a girl long hair blue eyes brown hair night body freckles
>>1303008 Кстати, вполне вероятно. Может на img2img она намного лучше. Я помню, охуел как реалистично выглядят портреты на сд3. Но больше она ничего не умела, поэтому уже даже не помню как она генерила. С тех пор многое поменялось, не сравнивал.
Есть ещё у кого-то здесь rtx3050 на 8гиг? Интересно, что у меня любые гуфы чуть медленнее обычных моделей. Причем заведомо больше размеров врам. Флюкс, Ван, Квин и т.п. Специально скачивал мелкие гуфу на Q2 или Q3 чтобы в память карты входили и они медленнее чем 12-20 гиговые обычные модели. Немного, но есть. Смысл от гуфов для меня вообще? Сталкивался кто с таким?
>>1302814 > текстурки Ну хуй его знает. Единственные текстуры, которые я там вижу - пересекающиеся полосы, будто напечатано на простыне. Это VAE косячит или сэмплер/щедулер/шаги не те?
Сап бывалые, подскажите, кто ни будь пробовал себе собирать "бенчмарк" для теста моделей/лоры? Хочу сделать какой ни будь максимально конкретный и стабильный промпт по которому будет рисоваться всегда одно и тоже Для чего? что бы при добавлении лоры например, было видно на "бенчмарке" как и на что именно лора влияет, максимально предсказуемо(насколько это возможно) относительно эталона Кроме желания у меня не хватает опыта такое сделать, может есть идеи или примеры подобных вещей? может что то делали для себя подобное и готовы поделится опытом?
>>1303173 Знаю, xyz plot нужен уже после того как есть что обкатывать я хочу именно базовую картинку максимально стабильную придумать, именно как основа для xyz'a в будущем, что бы сравнивать(почти бенчмарк) >>1303176 я понимаю что будет плавать сид и в зависимости от него результат и 100% точности не будет, и плавает на картинке всё что не описано максимально подробно и точно, но даже не идеальный результат всё равно сильно поможет в оценке лор/моделей/ новых тегов/ чего угодно ещё Как пример пик - меняется только прическа в промпте, а в результате меняется, возраст персонажа, положение головы, одежда, раса и тп основная причина потому что всё это не записано подробно в промпте, Вот я и хочу придумать максимально конкретный стабильный промпт для подобных вещей
Страшная мысль пришла - а что если нейронки, да вообще мощние видео карты запретят как герыч? Я вот недавно размышлял что как будто с нейронками смысл жизни обрёл, и я не какой-то шиз, а значит об этом многие сейчас думают. А так думать в массах нельзя, чтоб плодячка не исчезла и многие сферы услуг. По этой же самой причине запретили тоже безобидных курильщиков зелёного. И я даж не знаю. Если отнимут нейронки, я буду горевать. Надо как-то всё сейвить.
>>1303197 > максимально конкретный стабильный промпт Не будет. Если ты считаешь, что сменив 1.5 на хруму/квену/флюху/небо/аллаха ты внезапно сможешь заставить нейронку следовать промпту так, чтобы при смене прически менялась только прическа, да еще и на разных моделях и с разными лорами, то ты слишком много хочешь. Но всегда есть классика - european woman, casual dress.
>>1303197 >всё что не описано максимально подробно Тебе надо искать те имена, в которые максимально предопределённый и узнаваемый образ: Чарли Чаплин, Барт Симпсон, Венера милосская, Микки Маус, Эйфелева башня, Мерлин Монро и тд. Надо только подобрать, чтобы копирайтом не задевало.
>>1303392 Пробовал, проблема в том что образ конкретного "персонажа" тащит за собой влияющие на результат куски (атрибуты, цвета одежды, материал одежды и тп) Если персонаж носил зеленый костюм похожий на латексный, то и всю одежду которую ты ему предложишь он отрисует в латексе и в зелёном цвете(если не указано обратное), предложишь платье(без уточнений) - будет зелёное латексное платье Это хорошо когда ты рисуешь конкретного персонажа, одежда будет соответствовать Но цель придумать универсальный бенчмарк, и тут известный персонаж слишком сильно повлияет на результат там где это не надо >>1303379 Я не поехавший, понимаю разницу между моделями, и не жду между моделями большой повторяемости Я хочу брать лору на одежду/прическу/атрибут/"улучшатель" от васяна или просто экспериментировать с тегами новыми, не кардинально влияющее на результат и хочу его прогнать так, что бы четко видеть результат а не генерить пальцем в небо где ты меняешь прическу а персонаж меняет положение головы,цвет кожи и одежду, именно для качественной оценки/тестов и хочу делать этот "бенчмарк"
>>1303170 >инпеинта ваном нет как нет, есть. так же как и инпейнт на любой другой модели. и img2img, апскейл есть. пока есть значение денойза, инпейнт есть на любой модели, так как по сути инпейнт это насрать шумом на область картинки и перегенерить эту область заново - что не отличается от обычной генерации пикселей которую делают все картиночные модели.
>>1303322 >Надо как-то всё сейвить. Все уже засейвлено на харддрайвах миллионов пользователей civitai. Сейчас автоархивация проходит так, что ни одна удаленная с него модель не остается без бэкапа от кого-то, подозреваю что боты скачивают все публикуемые на civitai модели https://civitaiarchive.com/deleted-models?is_nsfw=true&is_deleted=true
>>1303467 >есть. так же как и инпейнт на любой другой модели. и img2img, апскейл есть. пока есть значение денойза, инпейнт есть на любой модели Ох ебал я всё это, у меня уже бугурт от того что нужно копаться на ютубе слушая индусов, на говноцивитаи, где вперемешку всё и реддите что б найти нормальный воркфлоу. Был же нормальный каломатик, где всё в одном интерфейсе, а тут ищи подходящий воркфлоу
>>1303420 > Я хочу брать лору на одежду/прическу/атрибут/"улучшатель" от васяна или просто Не бу Тогда тебе нужно составлять промпт на каждую лору на одежду/прическу и делать прогон без нее и с ней, а не искать магический промпт, на котором можно всё тестировать. Как только ты скачаешь лору с триггером, которого нет в твоем универсальном промпте, все предыдущие результаты окажутся инвалидами. amateur photo, 1girl, ginger, shy, formfitting dress, petite, standing, dorm, natural light, evening twilight
Особенность Qwen не в качестве кожи или текстур, а в том, что оно может в то, что другие локальные нейронки не могут.
>>1303480 Это все от не понимания того, что вообще происходит при генерации картинки нейронкой. Поэтому и ComfyUI с его лапшой лучше чем автоматик, ведь на последнем можно доталова сидеть не понимая что делает vae, текстовые энкодеры и что происходит при апскейле или img2img, а вот с ComfyUI становится понятно - ведь тебе в итоге нужно самому построить пайплайн для инпейнта и ты понимаешь что ты делаешь то же самое что и при t2i только для отдельной области картинки.
>>1303493 >Как только ты скачаешь лору с триггером, которого нет в твоем универсальном промпте, все предыдущие результаты окажутся инвалидами. Если это будет происходить не каждый второй раз, а например на 1 из 5 лор - то меня это более чем устроит, это уже более чем стоит усилий Дело даже не только в лорах, я теги тоже хочу прогонять Показал на пике хороший пример, первое что хочу стабильно получать (через подробный xyz plot а не через контрол неты и пердолинг) Второе - то что часто всплывает само по себе (полагаю что из-за слабо описанного промпта персонажа , не уверен)
>>1303495 >Это все от не понимания того, что вообще происходит при генерации картинки нейронкой Это как если бы тебе каждый раз, когда нужно куда-то поехать на машине нужно было бы пересобирать коробку с двигателем. Мне для нескольких картинок нужно пердолиться 3 недели.
>делаешь то же самое что и при t2i только для отдельной области картинки Вот это было до вана, когда была одна универсальная модель, а тут мало того что на 2 части разделили, так еще и t2i и i2i отдельно, пидоры
>>1303531 >так еще и t2i и i2i отдельно ничто не мешает делать i2i на t2v модели, i2v модель отдельно только для видео. Для целей генерации картинок не нужно что-то более чем t2v Wan 2.2 качать, да и то достаточно lownoise t2v 2.2 Wan.
>>1303495 > Особенность Qwen не в качестве кожи или текстур, а в том, что оно может в то, что другие локальные нейронки не могут. Да, квен промптится лучше чем даже платные флюксы. А для генерации баб и реализма есть Хрома.
>>1303485 Осталось только дождаться пару годков, когда на промпт фото будет выдавать фото, а не unreal engine render. > прибавка качества мизерная, но она сука есть А вот с этим я запутался. Увеличение шагов таки добавляет четкости, но вместе с ней и артефактов наваливает. 1 - 15 шагов, 2 - 20, 3 - 30. Уже на 20 шагах появляется эффект прифотошопленного ебала и какие-то дырки в пальцах.
>>1303638 >Да, квен промптится лучше В реализм и несколько селебов может?
Arnold Schwarzenegger and Sylvester Stallone, in matching bright pink tracksuits, doing squats with concrete blocks, rusty outdoor gym in a snowy park, leafless birch trees, grey apartment blocks in distance, low resolution candid emotional live photo from rus social network, spontaneously taken in motion from random angel with a cheap phone camera in Chelyabinsk, compressed jpeg poor quality, chromatic aberrations, minor color distortion, date stamp
Квен плохо понимает английский, из-за чего порой случаются забавные моменты типа пикрелейтед.
Общее наблюдение: квеновские картинки пиздец как похожи на выдачу дерьмины по тем же промптам, в некоторых случаях буквально идентичные лица рисует. То ли на одном датасете тренированы, то ли оба файнтюны одной модели, х.з.
Ух, анончики, реально грофон дерьмины, плюс лучше слушается промпта и нет цензуры на промпт/выдачу, и все это бесплатно без смс. Просто праздник какой-то, был уверен, что такого еще год-два ждать.
>>1303965 Вот дерьмина по тому же промпту, что >>1303893, только револьвера нет, пришлось убрать из-за цензуры. Третий и четвертый пик - персы отдельно, очень похожи на тех, которых квен нарисовал. Как иллюстрация к >>1303841
У дерьмины качество все же получше, но тут вопрос, насколько влияет то, что у меня на картинках квен с тензора (fp8, euler simple, 25 шагов, разрешение низкое).
>>1303998 Да, блядь, дай промпт и точную версию модели. Я с 16 версии её дрочу, дохуя генерил, такой четкости не получалось, но выше 1мгпксл не генерил.
>>1304255 >>1304390 >>1304488 ну, модель то может и понимает такую вещь, но прикол то в том, что из-за особенности многоязычного текстового энкодера оно может просто не воспринимать отдельные слова так, как мы их понимаем. Но можно подобрать слова в промпте чтобы вызвать нужно действие. Может дермьина просто использует собственный текстовый энкодер, а модели обучены на одном и том же датасете.
>>1304812 А ты откуда знаешь? Ты запостил первый кадр видео. Промпти правильно, когда используешь видеомодель, тогда и первый кадр будет соответствовать.
>>1303467 >Все уже засейвлено на харддрайвах миллионов пользователей civitai. Сейчас автоархивация проходит так, что ни одна удаленная с него модель не остается без бэкапа от кого-то, подозреваю что боты скачивают все публикуемые на civitai модели А что насчёт самого главного - то есть технологий и костылей питоновских? У меня сд без интернета не запускается.
>>1305216 Да, представь, модели ушли дальше твоего дмд-кала. Особенно видео модели, в которых внезапно промптится действие, а не статичное изображение, поэтому особенно важно прописать правильно, если тебе важен старт видео.
>>1305144 >У меня сд без интернета не запускается. А у меня - да.
Ничего в sd не требует подключения к интернету, только если у тебя модели не скачаны и их нужно докачать при первом запуске. В комфи интернет нужен только для обновления проги.
>>1305888 >Для тебя? Для меня оно тогда нахуй не нужно, так как я все эти черепа рисуемые флюксом и вот эту характерную рисовку от дерьмины - уже занюхал до блевоты. Поэтому квен ну просто скучная модель, да норм понимание промпта, но артистичность околонулевая. >>1305759 вот тут как бы МОЖНО сказать что он нормально понимает промпт (и на русском тоже), но! Есть один ньюанс. Там два раза был упомянут абстракционизм. Ты видишь на этих картинках его? И вот я тоже не вижу. Для сравнения Хрома там такое ебанула - я сюда постить не буду, но там явно видно что художественный стиль она поняла, да и промпт - тоже. Вывод? Хрома ебет.
А квенкал, фотон, сидримс, дерьмина - одни и те же китайские яйца, то в анфас, то в профиль.
Как начать понимать, какие модули нужно использовать в комфи? Вот у ЛЛМ все просто. Написать код для txt2txt процесса не составляет осоьоых проблем. А для условной Flux, я без понятия.
Квин очень однообразен. Если Ван на одном промпте с разными сидами выдает кучу разнообразных картинок, то Квин выдает очень одинаковые картинки. Например даже все бабы повернуты в одну сторону. Это очень плохо.
Анальная хрома это не дистил, с повышенным цфг получается на 20 шагах, дпм2 бета. >>1306156 >v47-flash Что за такая странная неофициальная версия от сильвера, которая ебет официальные хромы. До этого у него был один только кал, который сильно ухудшал за счет скорости. Пока лень самому качать и пробовать.
>>1306206 Нет не понимаю. Я лишь вижу что энтузиаст тюнит флюкс на коленке качественней чем корпы. Никто квенкал тюнить не будет, это бесмысленно. Тут сд 3,5 момент. Ну есть и есть, промпты понимает, гкенерит стоковый кал, идет нахуй, так как затренирован синтетикой с китаеговна. То что затренирован - легко понять, когда тебе по дефолту китаез генерит.
>>1306517 >Это другое Все, что ты пишешь, говорили про флюкс. И потом нашелся энтузиаст. Так же через годик найдутся такие и для трена квина. Как бы ты тут не брызгал слюнями.
>>1306529 Хуя себе как ебёт. Не видел ещё даунш со стрелками, готично. Творите. Генерит только долго пиздец, как все ранние версии. Вот бы вагинальную хрому на 4 степа с таким же качеством.
>>1306517 >Никто квенкал тюнить не будет Пиздос, а как же HiDream, за него вообще обидно. В моменте была лучшая локальная базовая модель, но все её игнорят.
Я ж тут сцуко самый умный? На шнеле вот так поставил и оно генерит! ГОРАЗДО ЛУЧШЕ! Но промпт немного попизде идет. Часто валит ошибку 0 и 0 и черный экран - надо перезапускать консольку комфи. Хуйзнает почему оно вообще работает. С дев и хромой еще не пробовал - спешу поделиться с вами. Жду результата ваших экспериментов. А может еще есть рецепт чтобы ошибку и черный экран не было? 2пик т5ххл 3пик qwen scnell
>>1306896 Я кстати первый раз когда так сгенерил, то долго повторить не мог. Картинка с воркфлоу есть, а не генерит повторно - ошибка или черный экран. От чего зависит так и не понял. Комфи обновил получше стало.
>>1306560 > Так же через годик найдутся такие и для трена квина Но квен это и так тюн флюкса, зачем кому то тренить на тюне? Что это за шиза? На колорсе много натренили?
Как сука сделать так, чтобы фотка выглядела естественно, без коммерческого вида, постобработки и ИИ-шности. Будто просто рандомная фотка из галереи. Только пару дней долблюсь в комфи юай. Тестирую flux krea и хз. В треде вижу фотки которые реально хуй отличишь от реальности, сделанные во flux krea, а у меня такая параша. Подскажите че не так делаю
>>1307453 А в чём смысл генерить фотографии? Объяснит кто? Ну понимаю генерить мазню хуйдожника, спиздить его стиль. Но, блядь, обычные фотки, просто открываешь инсту или еще какую хуйню для баб и смотришь это говно тоннами.
>>1307483 >На ван достаточно неплохо получается, на sd3 + контролнеты достаточно хорошие отзывы Для 1girl более чем достаточно файнтюнов сдохли, и результаты будут лучше.
Что за хрень новую придумали в Комфи - субграф? Не доделали шаблоны и прочее и уже что-то новое суют. Где справку почитать хз, как обычно. На гитхабе не нашел. Кто распробовал это?
>>1307777 То есть в принципе можно изучать и пользоваться? А то я как-то наделал групповых годов, которые прячутся в один нод, а потом выяснилось, что это работает только в пределах одного воркфлоу. Ну и нахер это тогда? Тут такое же?
>>1307638 Не хватает банки огурцов и самогонного аппарата, попробуй запромтить его, если отморозится напиши дисстилятор, и да сушеная рыба и кот, без них - никак) >>1307800 >Опять вылез Значит все правильно делаешь, видал как комфи-выблядков корёжит, пости ещё, развивай тему.
Сап, как убрать блюр? Может лоры, промпты или интрументы какие? Дело в том что кидал шакальные пикчи при создании лоры, по сути скринчики из видео 540p с вебкамщицей. Можно ли как-то чёткость улучшить?
>>1307973 Нет, квен кал. Он нужен на лоу степах для следования промпту. Латентные имаджи совместимы между ван и квеном, так что потом латент апскейл. А вот ван дальше - база. В общем я спиздил отсюда, только убрал Fusion лору и поменял lightx2v на новую версию и поигрался с параметрами. https://civitai.com/models/1848256/qwen-wan-t2i-2k-upscale Сам потести. Я уже наткнулся на то, что квен срёт в штаны вану и ломает иногда человека. Ну и в целом сам ван лучше.