Главная Юзердоски Каталог Трекер NSFW Настройки

/test/

Создать тред Создать тред
Check this out!

<<
Каталог
test2 /cat/ Аноним 27/11/22 Вск 19:19:20 195006
0
1
Ответ
16416378654270.jpg 33Кб, 652x732
652x732
Если вы хотите задать какой-то мелкий вопрос - используйте для этого данный тред или найдите профильный треде в каталоге.
О разделе:
1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.
2. NAI, SD и AICG треды перекатываются после достижения предела в 1000, 1000 и 1500 постов соответственно. Любители чрезмерно самовыделиться идут в /asylum/.
3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.
4. Это доска преимущественно технического направления. Для откровенного NSFW-контента выделена отдельная доска - /nf/, эротика остаётся в /ai/. Так, порнография и голые мужики теперь отправляются в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.
Пропущено 30 постов
30 с картинками.
Пропущено 174 постов, 30 с картинками.
Аноним 08/03/24 Птн 02:03:33 209952
0
0
Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >>

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды whisper: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/
Аноним 08/03/24 Птн 02:08:34 209953
0
0
Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >>

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды whisper: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/
Аноним 08/03/24 Птн 02:27:22 209954
0
0
output.mp4 1613Кб, 1280x720, 00:01:09
1280x720
output2.mp4 6481Кб, 1280x720, 00:01:09
1280x720
test !.SipuxaHy. 08/03/24 Птн 11:25:38 209960
1
0
dsa
Аноним 08/03/24 Птн 13:00:38 209962
0
0
Jjjjjj
test test 11/05/17 Чтв 01:40:08 25759
7
6
Ответ
test
Пропущено 25 постов
25 с картинками.
Пропущено 666 постов, 25 с картинками.
Аноним 03/03/24 Вск 15:32:07 209865
0
0
test
Аноним 03/03/24 Вск 17:30:39 209866
0
0
test
Аноним 03/03/24 Вск 20:20:43 209867
0
0
Аноним 07/03/24 Чтв 19:51:44 209943
0
0
11
Аноним 07/03/24 Чтв 20:08:42 209944
0
1
test
(Автор этого поста был забанен. Помянем.)
Новеллы на мобилу Аноним 24/10/22 Пнд 22:27:55 194038
0
0
Ответ
166663921918493[...].jpg 195Кб, 1280x800
1280x800
166663939985858[...].jpg 83Кб, 616x353
616x353

Сап, двач. Примерно с середины лета увлекся визуальными новеллами. Преимущественно прохожу на телефоне. Уже прошел Бесконечное лето с парой модов, две части Данганронпы, ЛМР, Катаву. На этом мои знания относительно мобильных версий новелл кончаются. Есть ли у вас что нибудь на примете?

Пропущено 5 постов
5 с картинками.
Пропущено 424 постов, 5 с картинками.
. !!3zF6jTIXaQsHhpdO 19/02/24 Пнд 23:22:01 209237
0
0
e565a7f7
. !!SoZU8Srv9LM+fJHW 19/02/24 Пнд 23:22:31 209238
0
0
a07a4f0d
. !!sBFHdWHJi2wa1EpL 19/02/24 Пнд 23:23:01 209239
0
0
44bd81d2
. !!8SUP2oZKZtp6bi1C 19/02/24 Пнд 23:23:32 209240
0
0
301d3709
. !!0l807oNHWlWjCJAt 19/02/24 Пнд 23:24:02 209241
0
0
bb644d95
навальный \ролл /ролл Аноним 06/06/17 Втр 15:10:12 28394
0
2
Ответ
04d02914f99401f[...].jpg 50Кб, 640x360
640x360

А вот и новый реквест-тред. Все пожелания о рекомендациях пишем тут и только тут.
Старый тред по традиции тонет, а значит, открываем новый. Реквесты за пределами этого треда будут удаляться. Личная графомания отправляется в /izd/.
FAQ раздела здесь
Книги скачивать здесь: Флибуста
Поиск похожего по жанру: Фантлаб
Англоязычная литература:
libgen.io
Аудиокниги качайте здесь: http://abook-club.ru/
Книги по IRC: https://encyclopediadramatica.se/Bookz
Электронные книги обсуждаем тут >>489664

Аналоги IMDB для книг:

https://www.livelib.ru/
https://bookmix.ru/
https://fantlab.ru/
https://www.goodreads.com/

Официальная конфа раздела в Телеграме - @ru2chbo

Пропущено 284 постов
284 с картинками.
Пропущено 489 постов, 284 с картинками.
дора Аноним 08/06/21 Втр 14:40:58 177940
0
0
195Кб, 1170x2080
1170x2080
Аноним 08/12/23 Птн 01:21:10 206653
0
0
Ооаоа
Аноним 14/01/24 Вск 13:40:58 207690
0
0
20240114.mp4 17123Кб, 1920x1080, 00:00:21
1920x1080
Аноним 29/02/24 Чтв 13:27:23 209812
0
0
test
Аноним 01/03/24 Птн 15:47:49 209826
0
0
Hwh
TEST /TESTTESTTEST/ Шо-то про сало и test 02/07/17 Вск 12:29:18 31029
8
5
Ответ
GNpH5LvMWdU.jpg 34Кб, 480x343
480x343
[h1] Заголовок [/h1]
Заголовок
Полужирный текст Полужирный текст
Подчеркнутый текст Подчеркнутый текст
Курсив Курсив
[strike] Зачеркнутый текст [/strike] Зачеркнутый текст
Скрытый текст
(Автор этого поста был забанен. Помянем.)
Пропущено 43 постов
43 с картинками.
Пропущено 638 постов, 43 с картинками.
Аноним 27/02/24 Втр 16:51:40 209762
0
0
test
Аноним 27/02/24 Втр 17:04:19 209763
0
0
Test
Аноним 28/02/24 Срд 01:27:07 209779
0
0
Аноним 28/02/24 Срд 14:06:53 209796
0
0
test
Аноним 28/02/24 Срд 21:51:21 209798
0
0
Аватарки и точка. Точка блин! НЕОЧАТЪ!!11 КАПИБАРА Аноним 06/07/22 Срд 16:46:01 190150
1
3
Ответ
image.png 917Кб, 591x839
591x839
image.png 5618Кб, 1920x1080
1920x1080
16570973134761.webm 986Кб, 720x480, 00:00:25
720x480
Аватарки и точка. Точка блин!

НЕОЧАТЪ!!11

КАПИБАРА КАПИБАРА 61!

Ха, а вот и ФРАЗА ДЛЯ АВТОСКРЫТИ НИИИИИТ ХАХАХА так вот, ФРАЗА ДЛЯ НИИИИИИИИТ, так вот, ФРАЗА ДЛЯ АВТОСКРКРКРК ХИ-ХИ-ХИ-ХИ. Ну что? Ставить? Ляяяядно, воть, фдаг. Ой, т.е фдок. Т.е фдак ладно. фраза для автоскрытия


Номер раз, номер два и חשבת שאני לא סנייה? לא, אני לא. いいえ、でも何ですか? なんてクソな偽物

А так это аватаркочатик, что вышел из утробы лисы, хай.

He he he he jag är här я есть мы я есть сеня
Пропущено 14 постов
14 с картинками.
Пропущено 121 постов, 14 с картинками.
Ад !ojH4fvcju. 08/02/24 Чтв 18:08:26 208384
1
0
170740486632611[...].jpg 200Кб, 1000x1000
1000x1000
Y
Аноним 13/02/24 Втр 19:33:48 208567
0
0
Младший, позвони по номеру 8-800-2000-122
Аноним 13/02/24 Втр 21:13:48 208570
0
0
Ага, иди нахуй
Аноним 16/02/24 Птн 21:57:11 208662
0
0
Не звони тогда.
25/02/24 Вск 08:30:53 209718
0
0
тест
shlyapa Аноним 10/04/17 Пнд 06:24:58 22514
1
2
Ответ
oekaki.png 8Кб, 400x400
400x400
И так, начнем
Пропущено 33 постов
33 с картинками.
Пропущено 410 постов, 33 с картинками.
Аноним 13/02/24 Втр 17:34:24 208564
0
0
test
Аноним 13/02/24 Втр 18:08:11 208565
0
0
Ты не можешь ответить на три простых вопроса.
Аноним 13/02/24 Втр 18:18:18 208566
0
0
test
Аноним 13/02/24 Втр 20:29:20 208568
0
0
test
Аноним 13/02/24 Втр 21:12:15 208569
0
0
Шаблон шапки nai-треда Аноним 20/03/23 Пнд 05:08:02 197487
3
0
Ответ
.png 1151Кб, 3365x1953
3365x1953
Генерируем тяночек!
Прошлый >> https://arhivach.top/

схожие тематические треды
- технотред >>
- SD-тред (фотореализм) >>
- тред в /fur/ https://2ch.hk/fur/res/270356.html

Генерируем локально (нужна карта NVIDIA и хотя-бы 4гб врам, больше - лучше)
https://github.com/EmpireMediaScience/A1111-Web-UI-Installer - установщик для ленивых
https://rentry.org/nai-speedrun - гайд по установке из репозитория + бонус Аска-тест (проверка, что всё работает как надо)
https://teletype.in/@stablediffusion/PC_install_SD - гайд по установке на русском

Генерируем в облаках (на мощностях гугла, есть лимиты)
https://teletype.in/@stablediffusion/Colab_StableDiffusion

Как составлять промпт (запрос)
https://teletype.in/@stablediffusion/artists_for_prompts - гайд по составлению промта

Пример промта для модели Anything3 (подходит так же для всех моделей на её базе, напр. OrangeMix)
Promt:
>masterpiece, best quality, 1girl, solo, small breasts, flat chest, green eyes, green hair, lips, looking at viewer, sitting in park
Bad promt:
>lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

Не забывай смотреть на рекомендации к составлению промптов для своей модели.

Где искать наборы тегов
https://rentry.org/NAIwildcards
https://danbooru.donmai.us/wiki_pages/tag_groups
https://civitai.com (выбери фильтрацию по Wildcards)

Глоссарий для турбоимбецилов
https://rentry.org/ddpg2

Оптимизации для слабых ПК
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Optimizations
https://rentry.org/voldy#-running-on-4gb-and-under-

Оптимизации для современных ПК
https://rentry.org/sd_performance - мастхев для владельцев 40XX поколения; для 20XX-30XX прирост производительности менее существенен

Негативные ембеддинги
✶ BadHands https://huggingface.co/yesyeahvh/bad-hands-5/tree/main
✶ BadPrompt https://huggingface.co/datasets/Nerfgun3/bad_prompt/tree/main
✶ EasyNegative https://huggingface.co/datasets/gsdf/EasyNegative/tree/main
(последние два необязательно сделают картинку лучше, но на стиль повлияют)

Популярные модельки
Аниме:
✶ AnythingV4.5 https://huggingface.co/andite/anything-v4.0/tree/main
✶ MeinaMix https://civitai.com/models/7240/meinamix
✶ Counterfeit https://civitai.com/models/4468/counterfeit-v25

Старые аниме-модели (это не означает, что они плохие):
✶ AnythingV3 https://huggingface.co/Linaqruf/anything-v3.0/tree/main
✶ any222trinart https://huggingface.co/MindB1ast/any222trinart/tree/main

Хентай (подходит и для SFW):
✶ AOM3 https://civitai.com/models/9942/abyssorangemix3-aom3
✶ Mandarine https://civitai.com/models/3521/mandarine
✶ Grapefruit https://civitai.com/models/2583/grapefruit-hentai-model

Старые хентай-модели:
✶ AOM2NSFW https://civitai.com/models/4449/abyssorangemix2-nsfw
✶ AOM2HARD https://civitai.com/models/4451/abyssorangemix2-hardcore

Реализм:
✶ AOM3 https://civitai.com/models/9942/abyssorangemix3-aom3
✶ SunshineMix https://civitai.com/models/9291/sunshinemixsunlightmix

Стилизованные:
✶ PastelMix https://civitai.com/?query=PastelMix
✶ AnyPastel https://civitai.com/models/15024/anypastel-anything-v45-pastel-mix
✶ MeinaPastel https://civitai.com/models/11866/meinapastel

Где искать модели
https://civitai.com - чекпоинты, ембеддинги, лоры, позы для ControlNet, вайлдкарды и прочее
https://huggingface.co/models?other=stable-diffusion - чекпоинты и ембеддинги

Как получить хороший результат
https://rentry.org/sd__upscale - Очень подробный гайд по апскейлу от анона
https://rentry.org/SD_upscale - ещё один гайд по апскейлу в Automatic
https://rentry.org/sdgoldmine - Много ссылок. База данных по сбору и генерации контента (промпты, модели, обучение etc)

Обучаем модель своим персонажам
https://rentry.org/2chAI_easy_LORA_guide - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_LoRA_Dreambooth_guide - ещё один гайд по использованию и обучению LoRA

⚠️Перекат оформляется после 1000 поста
Шаблон для переката https://rentry.org/nwhci
Пропущено 4 постов
4 с картинками.
Пропущено 19 постов, 4 с картинками.
Аноним 13/07/23 Чтв 15:11:20 201900
0
0
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем
Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>#############

➤ GUI для обучения

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts
https://github.com/anon-1337/LoRA-train-GUI

➤ Обучение SDXL

Если вы используете скрипты https://github.com/kohya-ss/sd-scripts напрямую, то, для обучения SDXL, вам необходимо переключиться на ветку "sdxl" и обновить зависимости. Эта операция может привести к проблемам совместимости, так что, желательно, делать отдельную установку для обучения SDXL и используовать отдельную venv-среду. Скрипты для тренировки SDXL имеют в имени файла префикс sdxl_.

Подробнее про обучение SDXL через kohya-ss можно почитать тут: https://github.com/kohya-ss/sd-scripts/tree/sdxl#about-sdxl-training

Для GUI https://github.com/bmaltais/kohya_ss и https://github.com/derrian-distro/LoRA_Easy_Training_Scripts/tree/SDXL так же вышли обновления, позволяющее делать файнтьюны для SDXL. Кроме полноценного файнтьюна и обучения лор, для bmaltais/kohya_ss так же доступны пресеты для обучения LoRA/LoHa/LoKr, в том числе и для SDXL, требующие больше VRAM.

Всё пока сырое и имеет проблемы с совместимостью, только для самых нетерпеливых. Требования к системе для обучения SDXL выше, чем для обучения SD 1.x.

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

Текстуальная инверсия (Textual inversion) может подойти, если сеть уже умеет рисовать что-то похожее:
https://rentry.org/textard (англ.)

Гиперсеть (Hypernetwork) может подойти, если она этого делать не умеет; позволяет добавить более существенные изменения в существующую модель, но тренируется медленнее:
https://rentry.org/hypernetwork4dumdums (англ.)

Dreambooth – выбор 24 Гб VRAM-бояр. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://github.com/nitrosocke/dreambooth-training-guide (англ.)

LoRA – "легковесный Dreambooth" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением:
https://rentry.org/2chAI_easy_LORA_guide - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_LoRA_Dreambooth_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - это проект по созданию алгоритма для более эффективного дообучения SD. Ранее носил название LoCon. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr и DyLoRA:
https://github.com/KohakuBlueleaf/LyCORIS

LoCon (LoRA for Convolution layer) - тренирует дополнительные слои в UNet. Теоретически должен давать лучший результат тренировки по сравнению с LoRA, меньше вероятность перетренировки и большая вариативность при генерации. Тренируется примерно в два раза медленнее чистой LoRA, требует меньший параметр network_dim, поэтому размер выходного файла меньше.

LoHa (LoRA with Hadamard Product representation) - тренировка с использованием алгоритма произведения Адамара. Теоретически должен давать лучший результат при тренировках с датасетом в котором будет и персонаж и стилистика одновременно.

LoKr (LoRA with Kronecker product representation) - тренировка с использованием алгоритма произведения Кронекера. Алгоритм довольно чувствителен к learning_rate, так что требуется его тонкая подгонка. Из плюсов - очень маленький размер выходного файла (auto factor: 900~2500KB), из минусов - слабая переносимость между моделями.

DyLoRA (Dynamic Search-Free LoRA) - по сути та же LoRA, только теперь в выходном файле размер ранга (network_dim) не фиксирован максимальным, а может принимать кратные промежуточные значения. После обучения на выходе будет один многоранговый файл модели, который можно разбить на отдельные одноранговые. Количество рангов указывается параметром --network_args "unit=x", т.е. допустим если network_dim=128, network_args "unit=4", то в выходном файле будут ранги 32,64,96,128. По заявлению разработчиков алгоритма, обучение одного многорангового файла в 4-7 раз быстрее, чем учить их по отдельности.

Text-to-image fine-tuning для Nvidia A100/Tesla V100-бояр:
https://keras.io/examples/generative/finetune_stable_diffusion (англ.)

Бонус. ✱ Text-to-image fine-tuning для 24 Гб VRAM:
https://rentry.org/informal-training-guide (англ.)

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA [1] https://colab.research.google.com/github/Linaqruf/kohya-trainer/blob/main/kohya-trainer.ipynb
﹡LoRA [2] https://colab.research.google.com/drive/1bFX0pZczeApeFadrz1AdOb5TDdet2U0Z

➤ Полезное

Гайд по фиксу сломанных моделей: https://rentry.org/clipfix (англ.)
Расширение WebUI для проверки "сломаных" тензоров модели: https://github.com/iiiytn1k/sd-webui-check-tensors
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Ручная сборка и установка последней версии xformers и torch в venv автоматика:
Windows: https://rentry.org/sd_performance
Linux: https://rentry.org/SD_torch2_linux_guide

Подборка мокрописек от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
Коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/gayshit/makesomefuckingporn

Шапка: https://rentry.org/catb8
Аноним 13/07/23 Чтв 21:02:53 201915
0
0
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем
Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>#############

➤ Софт для обучения

https://github.com/kohya-ss/sd-scripts
Набор скриптов для тренировки, используется под капотом в большей части готовых GUI и прочих скриптах.
Для удобства запуска можно использовать дополнительные скрипты в целях передачи параметров, например: https://rentry.org/simple_kohya_ss

➤ GUI-обёртки для kohya-ss

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts
https://github.com/anon-1337/LoRA-train-GUI

➤ Обучение SDXL

Если вы используете скрипты https://github.com/kohya-ss/sd-scripts напрямую, то, для обучения SDXL, вам необходимо переключиться на ветку "sdxl" и обновить зависимости. Эта операция может привести к проблемам совместимости, так что, желательно, делать отдельную установку для обучения SDXL и используовать отдельную venv-среду. Скрипты для тренировки SDXL имеют в имени файла префикс sdxl_.

Подробнее про обучение SDXL через kohya-ss можно почитать тут: https://github.com/kohya-ss/sd-scripts/tree/sdxl#about-sdxl-training

Для GUI https://github.com/bmaltais/kohya_ss и https://github.com/derrian-distro/LoRA_Easy_Training_Scripts/tree/SDXL так же вышли обновления, позволяющее делать файнтьюны для SDXL. Кроме полноценного файнтьюна и обучения лор, для bmaltais/kohya_ss так же доступны пресеты для обучения LoRA/LoHa/LoKr, в том числе и для SDXL, требующие больше VRAM.

Всё пока сырое и имеет проблемы с совместимостью, только для самых нетерпеливых. Требования к системе для обучения SDXL выше, чем для обучения SD 1.x.

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

Текстуальная инверсия (Textual inversion) может подойти, если сеть уже умеет рисовать что-то похожее:
https://rentry.org/textard (англ.)

Гиперсеть (Hypernetwork) может подойти, если она этого делать не умеет; позволяет добавить более существенные изменения в существующую модель, но тренируется медленнее:
https://rentry.org/hypernetwork4dumdums (англ.)

Dreambooth – выбор 24 Гб VRAM-бояр. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://github.com/nitrosocke/dreambooth-training-guide (англ.)

LoRA – "легковесный Dreambooth" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением:
https://rentry.org/2chAI_easy_LORA_guide - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_LoRA_Dreambooth_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - это проект по созданию алгоритма для более эффективного дообучения SD. Ранее носил название LoCon. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr и DyLoRA:
https://github.com/KohakuBlueleaf/LyCORIS

LoCon (LoRA for Convolution layer) - тренирует дополнительные слои в UNet. Теоретически должен давать лучший результат тренировки по сравнению с LoRA, меньше вероятность перетренировки и большая вариативность при генерации. Тренируется примерно в два раза медленнее чистой LoRA, требует меньший параметр network_dim, поэтому размер выходного файла меньше.

LoHa (LoRA with Hadamard Product representation) - тренировка с использованием алгоритма произведения Адамара. Теоретически должен давать лучший результат при тренировках с датасетом в котором будет и персонаж и стилистика одновременно.

LoKr (LoRA with Kronecker product representation) - тренировка с использованием алгоритма произведения Кронекера. Алгоритм довольно чувствителен к learning_rate, так что требуется его тонкая подгонка. Из плюсов - очень маленький размер выходного файла (auto factor: 900~2500KB), из минусов - слабая переносимость между моделями.

DyLoRA (Dynamic Search-Free LoRA) - по сути та же LoRA, только теперь в выходном файле размер ранга (network_dim) не фиксирован максимальным, а может принимать кратные промежуточные значения. После обучения на выходе будет один многоранговый файл модели, который можно разбить на отдельные одноранговые. Количество рангов указывается параметром --network_args "unit=x", т.е. допустим если network_dim=128, network_args "unit=4", то в выходном файле будут ранги 32,64,96,128. По заявлению разработчиков алгоритма, обучение одного многорангового файла в 4-7 раз быстрее, чем учить их по отдельности.

Text-to-image fine-tuning для Nvidia A100/Tesla V100-бояр:
https://keras.io/examples/generative/finetune_stable_diffusion (англ.)

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA [1] https://colab.research.google.com/github/Linaqruf/kohya-trainer/blob/main/kohya-trainer.ipynb
﹡LoRA [2] https://colab.research.google.com/drive/1bFX0pZczeApeFadrz1AdOb5TDdet2U0Z

➤ Полезное

Гайд по фиксу сломанных моделей: https://rentry.org/clipfix (англ.)
Расширение WebUI для проверки "сломаных" тензоров модели: https://github.com/iiiytn1k/sd-webui-check-tensors
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Ручная сборка и установка последней версии xformers и torch в venv автоматика:
Windows: https://rentry.org/sd_performance
Linux: https://rentry.org/SD_torch2_linux_guide

Подборка мокрописек от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
Коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/gayshit/makesomefuckingporn

Шапка: https://rentry.org/catb8

Прошлые треды:
№1 https://arhivach.top/thread/859827/
№2 https://arhivach.top/thread/860317/
№3 https://arhivach.top/thread/861387/
№4 https://arhivach.top/thread/863252/
№5 https://arhivach.top/thread/863834/
№6 https://arhivach.top/thread/864377/
№7 https://arhivach.top/thread/868143/
№8 https://arhivach.top/thread/873010/
№9 https://arhivach.top/thread/878287/
№10 https://arhivach.top/thread/893334/
Аноним 31/07/23 Пнд 03:09:03 202421
0
0
test
Аноним 18/01/24 Чтв 23:59:38 207813
0
0
Аноним 19/01/24 Птн 14:27:26 207823
0
0
Test
Тред для тестов монархии в диктатуре. Аноним 22/05/23 Пнд 15:43:50 200230
3
0
Ответ
Крутой актер.jpg 2394Кб, 3000x2000
3000x2000
Тред для тестов монархии в диктатуре.
Пропущено 21 постов
21 с картинками.
Пропущено 115 постов, 21 с картинками.
Аноним 03/02/24 Суб 14:39:54 208228
0
0
ga
Аноним 03/02/24 Суб 16:04:14 208234
0
0
testnopass1.png 4681Кб, 2560x1802
2560x1802
Аноним 04/02/24 Вск 11:55:27 208262
0
0
test
Аноним 04/02/24 Вск 20:49:07 208264
0
0
test
Аноним 05/02/24 Пнд 23:55:04 208309
0
0
test
Попытка создать тестовый тред в &#47;test&#47;. Аноним 09/07/22 Суб 20:39:13 190243
0
3
Ответ
.jpg 98Кб, 960x1280
960x1280
Попытка создать тестовый тред в /test/.

Пропущено 20 постов
20 с картинками.
Пропущено 136 постов, 20 с картинками.
Аноним 29/01/24 Пнд 20:47:24 208095
0
0
Аноним 29/01/24 Пнд 20:51:17 208097
0
0
t
Аноним 01/02/24 Чтв 09:40:35 208152
0
0
Аноним 01/02/24 Чтв 09:58:11 208153
0
0
image.png 1Кб, 454x326
454x326
Аноним 01/02/24 Чтв 11:15:25 208156
0
0
test Аноним 25/11/22 Птн 22:53:49 194938
0
0
Ответ
bandicam 2022-1[...].mp4 1341Кб, 0x0, 00:00:03
0x0
1.mp4 10783Кб, 0x0, 00:00:34
0x0
bandicam 2022-1[...].mp4 6781Кб, 400x300, 00:00:39
400x300
test
Пропущено 5 постов
5 с картинками.
Пропущено 16 постов, 5 с картинками.
19/01/24 Птн 16:06:31 207825
0
0
test
Аноним 19/01/24 Птн 18:32:56 207831
0
0
Elk.mp4 11081Кб, 1920x1080, 00:00:24
1920x1080
Аноним 19/01/24 Птн 18:36:54 207832
0
0
test
Аноним 19/01/24 Птн 21:54:14 207833
0
0
Test
Аноним 21/01/24 Вск 08:23:25 207876
0
0
test
тест Аноним 29/11/22 Втр 08:21:45 195132
0
3
Ответ
image.png 16Кб, 270x120
270x120
рабсияния
Пропущено 10 постов
10 с картинками.
Пропущено 126 постов, 10 с картинками.
Аноним 15/01/24 Пнд 21:30:28 207728
0
0
Сама же твичшлюха сначала крутила жопой в камеру и лизала микрофон https://www.youtube.com/watch?v=xwTnXUE-e_k, а к приходу карликов переобулась няшей-стешняшей, но это не смутило нашего шейха-симпа. Скрытие теневых, пиздёж и манипуляции богатым симпом прилагаются. Также с ней была ещё одна мутная история про наёб гоя симпа иностранца на примерно 300 тыщ рублей. Вот его телега в которой он всё рассказывает https://t.me/HiPieByeLie. Твичшлюха в свойственной ей манере отрицает свою причастность к объёбу и сваливает всё на своего бывшего которого она скрывала.
Аноним 15/01/24 Пнд 22:19:33 207729
0
0
test
Аноним 15/01/24 Пнд 22:35:25 207730
0
0
test
Аноним 15/01/24 Пнд 22:56:28 207731
0
0
Аноним 16/01/24 Втр 15:04:35 207749
0
0
Test
333 1 16/03/23 Чтв 16:23:08 197436
2
1
Ответ
167821239316771[...].webp 139Кб, 700x1249
700x1249

Пионер! Ты находишься в разделе, посвященному визуальной новелле "Бесконечное лето". В этом треде ты можешь задать интересующие тебя вопросы касательно новеллы и всего, что к ней относится, а также изучить раздел с помощью навигационных элементов.

Правила доски и ответы на часто-задаваемые вопросы ты можешь найти здесь.

Модпочта для предложений: ruvn@2ch.hk

Пропущено 16 постов
16 с картинками.
Пропущено 132 постов, 16 с картинками.
09/01/24 Втр 19:49:54 207565
0
0
2.jpg 4Кб, 100x150
100x150
4.jpg 7Кб, 100x150
100x150
8.jpg 5Кб, 100x150
100x150
0.jpg 9Кб, 100x150
100x150
Аноним 09/01/24 Втр 19:58:04 207567
0
0
1111111111
Аноним 09/01/24 Втр 21:32:48 207571
0
0
test
Аноним 09/01/24 Втр 22:33:21 207572
0
0
3r
Аноним 10/01/24 Срд 02:38:20 207576
0
0
V
Subjectttt Аноним 29/11/22 Втр 01:59:58 195062
0
0
Ответ
16689669816250.jpg 213Кб, 597x803
597x803
Пропущено 6 постов
6 с картинками.
Пропущено 50 постов, 6 с картинками.
Аноним 03/01/24 Срд 08:28:54 207370
0
0
Аноним 03/01/24 Срд 08:29:26 207371
0
0
Аноним 03/01/24 Срд 08:29:49 207372
0
0
03/01/24 Срд 20:56:05 207383
0
0
MaiWaifu200.webm 1952Кб, 1920x1080, 00:00:02
1920x1080
03/01/24 Срд 22:27:48 207384
0
0
Test
afdafasd /fadf/ # OP 03/08/22 Срд 16:03:25 190953
0
4
Ответ
image 48Кб, 329x329
329x329
Пропущено 14 постов
14 с картинками.
Пропущено 166 постов, 14 с картинками.
Аноним 29/10/23 Вск 17:15:49 205213
0
0
test
Аноним 29/11/23 Срд 20:37:17 206363
0
0
test
Аноним 02/01/24 Втр 05:22:30 207323
0
0
123
Аноним 02/01/24 Втр 05:23:36 207324
0
0
123
Аноним 02/01/24 Втр 07:11:00 207326
0
0
5
Test Аноним # OP 09/10/22 Вск 20:59:50 193633
3
2
Ответ

AI генератор композиций прямо из текста

https://app.suno.ai генерация на сайте

https://suno.ai/discord генерация на официальном discord-сервере

Suno представила свою новую модель текста в песню, Chirp v1. Эта модель способна генерировать музыку, включая вокал, на основе стиля и текста песни. Одним из наиболее значимых улучшений является возможность конвертации различных жанров, таких как рок, поп, K-pop, а также описаний типа “мелодичный” или “быстрый” в музыку.

“Текст песни теперь можно разбить на части с помощью команд вроде [verse] и [chorus], что придает сгенерированным песням больше структуры.”

Генерировать можно как просто описывая нужный стиль и суть(на русском генерирует с переменным успехом), либо через custom - полностью контролируя текст.

Как получить от Суно законченную песню с нужной вам структурой:

1. Старайтесь соблюдать размер в стихах. Если ваш текст сложно петь, получится речитатив независимо от жанра. Если вы сделаете в припеве и куплете разные размеры, то Суно будет проще придумать между ними переходы. Между соседними куплетами вставляйте пустую строку, получится пауза.

2. Ударения в словах можно выделять большой буквой, вот так: "ПоросЯтам". Когда это не работает, измените само слово: вместо "прямЫ" напишите "примЫ". Иногда помогает разбить слово на две части, вместо "элЕктрогенератор" написать "элЕктро генерАтор".

Есть мнение, что расстановка ударений большими буквами работает лучше, если не начинать предложения с больших букв.

Ещё есть онла́йн се́рвисы по расстано́вке ударе́ний как в э́том предложе́нии, но хз, наско́лько хорошо́ суно э́то понима́ет.

3. В круглых скобках можно добавлять бэк-вокал. Неплохо работают звуки типа (О-о-о, у-у-у-у).

4. Размечайте песню тегами. Точно работают: [Verse], [Chorus], [Bridge], [Solo]. Русские тоже работают. К Соло иногда можно добавлять конкретику, например [Piano solo], но это может изменить инструменты всей песни. [Coda] помогает сделать концовку. С переменным успехом у меня работали [Calm] и [Aggressive]. Надо экспериментировать с другими тегами в квадратных скобках.

5. Иногда можно кастомизировать жанр, добавляя слова типа Energetic, Rhythmic, Aggressive, Slow, Fast. Обязательно пишите With Female/Male vocals, чтобы избежать инструментала и указать пол певца (тоже не всегда срабатывает). Разработчики не рекомендуют смешивать разные жанры.

6. Максимальный размер одной генерации 1:20. Когда вам понравился кусок, выбирайте меню с тремя точками и пункт "Continue fom this clip". В тексте оставьте только те строки, которые не влезли в прошлый фрагмент, и нажимайте Generate. Так можно делать несколько раз, например у вас может быть три-четыре таких последовательных фрагмента. В самом конце в меню выбирайте пункт "Get Whole Song" и песня склеится из всех фрагментов.

К сожалению нельзя перегенерировать только кусок песни, поменяв что-то локально в тексте..

7. Чтобы вручную нарезать трек из нагенеренного черновика и/или добавить свое видео используйте стороннее ПО или онлайн сервисы, например clipchamp

8. Максимум бесплатных кредитов 50 в день, этого хватает на 5 генераций, в каждой генерации дается по два варианта трека. Кредиты не копятся, т.е. если скипнуть несколько дней, больше 50 все равно не будет. Если хочется больше, надо либо оформлять подписку за деньги, либо регать каждый раз новый аккаунт (при регистрации дается полторы сотни, емнип). При подписке также увеличивается количество вариантов трека.

Пропущено 12 постов
12 с картинками.
Пропущено 114 постов, 12 с картинками.
Аноним 11/12/23 Пнд 21:42:27 206757
0
0
235252 3 3.png 4Кб, 46x257
46x257
Аноним 11/12/23 Пнд 22:18:15 206759
0
0
Аноним 20/12/23 Срд 09:57:53 206947
0
0
1703026391744 r[...].jpg 94Кб, 800x800
800x800
1703026391744 r[...].jpg 94Кб, 800x800
800x800
1703026391744.jpg 717Кб, 800x800
800x800
1703026391744 16.jpg 171Кб, 800x800
800x800
Аноним 20/12/23 Срд 09:59:25 206948
0
0
test
22/12/23 Птн 05:06:55 207002
0
0
TEST
Test
test Аноним 23/03/23 Чтв 19:04:07 197555
2
5
Ответ
file.jpg 25Кб, 465x587
465x587

Здравствуй, друг. Здесь ты можешь задать интересующие тебя вопросы, выговориться и получить поддержку от анонов, посетовать на мужские проблемы.

Добро пожаловать домой, брат.

FAQ раздела (прочесть обязательно во избежание однотипных вопросов).

Инцелошизе и троллям тут не рады. Свои "идеи" оставляйте в /sex/ или /b/.
МД/МГ и прочие ЛГБТ+ представители - в /ga/.
Мизандрия и желание пособирать внимание - в /dev/.
Порно - в порнотреде.
Фембои (временно) и калотарки - в загонотреде.
Биопроблемы (всё, что касается отношений) - бесконечный биопроблемный. Не плодите отдельные треды, если нет крайней необходимости.
Жизненные проблемы, просто желание выговориться - бар "Два чая".
Вопросы по разделу, предложения по улучшению раздела - этот тред.
Задать вопрос олдам из /old/ - тут.
Пропущено 5 постов
5 с картинками.
Пропущено 52 постов, 5 с картинками.
Аноним 24/11/23 Птн 21:04:00 206157
0
0
asd
Аноним 26/11/23 Вск 06:52:24 206198
0
0
Test 2
Аноним 26/11/23 Вск 08:11:26 206199
0
0
test
Аноним 26/11/23 Вск 09:26:33 206200
0
0
Test
Аноним 26/11/23 Вск 10:05:18 206201
0
0
Test
Чисто тест Нанон 17/12/16 Суб 08:13:21 6599
2
3
Ответ
0beb7cd8-4da6-4[...].png 632Кб, 640x360
640x360
Test
Пропущено 98 постов
98 с картинками.
Пропущено 593 постов, 98 с картинками.
Аноним 11/11/23 Суб 16:59:16 205634
0
0
Аноним 11/11/23 Суб 17:14:37 205635
0
0
test
Аноним 11/11/23 Суб 18:35:44 205636
0
0
test
Аноним 12/11/23 Вск 13:39:14 205707
0
0
test
Аноним 12/11/23 Вск 14:48:13 205711
0
0
Аноним 18/06/17 Вск 10:27:59 29699
3
4
Ответ
Persona5PoemWit[...].webm 17706Кб, 1280x720
1280x720
Пропущено 4 постов
4 с картинками.
Пропущено 45 постов, 4 с картинками.
Аноним 28/10/23 Суб 16:53:27 205183
0
0
unknown2023.10.[...].mp4 5594Кб, 1600x900, 00:00:04
1600x900
Аноним 28/10/23 Суб 17:27:21 205184
0
0
P0YRgvZT0l4.heic 369Кб, 1814x1754
1814x1754
Аноним 29/10/23 Вск 19:15:07 205216
0
0
Аноним 05/11/23 Вск 08:02:05 205417
0
0
Аноним 05/11/23 Вск 08:57:00 205418
0
0
test
[b]тест[/b] Аноним 05/05/17 Птн 14:47:07 25296
5
4
Ответ

(Автор этого поста был забанен. Помянем.)
Пропущено 6 постов
6 с картинками.
Пропущено 40 постов, 6 с картинками.
Аноним 15/10/23 Вск 22:54:22 204820
0
0
out.mkv 39225Кб, 1920x1080, 00:01:34
1920x1080
Аноним 15/10/23 Вск 23:20:43 204821
0
0
test
Аноним 16/10/23 Пнд 01:06:25 204822
0
0
test
Аноним 16/10/23 Пнд 16:37:41 204829
0
0
test
Аноним 16/10/23 Пнд 16:56:43 204830
0
0
test test
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
X
Ваш шидевор X
Стикеры X
Избранное / Топ тредов