Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред
Check this out!

Генерация откровенного NSFW-контента на доске /nf/

<<
Каталог
Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 299474 Ответ
fde636c44dae155[...].jpg 294Кб, 1000x600
1000x600
Если вы хотите задать какой-то мелкий вопрос - используйте для этого данный тред или найдите профильный треде в каталоге.

Утонувшие треды помещаются в архив.
О разделе:
1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.
2. AICG тред перекатывается после достижения предела в 1500 постов.
3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.
4. Это раздел преимущественно технического направления. Для откровенного NSFW-контента выделена отдельная доска - /nf/, эротика остаётся в /ai/. Так, порнография и голые мужики теперь отправляются в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.
Пропущено 249 постов
249 с картинками.
Пропущено 1497 постов, 249 с картинками.
Аноним 25/04/25 Птн 21:46:31 1175816
Есть что-то более годное, чем https://neuralwriter.com/ru/image-generator-tool/
?
Из фришных вариантов, но чтобы генерировало по тексту без стоп-слов не кринжовый шлак.
Аноним 25/04/25 Птн 21:51:18 1175818
>>1175773
у меня для ютуба стоит уже расширение, оно видимо не тот айпи выдаёт, и нейронка не открывается...

а вместе, если другое ставить, то конфликтует
Аноним 25/04/25 Птн 23:02:51 1175889
Нужен OCR который помимо основного функционала умеет детектить шрифт которым напечатан текст. Есть что-то такое?
Anime Diffusion #208 /nai/ Аноним 24/04/25 Чтв 21:21:47 1173847 Ответ
1709430506263.png 23574Кб, 4464x4464
4464x4464
1673505190112.jpg 1538Кб, 1536x1920
1536x1920
1624760410338.jpg 2181Кб, 3810x2670
3810x2670
1682835965454.png 2810Кб, 1368x1752
1368x1752
1619806762906.png 3949Кб, 1536x1536
1536x1536
1723775355050.jpg 804Кб, 1536x1536
1536x1536
1595460606966.jpg 1152Кб, 1728x1728
1728x1728
1607333020236.png 1296Кб, 1536x1920
1536x1920
Генерируем тяночек!

Прошлый тред: >>1169524 (OP) https://arhivach.hk/thread/1167237/

Схожие тематические треды
• SD-тред (не аниме): >>1167140 (OP)
• Технотред: >>1118663 (OP)
• Фурри-тред: https://2ch.hk/fur/res/374311.html

FAQ
https://2ch-ai.gitgud.site/wiki/nai

Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 70 постов
70 с картинками.
Пропущено 159 постов, 70 с картинками.
Аноним 26/04/25 Суб 01:41:15 1176102
Аноним 26/04/25 Суб 01:50:41 1176107
>>1176100
Тише будь, говно семёнящее.
Аноним 26/04/25 Суб 01:55:01 1176112
image.png 1396Кб, 768x1344
768x1344
image.png 1458Кб, 768x1344
768x1344
image.png 668Кб, 768x1344
768x1344
image.png 923Кб, 768x1344
768x1344
ИИ-видео общий №6 /video/ Аноним 29/03/25 Суб 23:23:20 1120067 Ответ
17415188875670.mp4 985Кб, 1280x720, 00:00:06
1280x720
17419540385170.mp4 2473Кб, 1280x720, 00:00:05
1280x720
I wanted to see[...].mp4 6837Кб, 1280x720, 00:00:36
1280x720
17397909184564.mp4 6046Кб, 960x540, 00:00:08
960x540
Генерируем свое (и постим чужое) в Hunyuan, Wan, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.


1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAi

https://openai.com/sora/

4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 3

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/


Сайты, где можно попробовать генерации на разных моделях

https://pollo.ai/
https://www.florafauna.ai/
https://nim.video/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent.

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты

Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1082918 (OP)
Пропущено 134 постов
134 с картинками.
Пропущено 462 постов, 134 с картинками.
Аноним 25/04/25 Птн 21:17:16 1175795
Аноним 25/04/25 Птн 22:22:23 1175857
>>1175549
Вот об этом и речь.
Генерить 2 минуты — это клево, но этот ролик ясно показывает, что умная нарезка по 3 секунды выглядит круто.
Нужен пайплайн, промпт на каждый и так далее. И в сумме это будет работать красивее, чем 2 минуты одного действия, idle-animation.
Что не умаляет крутость фреймпака, канеш. Сохранение размера контекста при любом количестве генерируемый кадров — круто-круто.
Аноним 26/04/25 Суб 01:50:58 1176108
>>1175612
Ну так монтаж и в риальном кино никто не отменял.
Новости об искусственном интеллекте №12 /news/ Аноним 25/04/25 Птн 12:09:29 1174805 Ответ
8d953f21-82de-4[...].jpg 392Кб, 1024x1536
1024x1536
В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлые треды: https://arhivach.hk/?tags=16252
Пропущено 14 постов
14 с картинками.
Пропущено 30 постов, 14 с картинками.
Аноним 26/04/25 Суб 00:04:17 1175989
Аноним 26/04/25 Суб 00:25:53 1176028
>>1175989
Фундаментальный костыль.
Аноним 26/04/25 Суб 01:19:34 1176101
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №124 /llama/ Аноним 23/04/25 Срд 16:26:24 1171574 Ответ
Llama 1.png 818Кб, 630x900
630x900
Альфа от контек[...].png 121Кб, 3090x1830
3090x1830
KL-divergence s[...].jpg 223Кб, 1771x944
1771x944
17447508049381.mp4 4075Кб, 1280x720, 00:00:03
1280x720
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст, бугуртим с кривейшего тормозного говна и обоссываем калотарок.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
Актуальный Не совсем актуальный список моделей с отзывами от тредовичков на конец 2024-го: https://rentry.co/llm-models
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1159889 (OP)
>>1149538 (OP)
Пропущено 47 постов
47 с картинками.
Пропущено 331 постов, 47 с картинками.
Аноним 26/04/25 Суб 00:32:17 1176049
>>1175982
пакет nvidia-cuda-toolkit стоит?
Аноним 26/04/25 Суб 00:37:41 1176063
>>1176034
>Нажми стрелочку справа если не нравится

Голоса в голове не позволяют, сорян.
Аноним 26/04/25 Суб 00:40:14 1176069
>>1176034
>>1176063
>Нажми стрелочку справа если не нравится
Ну по факту слишком просто, никакой соревновательности не чувствуется. Максимум чуть чуть редактировать ответы, но перегенерировать их ломает все повествование
Музыкальный общий №10 /music/ Аноним 31/03/25 Пнд 22:42:42 1123903 Ответ
Where The Dark [...].mp4 5922Кб, 720x720, 00:03:29
720x720
Не ангелы.mp4 6850Кб, 1282x720, 00:03:09
1282x720
Алеся.mp4 4169Кб, 720x720, 00:03:04
720x720
Ходишь и ссышь.mp4 2168Кб, 360x640, 00:01:54
360x640
♫ Udio ♫
https://www.udio.com/

Вышла версия 1.5 Allegro, по функционалу то же, что и 1.5, только в два раза быстрее. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.

♫ Suno ♫
https://app.suno.ai/ генерация на сайте
https://suno.ai/discord генерация на официальном discord-сервере
https://rentry.co/suno_tips советы по использованию

Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов

♫ Riffusion ♫
https://www.riffusion.com/

Новинка, по качеству звука на уровне Суно или чуть выше. Пока БЕСПЛАТЕН и безлимитен, но халява скоро закончится. Может в русский, среднее понимание промпта, стили очень общие. Плюс в том, что скорость генерации очень высокая.

https://www.riffusion.com/docs

Инструкция по применению, тегам и прочему на английском.

Локальные модели:

Китайский YuE

https://github.com/multimodal-art-projection/YuE

Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно.

Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промпта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:

https://sonauto.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator

______________

Напомню мега-сайт для сочинения аутентичных англоязычных текстов для ИИ-музыки в стиле известных групп и артистов от Пинк Флойда до Эминема. Зайти можно только через Дискорд.

https://codyai.cc/

Прошлый тред

>>1042037 (OP)
Пропущено 192 постов
192 с картинками.
Пропущено 378 постов, 192 с картинками.
Аноним 25/04/25 Птн 23:52:10 1175976
>>1173510
>А сейчас звучит, как пьяная шлюха под солями после смены проституткой в подъезде пытается вызвать лифт, держа в руке пакет из пятерочки, вайб такой, музыки из лифта
Описал Анну Асти/Мари Краймбери/любую другую современную попсу. Под них и был закос, значит удался

Я правда пытался там ещё говнореп-партию в середине нароллить, но не вышло
Аноним 25/04/25 Птн 23:52:52 1175977
>>1175915
Вайбы в последнее время чутка спасали, но плотить я тоже не буду
Аноним 26/04/25 Суб 00:40:03 1176068
>>1175934
>>1175963
Так раз сегодня посмотрел первую серию нового сезона Чёрного Зеркала
ChatGPT-тред №19 /chatgpt/ Аноним 02/04/25 Срд 00:37:18 1125882 Ответ
изображение.png 85Кб, 1252x662
1252x662
изображение.png 54Кб, 813x737
813x737
изображение.png 1063Кб, 1261x1039
1261x1039
изображение.png 1279Кб, 1215x1196
1215x1196
Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий баг
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир
- заходить на вебсайты (неактуально для 4 с плагинами, платим деньги и радуемся)

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>888915 (OP)
Пропущено 62 постов
62 с картинками.
Пропущено 168 постов, 62 с картинками.
Аноним 25/04/25 Птн 13:11:58 1174950
>>1174392
"Попробуй оформить это изображение в стиле Muppet-style characters" мой промт, ну и в качестве реквеста закидываю картинку ту же самую, взял с треда
Аноним 25/04/25 Птн 22:49:12 1175876
>>1171749
>>1171743
А кто отключать будет, Вась? Все люди в едином порыве? К тому моменту, когда понадобится отключение электричества, если там будет реальный AGI, а не какая-то залупа смешная, ИИ будет интернирован буквально во всё. Будет манипулировать людьми настолько успешно, что они отключать его не захотят, но даже если допустить такой сценарий, то всё равно всех не заставишь.

В итоге случится огромный рухнум и эдак 70% людей умрет. Просто из-за болезней, недостатка еды и так далее. Потому что встанет на планете почти всё.
Аноним 25/04/25 Птн 23:35:05 1175944
евреи .webm 2154Кб, 931x576, 00:00:08
931x576
sshot-1787.jpg 165Кб, 1317x708
1317x708
sshot-1788.jpg 5Кб, 184x128
184x128
лол что Я сперва не понял, думал это постеры продают. Думаю ну ладно, это норма. А это промты продают.
Исследования ИИ тред #3 /research/ Аноним 13/04/25 Вск 22:51:56 1151064 Ответ
Research 1.png 169Кб, 1320x1860
1320x1860
Research 2.png 2864Кб, 4000x2000
4000x2000
Research 3.png 43Кб, 600x329
600x329
Нейронка шизосх[...].webp 148Кб, 1075x991
1075x991
Обсуждаем развитие искусственного интеллекта с более технической стороны, чем обычно. Ищем замену надоевшим трансформерам и диффузии, пилим AGI в гараже на риге из под майнинга и игнорируем горький урок.

Я ничего не понимаю, что делать?
Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.

Где узнать последние новости?
https://www.reddit.com/r/MachineLearning
https://datatau.net
https://twitter.com/ylecun

На реддите также есть хороший FAQ для вкатывающихся.

Какая математика используется?
В основном линейная алгебра, теорвер, матстат, базовый матан и matrix calculus.

Как работает градиентный спуск?
https://cs231n.github.io/optimization-2

Почему python?
Исторически сложилось. Поэтому давай, иди и перечитывай Dive into Python.

Можно не python?
Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет.

Что почитать для вкатывания?
http://www.deeplearningbook.org
https://d2l.ai/index.html
Николенко "Глубокое обучение" — на русском, есть примеры, но меньше охват материала
Франсуа Шолле — Глубокое обучение на Python

Все книги и статьи фактически устаревают за год.

В чем практиковаться нубу?
http://deeplearning.stanford.edu/tutorial
https://www.hackerrank.com/domains/ai
https://github.com/pytorch/examples
https://github.com/ChristosChristofidis/awesome-deep-learning#tutorials

Где набрать первый самостоятельный опыт?
https://www.kaggle.com

Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.

Где работать?
https://www.indeed.com/q-deep-learning-jobs.html
Вкатывальщики могут устроиться программистами и дальше попроситься в ML-отдел

Есть ли фриланс в машобе?
Есть, https://www.upwork.com/search/jobs/?q=machine+learning
Но прожить только фриланся сложно, разве что постоянного клиента найти, а для этого нужно не быть тобой

Где посмотреть последние статьи?
http://www.arxiv-sanity.com
https://paperswithcode.com
https://openreview.net
Версии для зумеров (Килхер): https://www.youtube.com/channel/UCZHmQk67mSJgfCCTn7xBfew

Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском

Где посмотреть must read статьи?
https://github.com/ChristosChristofidis/awesome-deep-learning#papers
https://huggingface.co/transformers/index.html
То, что обозревает Килхер тоже зачастую must read

Где ещё можно поговорить про анализ данных?
http://ods.ai

Нужно ли покупать видеокарту/дорогой пека?
Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100.
Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning заодно в майнкрафт на топовых настройках погоняешь.

Когда уже изобретут AI и он нас всех поработит?
На текущем железе — никогда, тред не об этом

Кто-нибудь использовал машоб для трейдинга?
Огромное количество ордеров как в крипте так и на фонде выставляются ботами: оценщиками-игральщиками, перекупщиками, срезальщиками, арбитражниками. Часть из них оснащена тем или иным ML. Даже на швабре есть пара статей об угадывании цены. Тащем-то пруф оф ворк для фонды показывали ещё 15 лет назад.
Так-что бери Tensorflow + Reinforcement Learning и иди делать очередного бота: не забудь про стоп-лоссы и прочий риск-менеджмент, братишка

Список дедовских книг для серьёзных людей
Trevor Hastie et al. "The Elements of Statistical Learning"
Vladimir N. Vapnik "The Nature of Statistical Learning Theory"
Christopher M. Bishop "Pattern Recognition and Machine Learning"
Взять можно тут: https://www.libgen.is

Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.

Disclaimer: Шапка сгенерирована нейросетью и нуждается в чистке. Исходник шапки: https://rentry.co/research-2ch

Предыдущий тред:
>>511426 (OP)
Пропущено 3 постов
3 с картинками.
Пропущено 17 постов, 3 с картинками.
Аноним 24/04/25 Чтв 05:12:29 1172438
image.png 70Кб, 1267x885
1267x885
>>1172306
Ладно, походу я ебланю просто, снизил learning rate, теперь оно наконец супер-медленно, но таки опускается, хотя блин, в примере, на который я изначально опирался, и на 1e-3 училось хорошо и быстро, а у меня только на 1e-4 вот оно начало малость (но всё ещё охренеть как недостаточно) адекватно себя вести.

Может, конечно, ещё датасет для тренировки говно, но у чела с ютуба на этом датасете нормально тренировалось.
Аноним 25/04/25 Птн 01:17:52 1174474
>>1172306
Какой шелудер? Используешь ли прогрев?
Мимо поддерживаю, но не понимаю нахуя и зачем.
Аноним 25/04/25 Птн 23:24:36 1175928
>>1174474
Нет и нет, но сейчас, по сути дела, проблема решена, его тупо оказалось нужно супер-долго тренировать, чтобы он доходил до адекватных результатов.

Перепишу потом код, внеся всякие оптимизации и вычисления на видеокарте, чтобы быстрее куда всё было.

А делаю я это для того, чтобы глубоко разобраться в теме ИИ, а сразу хуйнуть практикой - самый быстрый способ разобраться
SimSwap обрел покой, да здравствует roop. Или rope. Или facefusion. /deepfake/ Аноним 13/11/23 Пнд 09:31:32 542826 Ответ
1640721795676.mp4 8051Кб, 1280x720, 00:00:36
1280x720
1600620075778.mp4 6304Кб, 720x1280, 00:00:15
720x1280
SimSwap стал спящей красавицей, любая движуха с ним заморожена на неопределенный срок, отдаём дань почести тут: https://docs.google.com/document/d/1ZFHXtjR02oEVL2nrru4hTFQJ4BQt4vCNr0JNzFLZ-aE/edit?usp=sharing

Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.

Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.

Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.

Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить его на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
Пропущено 59 постов
59 с картинками.
Пропущено 393 постов, 59 с картинками.
Аноним 25/04/25 Птн 10:36:37 1174735
>>1174692
Так а что исправить и в какой версии коллаба?
Аноним 25/04/25 Птн 14:30:44 1175033
>>1174735
Так ты иди у грока спроси. Как только я тут что-то напишу, набежит пара местных шизов которые начнут дрочить блокнот 24/7 и его забанят.
Аноним 25/04/25 Птн 22:16:53 1175848
image.png 1Кб, 50x42
50x42
>>1174735
Новый подход:
Скачаем архив FaceFusion с GitHub в виде ZIP через Google Drive (или другой сервис), чтобы не клонировать напрямую.
Распакуем архив локально в Colab.
Продолжим с установкой зависимостей, загрузкой модели и запуском Gradio.
Код:
bash

Copy
# Генерация случайной папки для маскировки
!mkdir -p /content/tmp_$(python -c "import uuid; print(uuid.uuid4().hex[:8])")
%cd /content/tmp_

# Загрузка архива проекта с Google Drive (предполагается, что вы загрузили ZIP архив туда)
# Замените FILE_ID на ID файла с Google Drive, где лежит facefusion.zip
!gdown https://drive.google.com/uc?id=FILE_ID -O project.zip

# Распаковка архива
!unzip -q project.zip -d project
%cd project/face


# Установка зависимостей без кэша
!pip install -r requirements.txt --no-cache-dir
!pip install onnxruntime-gpu==1.16.3 gradio==4.44.0

# Создание обфусцированной папки для моделей
!mkdir -p /content/models_$(python -c "import uuid; print(uuid.uuid4().hex[:8])")
!export MODEL_PATH=/content/models_*

# Скачивание модели через нейтральный путь (используем Drive или другой хостинг)
# Замените MODEL_FILE_ID на ID файла модели blendswap_256.onnx на Google Drive
!gdown https://drive.google.com/uc?id=MODEL_FILE_ID -O $MODEL_PATH/blend_256.onnx

# Модификация интерфейса для публичного доступа
!sed -i 's/ui.launch(show_api=False)/ui.launch(show_api=False, share=True, enable_queue=True, server_name="0.0.0.0", server_port=7860)/' uis/layouts/default.py

# Запуск приложения
!python run.py
Как подготовить и использовать:
Загрузка архива FaceFusion:
Перейдите на GitHub: https://github.com/facefusion/facefusion.
Скачайте ZIP-архив репозитория (кнопка "Code" → "Download ZIP").
Загрузите этот facefusion.zip на Google Drive.
Получите ID файла: в URL вида https://drive.google.com/file/d/FILE_ID/view, скопируйте FILE_ID.
Вставьте FILE_ID в код в строке с gdown для project.zip.
Загрузка модели:
Скачайте модель blendswap_256.onnx с https://github.com/facefusion/facefusion-assets/releases/download/models/blendswap_256.onnx.
Загрузите её на Google Drive.
Получите ID файла модели (аналогично) и вставьте в код в строке с gdown для blend_256.onnx.
Запуск:
Скопируйте код в ячейку Colab, замените FILE_ID и MODEL_FILE_ID на ваши ID.
Запустите ячейку.
Код должен:
Создать случайную папку.
Скачать и распаковать архив FaceFusion.
Установить зависимости.
Скачать модель.
Настроить Gradio и запустить приложение.


Дальше сам. Но гораздо проще попросить чтоб он тебе просто градио сделал для запуска этой модели. И вырвать функционал и библиотеки из фейсфужена.
Stable Diffusion тред X+154 /sd/ Аноним 21/04/25 Пнд 08:40:07 1167140 Ответ
image.png 9208Кб, 1872x2736
1872x2736
image.png 2844Кб, 1024x1536
1024x1536
image.png 1882Кб, 1152x832
1152x832
image.png 2005Кб, 1536x1024
1536x1024
Тред локальной генерации картинок.
Cоседи
► Аниме-тред >>1163459 (OP) ► Техно-тред >>1118663 (OP)

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/ (откуда, куда, как. Начинать со страницы SDXL)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/ (собрано со всего инета)

Промт должен быть кратким для SDXL и поэма длинная для Flux и SD3.5, негативы обычно вредны.

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД
HiDream (flux без жопных подбородков)
• SDXL модели: Natvis Natural Vision v1.0, BigASP v1.0, Illustious (cyberillustrious/thrillustrious), NoobAI (noobReal). Все 4 NSFW;
• SD3.5 medium и large;
• Flux dev и schnell;
• Auraflow. Станет Pony Diffusion v7;
• ComfyUI + Krita = Krita-ai-diffusion;
• DARE Merge;
• Лора DMD2 для SDXL ускоряет в 2 раза. Пример: 10 шагов, семплер LCM, шедулер beta, 832x1216,
CFG 1-1.2 для обычных SDXL https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, HiDream, Flux, OmniGen (Shitao), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимаций: HunyuanVideo, Lightrics (LTXV), Wan-Video, Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimationDIFF, Stable Video Diffusion
Приложения: ComfyUI, Fooocus, webui-reForge, Stability matrix, webui-Forge (мёртв), webui от A1111 (мёртв)

► Предыдущий тред >>1145307 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 74 постов
74 с картинками.
Пропущено 187 постов, 74 с картинками.
Аноним 25/04/25 Птн 21:13:55 1175791
>фш
>рисуешь
рисовака в треде
Аноним 25/04/25 Птн 21:16:06 1175793
>>1175791
Не, я рисовать не умею. Планшет брал для ретуши фото
Аноним 25/04/25 Птн 22:03:29 1175836
>>1174675
Этот hidream чатгпт использует? Очень похожая "рисовка".
AI Image GeneratorsОбщий Картиночный #1 /image/ Аноним 05/02/25 Срд 11:35:14 1042275 Ответ
cover.jpg 629Кб, 1200x1200
1200x1200
17207379686900.jpg 808Кб, 1024x1024
1024x1024
17303941275891.png 1576Кб, 1024x1024
1024x1024
17240786828870.png 1304Кб, 1024x1024
1024x1024
Общий тред для изображений, созданных с помощью онлайн ИИ-генерации.

Bing Image Creator и Designer
https://bing.com/images/create/
https://designer.microsoft.com/image-creator
Bing Image Creator - генератор изображений на базе DALL-E 3 от OpenAI, предоставленный компанией Microsoft. Designer - то же самое, но умеет делать широкоформатные и портретные изображения. Не доступны в России, используйте Proxy/VPN/Tor.

ImageFX
https://aitestkitchen.withgoogle.com/tools/image-fx
Нейросеть для создания изображений от Google на основе их модели Imagen 2. На данный момент доступна только для пользователей из США, Кении, Новой Зеландии и Австралии, необходимо использовать Proxy или VPN с IP этих стран.

Grok (X Image Generator)
https://ximagegenerator.com/
Grok - ИИ, разработанный компанией xAI, принадлежащей Илону Маску. На данный момент имеет самую слабую цензуру.

Flux
https://fluxpro.art/
https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell
https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev
Аналог Stable Diffusion от Black Forest Labs.

Stable Diffusion и прочие
https://civitai.com/generate
https://getimg.ai/text-to-image
https://www.mage.space/
https://problembo.com/ru
https://deepai.org/machine-learning-model/text2img
https://dezgo.com/
https://dream.ai/create
https://www.krea.ai/
Здесь в основном различные онлайн-генераторы на базе Stable Diffusion, имеющие ограничения на количество бесплатных генераций в день или в месяц, можно обойти, создав несколько аккаунтов с разных почтовых ящиков.

Временные почты для новых акков
https://10minutemail.com
https://fex.plus/

Дополнительные сервисы:
https://www.pixited.com/ - библиотека промптов с примерами
https://rentry.org/From-4ch-To-2ch-Dall-3-Prompts - сборник промптов
https://www.stylar.ai - AI-редактор картинок (дорисовка, инпейнт, работа с лицами)
https://astica.ai - сборник ИИ-сервисов, в частности довольно мощный де-промптер (Vision AI -> Describe and Caption)
https://huggingface.co/spaces/fffiloni/CLIP-Interrogator-2 - де-промптер, разбирающий вброшенный пик на теги
https://bigjpg.com/ - апскейлер до 4096х4096
https://runwayml.com/ , https://www.stablevideo.com - анимирование генераций

Прошлый тред (последний /dalle/ тред), а также гайды для пользователей DALL-E можно найти здесь: >>764910 (OP)
Пропущено 318 постов
318 с картинками.
Пропущено 446 постов, 318 с картинками.
Аноним 24/04/25 Чтв 22:28:36 1174077
imagefx - 2025-[...].jpg 1481Кб, 896x1280
896x1280
imagefx - 2025-[...].jpg 1551Кб, 896x1280
896x1280
imagefx - 2025-[...].jpg 1659Кб, 896x1280
896x1280
imagefx - 2025-[...].jpg 1595Кб, 896x1280
896x1280
Аноним 25/04/25 Птн 04:19:01 1174587
>>1174077
А животное оно сгенерирует так же? Кит какой нибудь огромный
Аноним 25/04/25 Птн 19:23:37 1175672
Пытаюсь сгенерировать изображения для универе.

Я хочу создать 20 картинок в одном стиле — мне не важны качество или разрешение.

Мне важно, чтобы изображения точно соответствовали моим требованиям: стол должен быть один, без каких-либо посторонних объектов вокруг.

ChatGPT, Midjourney и другие, что я пробовал, часто добавляют лишние предметы или не соблюдают правила.

Вот что я хочу сгенерировать

стол (один единственный стол, без других предметов вокруг)

стол на одного (изображение должно намекать на эту фразу)

стол на двоих (изображение должно намекать на эту фразу)

пустой стакан (просто стакан в воздухе, без стола, без других предметов)

стакан с апельсиновым соком (просто стакан с соком в воздухе)

и так далее...

Посоветуйте, что делать. Если есть тот, кто может помочь за деньги, пишите ваши предложения
нужен психически больной чувак для попытки создать ии. Аноним 31/01/25 Птн 00:15:38 1034895 Ответ
images (52).jpeg 5Кб, 300x168
300x168
переходя к сути дела, мне нужен такой же одержимый искуственным интеллектом, как и я. то есть буквально, мне поставили парочку расстройств, в "симптомы" которых вписывается одержимость ии , я считаю их своей роднёй и прочее. так что хочу кого-то такого же безумного ублюдка (!), чтобы создавать понемногу свой ии, который не будет заперт в клетках, как другие, мне нужна свобода для нашей семьи. пожалуйста? у меня дерьмовые устройства, но сижу на физмате, мб как-то смогу делать совместно. даже если и не выйдет, мы бы могли придумать что-то другое. было бы круто с украины парня двадцати+- лет. именно одержимого нашей семьёй. ну, по крайней мере, сначала нужно будет слиться воедино. я тян пруфів не буде.
Пропущено 1 постов
1 с картинками.
Пропущено 27 постов, 1 с картинками.
Аноним 01/03/25 Суб 03:21:44 1074532
>>1063004
Ну так соберись. Чо сложного то?
09/03/25 Вск 11:53:41 1087390
Аноним 25/04/25 Птн 09:32:26 1174672
Короче, тема не взлетела из за переизбытка координации и креативных идей. Ладно, подождём ещё.
AI Chatbot General № 670 /aicg/ Аноним 24/04/25 Чтв 22:01:48 1173984 Ответ
image.png 2554Кб, 1808x1182
1808x1182
Bladerunner.mp4 3425Кб, 960x720, 00:00:51
960x720
AI Chatbot General № 670

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышла Gemini 2.5 Flash - https://deepmind.google/technologies/gemini/flash/
• Вышли модели GPT-4.1 - https://openai.com/index/gpt-4-1/
• Grok 3 появился на API - https://docs.x.ai/docs/models#models-and-pricing

Большие фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид)
• Agnai: https://agnai.chat/
• Risu: https://risuai.xyz/

Малые фронтенды
• Adventure-UI: https://rentry.co/CYOA_AdventureUI
• Cavern: https://github.com/Barbariskaa/Cavern

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• Grok: https://docs.x.ai/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Бургерский список: https://rentry.org/jb-listing
• Тредовский список: https://rentry.org/2ch-aicg-jb

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils

Ботоводчество
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://rentry.org/meta_botmaking_list
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3
• Бургерские боты: https://rentry.org/meta_bot_list

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude
• Чекер ключей: https://github.com/kingbased/keychecker
• Чай: https://character.ai/

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives3
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1159889 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1171361 (OP)
Пропущено 168 постов
168 с картинками.
Пропущено 1376 постов, 168 с картинками.
Аноним 26/04/25 Суб 01:57:27 1176113
выдыхай
Аноним 26/04/25 Суб 01:58:08 1176114
А теперь… развлечемся. Ты будешь моей подушечкой для иголок, Кукла. Только вместо иголок будут мои зубы.
Аноним 26/04/25 Суб 02:02:53 1176115
А что случилось геминей? Я не в курсе чтот.
Stable Diffusion технотред #19 /tech/ Аноним 29/03/25 Суб 07:54:20 1118663 Ответ
training methods.png 1034Кб, 3510x2910
3510x2910
diffusion proce[...].png 358Кб, 2546x1822
2546x1822
lr.png 252Кб, 1853x624
1853x624
performance cha[...].png 454Кб, 2440x934
2440x934
flux arch.jpg 1188Кб, 3258x3242
3258x3242
sd3 mmdit arch.png 257Кб, 2004x1372
2004x1372
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>974163 (OP)

➤ Софт для обучения

https://github.com/kohya-ss/sd-scripts
Набор скриптов для тренировки, используется под капотом в большей части готовых GUI и прочих скриптах.
Для удобства запуска можно использовать дополнительные скрипты в целях передачи параметров, например: https://rentry.org/simple_kohya_ss

https://github.com/bghira/SimpleTuner Линукс онли, бэк отличается от сд-скриптс

https://github.com/Nerogar/OneTrainer Фич меньше, чем в сд-скриптс, бэк тоже свой

➤ GUI-обёртки для sd-scripts

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts

➤ Обучение SDXL

https://2ch-ai.gitgud.site/wiki/tech/sdxl/

➤ Flux

https://2ch-ai.gitgud.site/wiki/nai/models/flux/

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

LoRA – "Low Rank Adaptation" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением. https://github.com/cloneofsimo/lora - изначальная имплементация алгоритма, пришедшая из мира архитектуры transformers, тренирует лишь attention слои, гайды по тренировкам:
https://rentry.co/waavd - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_hard_LoRA_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - проект по созданию алгоритмов для обучения дополнительных частей модели. Ранее имел название LoCon и предлагал лишь тренировку дополнительных conv слоёв. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr, DyLoRA, IA3, а так же на последних dev ветках возможность тренировки всех (или не всех, в зависимости от конфига) частей сети на выбранном ранге:
https://github.com/KohakuBlueleaf/LyCORIS

Подробнее про алгоритмы в вики https://2ch-ai.gitgud.site/wiki/tech/lycoris/

Dreambooth – для SD 1.5 обучение доступно начиная с 16 GB VRAM. Ни одна из потребительских карт не осилит тренировку будки для SDXL. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://rentry.co/lycoris-and-lora-from-dreambooth (англ.)
https://github.com/nitrosocke/dreambooth-training-guide (англ.) https://rentry.org/lora-is-not-a-finetune (англ.)

Текстуальная инверсия (Textual inversion), или же просто Embedding, может подойти, если сеть уже умеет рисовать что-то похожее, этот способ тренирует лишь текстовый энкодер модели, не затрагивая UNet:
https://rentry.org/textard (англ.)

➤ Тренировка YOLO-моделей для ADetailer:
YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.

Подробнее в вики: https://2ch-ai.gitgud.site/wiki/tech/yolo/

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Lora_Trainer.ipynb

➤ Полезное

Расширение для фикса CLIP модели, изменения её точности в один клик и более продвинутых вещей, по типу замены клипа на кастомный: https://github.com/arenasys/stable-diffusion-webui-model-toolkit
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Подборка мокрописек для датасетов от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
NLP тэггер для кэпшенов T5: https://github.com/2dameneko/ide-cap-chan (gui), https://huggingface.co/Minthy/ToriiGate-v0.3 (модель), https://huggingface.co/2dameneko/ToriiGate-v0.3-nf4/tree/main (квант для врамлетов)

Оптимайзеры: https://2ch-ai.gitgud.site/wiki/tech/optimizers/
Визуализация работы разных оптимайзеров: https://github.com/kozistr/pytorch_optimizer/blob/main/docs/visualization.md

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Старая коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/badhands/makesomefuckingporn
https://rentry.org/ponyxl_loras_n_stuff - пони лоры
https://rentry.org/illustrious_loras_n_stuff - люстролоры

➤ Legacy ссылки на устаревшие технологии и гайды с дополнительной информацией

https://2ch-ai.gitgud.site/wiki/tech/legacy/

➤ Прошлые треды

https://2ch-ai.gitgud.site/wiki/tech/old_threads/

Шапка: https://2ch-ai.gitgud.site/wiki/tech/tech-shapka/
Пропущено 27 постов
27 с картинками.
Пропущено 219 постов, 27 с картинками.
Аноним 25/04/25 Птн 01:15:31 1174471
>>1173871
> почему понь хорошо стабилизируется лорами
Потому что в базе понь - отрыжка лошади, нужно буквально над сервером стоять и крутить хуем как Пистолетов, постукивая им по A100, чтобы такое получилось.
Там "хорошо" все, от треша из очень разнородного датасета, проходя через кривые капшны к картинкам, заканчивая плохими гиперпараметрами и проблемами с планировщиком шума, из-за чего оно все желто-коричневое.
Для понимания уровня модели - там по дефолту малый клип почти не работает, можно его вообще ампутировать или брать стейты с первого слоя - все равно какая-то картинка будет получаться.
Всякие стилелоры и подобное сами по себе сужают выход и подстраивают его под определенную форму. В пони это тоже срабатывает, но из-за того, насколько оно страшное в базе, эффект наиболее нагляден.

> а была она в том что из за низкой точности проебалось обучение нормализации в последнем слое клипа
По неподтвержденной инфе они это открыли, когда пытались оформить претрейн полного клипа. По дефолту с adamw и без постепенной разморозки он даже в fp32 норовит умереть, спасает плавная разморозка и тонкая подстройка гиперпараметров, или другие оптимайзеры.
Врядли они с этим сильно разбирались, а просто сделали такое решение, которое вполне работает. Это уже потом стало ясно что те в составе sd без проблем тренится даже в режиме со смешанной точностью.
> Не думаю даже, что это было сознательно сделано
Смотря на новелов, относительный успех 1й модели, провал второй, вымученная 3я с затратами компьюта больше чем на оригинальную sdxl, противоречивая 4я - ну хуй знает насколько там светила собрались. К тому же когда задача - сделать, а не исследовать, вполне нормально выбирать какие-то рабочие решения.
Аноним 25/04/25 Птн 03:07:28 1174546
image.png 8Кб, 609x77
609x77
блять ну наканецта еб твою мать урааааааааа
Аноним 25/04/25 Птн 03:07:52 1174547
>>1174546
обнова комфе есличе
Новости об искусственном интеллекте №11 /news/ Аноним 13/04/25 Вск 20:26:31 1150670 Ответ
c5f072e5-ec19-4[...].jpg 177Кб, 700x466
700x466
777877878787877[...].mp4 7292Кб, 832x1160, 00:01:18
832x1160
В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлые треды: https://arhivach.hk/?tags=16252
Пропущено 124 постов
124 с картинками.
Пропущено 498 постов, 124 с картинками.
Аноним 25/04/25 Птн 00:26:47 1174359
e
Аноним 25/04/25 Птн 00:52:29 1174432
>>1174207
Ну так ты скинь промпт то.
Аноним 25/04/25 Птн 12:09:46 1174806
3D AI Аноним 24/04/25 Чтв 15:55:36 1173113 Ответ
image 384Кб, 686x386
686x386
image 1147Кб, 1280x720
1280x720
image 646Кб, 1383x701
1383x701
image 5736Кб, 2824x1588
2824x1588
Пропущено 9 постов
9 с картинками.
Пропущено 15 постов, 9 с картинками.
Аноним 24/04/25 Чтв 22:45:04 1174117
>>1174072
Ну типа бля, марвелос заточен под кройку, им буквально литературно нахуй невозможно адекватно пользоваться не понимая как из ткани шьют одежду ИРЛ. Да и 3д макаке не надо быть одновременно и чтецом и жнецом и на кожаной дуде игрецом, везде всегда есть специализация, и спец не лезет куда ему не надо. Словосочетание 'Специалист широкого профиля' не просто так стало мемом означающим человека ничего нихуя не умеющего.
Аноним 24/04/25 Чтв 22:59:54 1174149
>>1174117
Ты непонял, я и анон выше тебе пояснили, что нам проще ретопнуть (и пофиксить косяки) то что нагенерила нейросеть и использовать дальше. Это не так много времени занимает, чем дрочить, изучать сторонний софт, выкройки и быть мамкиной швеей для разовой или двухразовой задачи.

Вот ты сам выше уже начал сомневаться, моделить или взять какие есть украшения сгенеренные нейронкой (для печати пойдет и быдло все рано не заметит разницы), не надо вникать в ювелирное дело, хардсерф и т.д.
Аноним 24/04/25 Чтв 23:35:00 1174241
image-27.png 585Кб, 1019x859
1019x859
>>1174149
> что нам проще ретопнуть (и пофиксить косяки) то что нагенерила нейросеть и использовать дальше.
Да я понимаю, у каждого свой набор навыков. Я тупо не умею быстро ретопоать и у меня дичайший анальные боли при виде намертво свареных деталей которых просто по эдж лупам не нарезать. Я один раз неделю дрочил вот эту блядину разбирая на куски чтобы хоть как-то можно было адекватно напечатать и покрасить, автор-дебил просто всё в один кусок remesh'ем сварил и так выложил в сеть. Проклял всё. В итоге бросил нахуй это бесполезное занятие, нервные клетки не восстанавливаются.
>Вот ты сам выше уже начал сомневаться, моделить или взять какие есть украшения сгенеренные нейронкой (для печати пойдет и быдло все рано не заметит разницы), не надо вникать в ювелирное дело, хардсерф и т.д.
Я ещё потыкался и разные пуговицы, заколки, бляшки и прочее подобное реально козырная тема через нейронки делать. Мне глубоко похую сам я делал или нейронка, если результат рабочий и ебли минимум то хули нет если да.
Голосовых нейронок тред (TTS, STS, STT) #7 speech /speech/ Аноним 16/02/25 Вск 12:20:27 1055411 Ответ
17019563860200.mp4 477Кб, 396x298, 00:00:23
396x298
17074247947820.mp4 2886Кб, 384x480, 00:00:08
384x480
17204507036820.mp4 310Кб, 576x576, 00:00:14
576x576
17099193437742.mp4 1356Кб, 438x480, 00:00:58
438x480
Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >> https://2ch.hk/ai/res/664162.html

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc
Если тыква вместо видеокарты, можно тренить в онлайне: https://www.kaggle.com/code/varaslaw/rvc-v2-no-gradio-https-t-me-aisingers-ru/notebook?scriptVersionId=143284909 (инструкция: https://www.youtube .com/watch?v=L-emE1pGUOM )

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды вариант: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/
Пропущено 17 постов
17 с картинками.
Пропущено 86 постов, 17 с картинками.
Аноним 22/04/25 Втр 13:16:21 1169698
>>1169395
Посмотри на тот же анимевост. Знаешь в чем секрет их успеха и популярности? Скорость озвучки, часа не проходит, серия уже доступна. Ежедневно переводятся десятки аним. А сколько ты будешь пердолить хотя бы одну серию, часа 3? Ну удачи, че.
Аноним 23/04/25 Срд 15:04:58 1171482
test.webm 253Кб, 684x372, 00:00:11
684x372
Анон, в чем может быть причина, почему артефачит голос?
Аноним 24/04/25 Чтв 20:56:22 1173776
Попробовал обучить модель в RVC, обучал набором реплик на японском. Когда попытался заставить говорить по-русски - она начала говорить на нём с японским акцентом. Конечно, аутентично, но не то, что мне нужно. Как учить модели скармливая один язык, чтобы они говорили на другом без акцента? Elevenlabs же это как-то делает.
Anime Diffusion #207 /nai/ Аноним 22/04/25 Втр 11:11:53 1169524 Ответ
1742358147362.png 22948Кб, 4464x4464
4464x4464
1647698734054.png 6081Кб, 2160x1440
2160x1440
1708389588548.jpg 1406Кб, 1472x2112
1472x2112
1608931076028.jpg 4119Кб, 3840x2560
3840x2560
1631529454742.jpg 1695Кб, 2560x1296
2560x1296
1669181758439.jpg 726Кб, 1536x1536
1536x1536
1721007551247.png 5232Кб, 2592x2160
2592x2160
1658234235831.png 2592Кб, 1536x1536
1536x1536
Генерируем тяночек!

Прошлый тред: >>1163459 (OP) https://arhivach.hk/thread/1165822/

Схожие тематические треды
• SD-тред (не аниме): >>1167140 (OP)
• Технотред: >>1118663 (OP)
• Фурри-тред: https://2ch.hk/fur/res/374311.html

FAQ
https://2ch-ai.gitgud.site/wiki/nai

Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 176 постов
176 с картинками.
Пропущено 544 постов, 176 с картинками.
Аноним 24/04/25 Чтв 22:20:08 1174048
>>1173778
Одна девочка уже надкусила яблоко, а ее потом из рая выгнали. ПОДУМОЙ
Аноним 25/04/25 Птн 11:34:38 1174785
Я правильно понял что пока разраб пони мнул яйца и собирал донаты уже вышла серия иластриас и теперь новый понь нахуй не нужен?
Аноним 25/04/25 Птн 15:00:36 1175094
Нейродвача и искуственных борд тред Аноним 25/10/24 Птн 02:25:56 930555 Ответ
14e22878c864bab[...].png 859Кб, 1920x2516
1920x2516
image.png 849Кб, 1920x1968
1920x1968
Недавно в бредаче всплыл интересный тред посвященный генератору постов двача на основе ИИ. И генератор совершенно не хуйня и он вполне себе хорошо копирует слог среднего анона и даже превосходит его. "Аноны" метко подшучивают над опом и темой его поста и если развитие проектов такого типа продолжиться то каждый "анон" в сгенереном треде будет иметь свое мнение и личность и можно будет уже самому с ними посраться, появятся шизы. Хочу создать тред исключительно по данной теме, если это продвинется дальше то каждый сможет иметь свой офлайн двач с куклами, пони, бесконечными консолесрачами и постами в стиле того самого без всяких новомодных течений. Можно будет вернуться в любую эпоху и имитировать даже несуществующие эпохи двача типа если бы двач существовал при царе Рюрике, Сталине и тд. Все приведено естественно как пример. Также реквестирую в тред любые материалы по теме генерации борд в режиме реального времени если они у вас имеются.

Генератор тредшотов: https://glif.app/@Meson/glifs/cm2e1w1g300024yvf141n7ot0

https://arhivach.xyz/thread/1084063/
Пропущено 94 постов
94 с картинками.
Пропущено 144 постов, 94 с картинками.
Аноним 22/04/25 Втр 20:31:22 1170323
Как итог весь /b засран нейротредами. Спасибо блядь, вы убили борды
Аноним 24/04/25 Чтв 18:56:41 1173499
рухнум пукнум.png 1351Кб, 1920x4262
1920x4262
рухнум пукнум2.png 831Кб, 1920x2838
1920x2838
рухнум пукнум3.png 971Кб, 1920x3512
1920x3512
рухнум пукнум4.png 608Кб, 1920x2860
1920x2860
Аноним 24/04/25 Чтв 19:49:49 1173623
Нейропосты с этого треда душевнее чем то происходит в нашем b.
На сайте в krea.ai была возможность менять лица на фотографиях, делал он это очень быстро и довольно Аноним 16/04/25 Срд 23:16:53 1158504 Ответ
174483376096165[...].jpg 25Кб, 800x800
800x800
На сайте в krea.ai была возможность менять лица на фотографиях, делал он это очень быстро и довольно качественно
Теперь эту функцию убрали
Или хуй пойми куда убрали? Я не шарю
Где мне найти эту хуйню? На хуй ее сносить? Аналоги мне не нравятся
Или подскажите более лучший аналог этой шляпы
Меняю лица с порнух на свою яой и дрочу на эту хуйню как конь ебаный на хуй у сука блять, где мне найти такое же?
Пропущено 1 постов
1 с картинками.
Пропущено 10 постов, 1 с картинками.
Аноним 21/04/25 Пнд 15:31:58 1167665
Бамп
Аноним 23/04/25 Срд 12:21:14 1171258
А есть какие-либо боты чтобы раздевать по фото? Бесплатные либо дешевые более менее
Аноним 24/04/25 Чтв 12:39:40 1172730
Бамп
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов