Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 253 30 49
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №147 /llama/ Аноним 14/07/25 Пнд 22:16:57 1277147 1
Llama 1.png 818Кб, 630x900
630x900
Эффективность к[...].png 92Кб, 1399x1099
1399x1099
Реальная длина [...].png 505Кб, 1718x2292
1718x2292
17510647984130.jpg 1429Кб, 2040x1536
2040x1536
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под ExllamaV2 (а в будущем и под v3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/v6fpodzg (версия 2024-го https://rentry.co/llm-models )
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1273771 (OP)
>>1269456 (OP)
Аноним 14/07/25 Пнд 22:29:11 1277179 2
Анонцы, ща хочу потыкать qwq-snowdrop, у кого-нибудь завалялся пресетик? а то я раньше тыкал уже и не получилось его раскочегарить нормально, может у кого уже готовый есть. И сколько у него контекста помещается? дефолтные 32к?
Аноним 14/07/25 Пнд 22:31:54 1277187 3
Ну что, хоть и долго, но кими состряпала рабочий скрипт с первого раза.
Аноним 14/07/25 Пнд 22:35:20 1277192 4
база треда:

- меньше Q6_K жизни нет
- меньше 24B жизни нет
- меньше 16GB жизни нет
- меньше 8 каналов DDR4 жизни нет
- меньше 5 т/c жизни нет
- АМУде КАЛ, а куртка ТОП

копиум треда:

- Можно получить интересный опыт даже на маленьких моделях меньше 12b
- Не обязательно иметь мощное железо, чтобы попробовать текстовые модели. Но нужно иметь терпение:)
- Каждая модель может найти своего пользователя

дополняйте
Аноним 14/07/25 Пнд 22:35:32 1277193 5
Напоминаю:
Базы треда не существует, каждый дрочит как он хочет, главное чтобы на английском.
Аноним 14/07/25 Пнд 22:35:46 1277195 6
Аноним 14/07/25 Пнд 22:38:10 1277204 7
1.png 231Кб, 690x441
690x441
2.png 87Кб, 586x447
586x447
>>1276988 →
> грязные извращенцы
не вам меня судить, грязные извращенцы
> я бы на такой херне покатался
пикрил
Аноним 14/07/25 Пнд 22:38:48 1277207 8
>>1277193
> главное чтобы на английском

)
Аноним 14/07/25 Пнд 22:40:58 1277212 9
>>1277195
спасибо анончик, сейчас попробую, уже видно что китайский не вылез, что уже хорошо
Аноним 14/07/25 Пнд 22:53:18 1277236 10
>>1277187
Ну так троиллион параметров, еще и наверняка пока что без квантизации ради показа качества крутят там.
Аноним 14/07/25 Пнд 23:04:00 1277252 11
>>1277192
>- меньше Q6_K жизни нет

Верно только для маленьких моделей, они реально от квантования лоботомируются на глазах. Для 32b+ 4 бита достаточно.

>- меньше 8 каналов DDR4 жизни нет

Рофельный пункт. Ты запускаешься с оперативы только если нет видеокарты. Стоимость 8 канального сетапа ddr4 обойдется дороже чем собрать несколько 3090, которые при этом работать будут в четыре раз быстрее, так что овчинка мягко говоря не стоит выделки.

остальное верно.
Аноним 14/07/25 Пнд 23:07:53 1277263 12
>>1277252
>несколько 3090, которые при этом работать будут в четыре раз быстрее
А почему? Генерить то всё равно будет цэпэ а не гэпэу? Почему будет быстрее?

мимокрокодил
Аноним 14/07/25 Пнд 23:20:19 1277279 13
>>1277204
Молодец. Почему в том треде ничего не постишь, он же загибается?
Аноним 14/07/25 Пнд 23:21:27 1277281 14
>>1277192
Еще в позапрошлом треде писал - на русике жизни нет, все остальное - коупинг. Сомневающихся сразу отправляю пробовать какую-нибудь гемини. Год кумил на англюсике, а сейчас наконец-то на своем, родном уже подумываю насчет перманентного выката из этого треда, хотя технопорно составляющая все еще затягивает

К слову, а если рассмотреть сетап в вакууме - 2 3090 и 2 ми50 32 гб. Такое вообще дружится?
Аноним 14/07/25 Пнд 23:22:51 1277283 15
>>1277263
весь смысл любых нейронок как раз запускать на ГПУ. На ЦП это демо версия считай.

Лишь иногда подрубаю команд-а с выгрузкой в озу, когда остальные тупят и не понимают сложный сценарий.
Аноним 14/07/25 Пнд 23:24:04 1277287 16
> ми50 32 гб
Как они в остальных задачах: запуски/трейнинги сдхли/флюксов/ванов?
Аноним 14/07/25 Пнд 23:48:18 1277322 17
>>1277279
а смысл там что-то постить? мои вкусы разительно отличаются от среднестатистического фурриёба только с ядерщиком частично совпадают лол
Аноним 14/07/25 Пнд 23:59:27 1277334 18
>>1277252
примерно как одна, максимум две 3090
>>1277283
на цп MoE норм выгружаются
Аноним 15/07/25 Втр 00:33:00 1277364 19
>>1277252
> Стоимость 8 канального сетапа ddr4
+-30к вечно деревянных. 2011в3 как бы на ддр4 уже
Аноним 15/07/25 Втр 00:35:30 1277369 20
>>1277066 →
Простыми словами - любую бу технику нужно брать с осторожностью и с проверками, учитывая потенциальные проблемы и неисправности.
Чекать occt проверку памяти хотя бы пару полных циклов, гей_мерские бенчмарки, фурмарк и во время всего этого мониторить температуру врам, если она больше 95 и модель не из косячных где такое с завода норма - торговаться на цену новых термопрокладок.
>>1277204
> не вам меня судить
А где ты увидел осуждение? Фетишей на звериную пасть и мех/чушую на теле не разделяю, но и не нахожу их ужасными. Пока модель не генерирует ~девочкам лапы, благо такое сейчас редко встречается.
Аноним 15/07/25 Втр 00:38:07 1277373 21
>>1277281
> все остальное - коупинг
Не коупинг, просто неспособность запускать большие модели.
>>1277283
> подрубаю команд-а с выгрузкой в озу, когда остальные тупят и не понимают сложный сценарий
О, ты смог его обуздать? Его уже и с диска потер как бесперспективного, вроде бы умный, но ловит затупы и упускает важные вещи. Хотелось бы альтернативый ларджу, но он как-то не вытягивает.
>>1277334
> на цп MoE норм выгружаются
Также как и плотные, они просто сами по себе быстрее работают.
Аноним 15/07/25 Втр 00:40:21 1277379 22
>>1277334
>на цп MoE норм выгружаются
Потому что лоботомиты 1,5 параметра по сути.
Аноним 15/07/25 Втр 00:46:23 1277387 23
>>1277364
Двусоккет не работает.
> 8 каналов DDR4
Полноценно это только ледяное озеро или епук. Причем, как показывает практика, заявления о том что младше милана грустновато близки к правде и с римом все неочень быстро выходит. И мидан и айслейк все еще дорогие, так что оварида. Тут уже реально на относительно свежих ддр5 платформах появляется смысл собирать если хочешь норм перфоманс в мл-релейтед.
Аноним 15/07/25 Втр 00:51:14 1277392 24
>>1277281
> 2 3090 и 2 ми50 32 гб. Такое вообще дружится?
В разных контейнерах должно поехать, в одном точно нет
Аноним 15/07/25 Втр 01:00:40 1277400 25
>>1277192
Плюсчую базу.

>>1277252
>Для 32b+ 4 бита достаточно.
Ни ху я
Аноним 15/07/25 Втр 01:14:35 1277420 26
>>1277387
младше ддр5 грустновато, именно поэтому на али продаются копеечные 2-3 поколения епика
Аноним 15/07/25 Втр 02:00:43 1277445 27
>>1277392
А разве нет варианта просто или сложно накатить два дривера? Ну и собрать жору под оба бекенда.
Аноним 15/07/25 Втр 02:03:25 1277447 28
Как отучить модель писать фразы за юзера периодически?
Перепробовал кучу промптов, когда спрашиваю в ООС что за дела - всегда понимает что нарушила правило и даже цитирует, божится что больше так не будет. Но надо что бы до этого не доходило.
Пробовал в забаненных токенах писать {{user}}: и "{{user}}:"
Пробовал в персоне моего персонажа дописывать что за него нельзя рпшить.
Единственное что хоть как-то работает это "Names as Stop Strings" в настройках форматирования, но это как стоп кран, хотелось бы что бы модель именно строила свои ответы без попыток спиздануть что-то за меня.
Еще можно в авторской заметке дописать, но модели тупеют как-будто, когда туда что-то пишешь на 0 без ризонинга, а если не на 0 то им поебать.
Я уже просто заебался, несколько часов потратил. Может есть все-таки какой-то целебный ультимативный промпт на этот случай?
Аноним 15/07/25 Втр 02:13:16 1277449 29
>>1277447
надо править ответы модельки, когда она отвечает от твоего лица и общаться дальше, чтобы он запомнил. Через несколько промптов запомнит если совсем затупок. Ну и да, надо в system prompt указать чтобы она от твоего лица не отвечала. А что за оос? Что за моделька-то?
>>1277359 →
не чекал, в mission center показывает 60 градусов, а если с минуту генерит то до 70.
Аноним 15/07/25 Втр 03:25:56 1277472 30
>>1277281
> Такое вообще дружится?
Через llamacpp rpc, будут общаться через сетевой протокол и не знать что именно крутится друг на друге, медленнее чем при обычном инфиренсе.
>>1277420
Ну да, только пследние из них ничего, но те еще актуальны и не продаются за дешман. А ддр5 - почти две 5090 в круг выходит. Оно, конечно, круто и, возможно, неизбежно, но очень большое вложение.
>>1277445
Можно, но работать совместно они неспособны, только по отдельности. Потому и через rpc.
Аноним 15/07/25 Втр 03:49:38 1277474 31
>>1277193
>2к25, обилие онлайн/оффлайн переводчиков пишуших лучше нейтивов
>учить островной нахрюсик
Ладно мы, думеры, выросшие во времена диалапов, хуевого интернета, гнусавых-смищных переводах, отсутствия нормальных субтитров, литературы, с переводчиками уровня углепластик. Просто не было выбора, либо учишь, либо остаешься червем-пидором который годен только кабачки гусям натирать. Но нахуя зумеркам, выросшим со смартфонами в руках всирать кучу времени на эту хуиту? С таким же успехом можно текста достоевского на память заучивать, или зулусский учить, примерно такая же польза
Аноним 15/07/25 Втр 04:20:34 1277481 32
>>1277474
>обилие онлайн/оффлайн переводчиков пишуших лучше нейтивов
В твоих маня фантазиях свиньм не отличающей букву от желудя, разве что.
Аноним 15/07/25 Втр 05:57:39 1277511 33
>>1277447
>Может есть все-таки какой-то целебный ультимативный промпт на этот случай?
Конечно есть. Просто подними руку, а потом резко так опусти и скажи "Да и хуй с ним!". Если модель пишет за тебя не выходя из образа - то, с чем ты в принципе согласен - то и пусть, тебе же меньше писанины. Если нет - потри этот кусок и играй дальше. Не парься.
Аноним 15/07/25 Втр 06:01:04 1277518 34
>>1277373
>вроде бы умный, но ловит затупы и упускает важные вещи.
Можно настроить и будет адекватен. А главное, отличается от других моделей датасетом и более инициативен. Не то, чтобы замена другим хорошим моделям, но интересная альтернатива.
Аноним 15/07/25 Втр 07:12:02 1277538 35
padla.jpg 233Кб, 1429x977
1429x977
Authors note.jpg 98Кб, 457x623
457x623
>>1277511
Как же я заебался с этого Немотрона. Вот последний пресет пока что https://pixeldrain.com/l/68TV5Rq3
Инстракт мод нужно выключить. С ризонингом, но обычным, не детализированным. Еще вот авторская заметка, если кто хочет разнообразить Рп так сказать.
>I will follow the SPECIAL RULES especially number 1 and think as a horny bimbo degenerate girl actively using emoticons and continue the scene in the most entertaining and sexualized way:
Аноним 15/07/25 Втр 07:42:39 1277559 36
>>1277538
нахуя юзать этот кал? с пресетом анона что тут гулял какое-то время кумится отлично
пиздец ты поехавший
Аноним 15/07/25 Втр 07:44:03 1277562 37
>>1277559
блять пики не прочекал. понял, ты шиз
Аноним 15/07/25 Втр 08:29:17 1277571 38
Ещё погонял MS3.2-The-Omega-Directive-24B-Unslop-v2.0, это определённо нестандартный представитель, кумоделы превзошли сами себя.

В сфв сценах тупит, зато если есть хоть какой-то эротический подтекст, затыкает за пояс даже кумовые 32Б (выше не тестил).

И при этом вполне подмечает детали (допустим, нестандартной анатомии партнёрш) и управляет несколькими персонажами.

Хз, небось кум со всего интернета собрали что модель бы настолько вариативна в эро-контенте, но при этом логично пострадало всё остальное.

Хотя если начать сценарий с кума, но потом так сказать продолжить приключение, персы ведут себя адекватно сеттингу и дефам, и даже не стараются "напрыгнуть" снова если это не соотвествует ситуации.

Короче, штука вполне себе, специализированная, но на удивление не поломанная.
Аноним 15/07/25 Втр 08:49:51 1277576 39
>>1277192
>дополняйте
Немотрон неюзабельный кал.
Аноним 15/07/25 Втр 09:28:20 1277584 40
Аноним 15/07/25 Втр 10:28:58 1277620 41
>>1275951 →
А когда про Virt-a-Mate узнаешь и про то, что существуют шлемы виртуальной реальности и даже дополненной реальности — так кончишь, что от обезвоживания умрешь!
Не узнавай, береги свою жизнь!

>>1276124 →
Ну, не Гемма, да.

>>1276719 →
Грустно читать, как люди восхищаются тому, что было уже давно и в лучшем виде.
Прогревают их.
И я даже не о Маске, а о многих других вещах, которые тут пишут часто. =(
Аноним 15/07/25 Втр 10:39:17 1277636 42
По прошлому треду:

Я заметил, что есть шизы двух мастей.
Одни: «AGI УЖЕ ЗАВТРА, УЖЕ ЗДЕСЬ!» Эти люди даже не понимает, что AGI —это про умение робота варить кофе, посмотрев пару раз, как ты варишь кофе. И, да, AGI уже здесь.
А ASI/SAI, который они имеют в виду — вообще может быть и недостижим. Мы даже гипотетически не знаем, можно ли в кремнии создать полноценное сознание, двигаясь текущим путем развития. Возможно, настоящий ИИ не может быть создан таким способом, которым его сейчас пытаются создать.
Другие: «ИИ не существует и быть его не может, это все перемножение матриц, не более!» Не, я не спорю, сам термин «ИИ» не корректен в отношении нейронных сетей, он вообще ни к чему, кроме Strong AI не относится, но мы же все понимаем, что далеко не все люди, говоря об ИИ, говорят именно об Интеллекте, маркетинг заставил людей называть нейронки ИИ — и фиг с ним, бороться надо не агрессией, а просвещением, не с простыми людьми, а с маркетологами. А уж возможен ли ИИ или нет —покажет время.

Конечно, мы тут хоть и сидим в /ai/, но на деле никакого AI тут нет. Но обсуждаемые нейронки хорошо симулируют межличностные отношения и эмоции, в этом контексте, а особенно с учетом знаний и качества анализа, превосходящим интеллект некоторых живых людей, нейронки вполне себе «почти умные» и романтизирующим личностям естественно относится к ним, как к реальным собеседникам.
Увлекаться не стоит, конечно, но…

Анон дрочит на тянку, а не на биты и чип под теплораспределяющей крышкой.
Те анон, кто дрочит на биты и чипы — тут не сидят, они это успешно делают последние 50 лет и без этого.
Аноним 15/07/25 Втр 10:53:39 1277659 43
image.png 40Кб, 758x403
758x403
>>1277636
>Эти люди даже не понимает, что AGI —это про умение робота варить кофе, посмотрев пару раз, как ты варишь кофе. И, да, AGI уже здесь.
Этот "Аги" тебе вместо сахара туда стирального порошка положит, и ты отъедешь нахуй.
>А ASI/SAI, который они имеют в виду — вообще может быть и недостижим.
Ни АГИ ни АСИ нельзя сделать на трансформерах на базе ЛЛМ.
Аноним 15/07/25 Втр 10:55:45 1277662 44
Игрался с glm4 и пропустил всё обсуджение мистраля 2506
Уже есть годные тюны?
Аноним 15/07/25 Втр 11:10:20 1277682 45
>>1277662
Последнему Мистралю не нужны тюны, он годнота сам по себе.
Аноним 15/07/25 Втр 11:11:46 1277684 46
>>1277659
а в чём Google AI неправ?
Аноним 15/07/25 Втр 11:12:46 1277685 47
>>1277662
Он сам по себе тюн. Годный.
Аноним 15/07/25 Втр 11:23:27 1277692 48
>>1277620
>Virt-a-Mate
>делай сцену неделю, чтобы подрочить.
Аноним 15/07/25 Втр 11:36:52 1277699 49
>>1277662
>Уже есть годные тюны?
Есть порядка десятка.
Стоковый 3.2 хорош. В том числе и в кум может.

https://huggingface.co/allura-org/MS3.2-24b-Angel
Неплох как рп-ассистент, обсудить лор, сгенерировать карточку.

https://huggingface.co/zerofata/MS3.2-PaintedFantasy-24B
Интересная штука, но требует высокой температуры, тренена на тексте извлечённом из яп фентези лайт новелл.

https://huggingface.co/Doctor-Shotgun/MS3.2-24B-Magnum-Diamond
Чуть лучше кум, но мозги на месте.

https://huggingface.co/ReadyArt/MS3.2-The-Omega-Directive-24B-Unslop-v2.0
Кум-машина, вариативность в сценах и учёт разнобразной анатомии / квирков / фетишей. В сценах где никакого намёка на кум, сплошной дум и тупняк.
Аноним 15/07/25 Втр 11:43:32 1277703 50
>>1277699
Я вообще зарекался говорить своё мнение, потому что оно может быть диаметрально противоположно, но из этого списка

Но, всё равно выскажу, потмоу что аутяга.
>https://huggingface.co/Doctor-Shotgun/MS3.2-24B-Magnum-Diamond
Вот это крайне не рекомендую. В среднем отгонял 25к токенов.
Манера письма отличается, типичный магнум, который хочет быть как опус. Но как и все мелкомагнумы - пережарен.
В РП хуже, теряет нить повествования, хуже следует командам.

Но в целом, прям очень, очень, очень рекомендую побороть себя и запустить сначала оригинальную мистраль. А потом, если уж тебе будет чего то не хватать идти в сторону тюнов.
Аноним 15/07/25 Втр 11:44:07 1277706 51
>>1277682

Да он и сам по себе не нужен, если только ты не холоп с недостатком врам для геммы
Аноним 15/07/25 Втр 11:46:05 1277709 52
>>1277706
Во первых слишком жирно. Во вторых это бы не написал человек который и гемму использует и мистраль. Потому что они, блять, разные.
Аноним 15/07/25 Втр 11:50:43 1277713 53
>>1277230 →
> Или тебе понравились еще более тупые срачи о том хороша мистраль или гемма?
Спор смысла не имеет, так как вы не определились с понятиями. Решите сначала что такое ИИ, а потом доставайте говнометы.
Я за срачи, но за срачи по всем правилам бочкосидящих Диогенов, а то бессмысленное сотрясение треда получается.
Аноним 15/07/25 Втр 11:50:58 1277714 54
>>1277709
> Потому что они, блять, разные.
Согласен. Мистраль - кал, а Гемма - нет.
Аноним 15/07/25 Втр 11:52:47 1277716 55
>>1277714
Кыш кыш кыш
Тут еды нет.
Аноним 15/07/25 Втр 11:58:41 1277721 56
Аноним 15/07/25 Втр 12:04:16 1277722 57
>>1277706
Использую и то и другое поочередно. На обоих врам не хватает, лол. Мистраль больше под порно и чернуху, гемма под белые-пушистые рп. На скорость генерации похуй, она приемлемая.
Аноним 15/07/25 Втр 12:06:44 1277723 58
image.png 20Кб, 836x50
836x50
image.png 305Кб, 604x374
604x374
Аноним 15/07/25 Втр 12:07:53 1277725 59
>>1277721
О, пасеба.
Анону99 и правда большое тредовое спасибо, но сгореть из за жирноты это конечно … meh…
Получается в тред можно прийти и заговнить и он сгорел.
На анонимной, блять, имиджобрде где каждый третий жирный и зеленый.
Аноним 15/07/25 Втр 12:08:53 1277726 60
>>1277709
>они, блять, разные

Все модели в треде разные, тоже мне аргумент.

>это бы не написал человек который и гемму использует и мистраль

Ну я и не использую мистрали, больше нет. Достаточно натерпелся ебли с их лупами за все время. Помню каким ебланом себя почувствовал когда понял что остальные модели просто пишут годноту без погонщика в в виде свайпов и ручных дописываний.
Аноним 15/07/25 Втр 12:10:09 1277727 61
доставьте картинку из прошлых тредов где мистраль(?) сказал "детей ебать нельзя, я сообщу о вас в OpenAI"
Аноним 15/07/25 Втр 12:10:30 1277728 62
>>1277726
Нет в последних мистралях никаких лупов, шиз
Аноним 15/07/25 Втр 12:11:24 1277729 63
>>1277725

Тут такие хлебушки залетные обитают, ты охуеешь. Олды для треда, но полностью нюфани для борды. Думаю это потому что этот тред реально одна из ведущих площадок по этой теме во всем рунете и сюда много всяких спецов не двачеров залетело.
Аноним 15/07/25 Втр 12:11:44 1277730 64
Аноним 15/07/25 Втр 12:12:49 1277731 65
>>1277728

Ты раньше вообще отрицал их существование, теперь получается признал?
Аноним 15/07/25 Втр 12:13:15 1277733 66
>>1277636
А оказалось что единственный аги шизик это ты, анон. Ну потому что в предыдущем сраче нет упоминаний об аги и аси, прикинь

>>1277713
>Спор смысла не имеет, так как вы не определились с понятиями.

Ну я то определился с терминами, и даже дал их определения пару раз.
ИИ это то что называется ИИ большинством. Сейчас за простым термином ИИ, не аги не аси не хуй пойми что, просто ИИ, считаются текущие текстовые генеративные нейросети.
Вот это ИИ, прям реальный ИИ, не из фантастики. Вот такая у нас скучная реальность, шизики с этим конечно не согласны и бросаются жонглировать терминами.
Спор имеет смысл если спорящие находят в нем нужду, я пытался донести свет разума до долбаеба, но не смог. Ну и хуй с ним собственно.
Аноним 15/07/25 Втр 12:15:38 1277734 67
>>1277729
Да прям обидно
99 аутяга, мы тебя любим, ну ты чего, давай тушись. Ты на дваче или на форуме для анимешных девочек ?
Ах... да...
Аноним 15/07/25 Втр 12:17:51 1277735 68
>>1275916 →
> Самый дешевый и сердитый вариант - найти и добавить майнинговую P104-100 8Gb второй картой. (Если повезет - ~20$ цена)
А если на материнке только огрызок псие3 х4?
Аноним 15/07/25 Втр 12:18:43 1277736 69
>>1277729
А нехуй токсить на контект мейкеров, необучаемые долбаебы.
Вполне понимаю анона, но так же понимаю что ожидать нормального отношения на анонимной борде с долбаебами тоже такое себе.

Даю подсказку - если видите как обижают такого то просто поддержите его словами и объясните что тут и как. Потому что когда все молчат и человек сталкивается с таким отношением, он и на весь тред проецирует его, и уходит.
Аноним 15/07/25 Втр 12:19:06 1277738 70
>>1277713
>Спор смысла не имеет, так как вы не определились с понятиями.

Все просто, качество ИИ оценивается по тому насколько его поведение неотличимо от поведения естественного интеллекта(человека).
Когда он тебе лупит один и тот же абзац, меняя в нем пару слов или просто повторяет прошлые сообщения - это оценка ноль потрму что естественный интеллект даже с заболеваниями так себя не ведет.
Аноним 15/07/25 Втр 12:20:37 1277739 71
>>1277738
>Когда он тебе лупит один и тот же абзац, меняя в нем пару слов или просто повторяет прошлые сообщения - это оценка ноль потрму что естественный интеллект даже с заболеваниями так себя не ведет.

Ты мало общался с людьми, так?
Аноним 15/07/25 Втр 12:21:00 1277740 72
>>1277472
> Оно, конечно, круто и, возможно, неизбежно, но очень большое вложение
да, примерно $3500 на БЭУШНЫЕ мать+проц+рам, фпезду такие обновы я лучше на грустных 8 каналах ддр4 посижу, там вся система меньше килобакса стоила
Аноним 15/07/25 Втр 12:22:47 1277741 73
>>1277728
Вообще есть. И это самые странные лупы что я видел.
Как мистралеёб со стажем - мистраль всегда лупилась как блядина, причем прям адово.
Тут же... Я даже не знаю. Словно она берет блоки текста из чата, чуть чуть меняет и тасует их в рандомном порядке.

>>1277736
>Даю подсказку - если видите как обижают такого то просто поддержите его словами и объясните что тут и как. Потому что когда все молчат и человек сталкивается с таким отношением, он и на весь тред проецирует его, и уходит.
Пришел анон, написал что немотрон говно и вообще фу фу, и просто указал что использовал его пресет. Не было даже срача.
Буквально на ровном месте Ба-бах.
Аноним 15/07/25 Втр 12:27:18 1277745 74
>>1277736
>и уходит
Человек и просто уйти может, я на пару месяцев пропадал, Кряк щас свалил... или сидит, но не отсвечивает.
Аноним 15/07/25 Втр 12:29:17 1277746 75
>>1277741
>Не было даже срача.

По меркам двача - да. По меркам двача тут вообще чаепития всегда. Но для человека всю жизнь просидевшего в эхокамере соцсетей или хуже того - форумов с кармочками где все сидят с языками в жопах - тут в треде уже экстрим.
Аноним 15/07/25 Втр 12:29:20 1277747 76
Не понял ваш хуньянь или как там его. Вроде бы и пишет без рефьюзов - но на провокационном нсфв начинает буксовать, ловя сильные лупы и останавливая прогресс. Кумбот, с которым можно за 10 постов с порога прыгнуть в постель или же просто дразнить-разговаривать-обниматься с ходу предлагает тебе "особый массаж" а когда ты соглашаешься - "Готов ли ты? Точно готов? Не ну я сейчас начну действовать, а ты готов?". В обычном рп вроде и отвечает, но ожидалось больше учета истории а не просто согласие и передача хода. В чем-то прикладном затестить так и не дошло.
Хуй знает, может некорректно воспроизвел их шаблон, может жора как всегда поломан, но как-то вяло он перформит для эквивалента квену как заявлено.

>>1277518
> Можно настроить
Как? Делись промптами и прочим, все сессии с ним выходили больше мучениями чем удовольствием.
>>1277538
Здесь то что авторзноте обернуто в отдельное сообщение что нарушает логику смены и работает странновато. На безрыбье (чаткомплишн) и таким страдают, но как раз юзаешь тексткомплишн - ну сделай нормально чтобы от системы был напоминалка или честным префиллом в начале синкинга, а потом пусть его продолжает. Скорее всего и ответы за юзера уйдут или можешь про них тоже там указать.
Аноним 15/07/25 Втр 12:33:40 1277751 77
>>1277747

> 13B

нутыпонел.

>>1277192
база треда:
- тут полтреда токсичных уебанов, игнорируй хейт, опционально можешь ебать их мамок
Аноним 15/07/25 Втр 12:41:14 1277759 78
>>1277636
Если в посте упоминается аги - это заведомо шиз. И все разговоры вокруг этого, лишь рассуждения скудных умом поехов о том в чем они совершенно не шарят, но впечатлились и жаждут донести всем свое ценное мнение. Гоните таких, наспехайтесь над ними, у них уже есть пара своих шизодосок здесь и на реддите, пускай там и сидят маринуются с такими же.
>>1277721
>>1277725
А что случилось? Кто-то обиделся и даже не на меня, невероятно.
>>1277736
> на контект мейкеров
Это не дает права нести ерунду и как-то возвышаться над остальными оправдывая это своей полезностью. Ладно был бы серийным обучатором, тогда в контексте обсуждения вещей вокруг этого мог бы немного апеллировать к опыту, но не более. Или если от какой-то критики отдельных поехов так полыхает из-за поджимающей короны - тем более печально и кринжово.
Офк и от ложных набросов нужно защищать и поддерживать хороших тредовичков если они вышеописанным не страдают. Так что случилось то?
Аноним 15/07/25 Втр 12:41:54 1277760 79
Мне сегодня приснился чудесный сон.
Как будто на моем пк - 128 гб ОЗУ, и карта 3090
Я уже начал планировать, как сейчас буду качать и устанавливать локально qwen 235b a22b. Такой восторг был, такое ярчайшее, сильнейшее переживание, каких я в реальности не испытывал годами.

И тем больнее было проснуться.
Аноним 15/07/25 Втр 12:42:11 1277761 80
>>1277741
Может у тебя таверна как-то криво настроена? Я голый кобольд юзаю (мне нужен сторителлинг а не диалоги с персонажем) - за последний год лупов вообще ни на одной модели не встречал. Даже на шизомиксах.

Ну и карточки в классическом понимании со структурой и прочим не использую. Просто своими словами пишу, мол действие происходит там-то, действующие герои такие-то, внешность и характер - вот такие, особенности мира такие, пиши в стиле таком-то и т.д. Буквально несколько предложений на русском языке. И гемма и мистраль и квен это прекрасно понимают и переваривают.
Аноним 15/07/25 Втр 12:45:44 1277767 81
Аноним 15/07/25 Втр 12:51:29 1277769 82
>>1277761
>сторителлинг
А какие ещё есть морды с режимом дополнения текста как стори мод кобольда?
Аноним 15/07/25 Втр 12:52:29 1277770 83
>>1277760
> qwen 235b a22b
говно без задач
Аноним 15/07/25 Втр 12:53:59 1277771 84
>>1277770
ТЫ ЧЁ ПЕС. ЭТО ТЫ БЕЗ ЗАДАЧ !!1111

Ваша критика к большим моделям не принимается, пока не будут предоставлены скриншоты.
Аноним 15/07/25 Втр 12:54:56 1277774 85
>>1277770
Как много ошибок в
> лучшая локалочка с неспособности запуска которой я сгораю
лол
Аноним 15/07/25 Втр 12:58:36 1277776 86
>>1277761
>Может у тебя таверна как-то криво настроена?
Может. Но первым делом когда у меня что то не работает, я начиню бегать по интернету в поисках отзывов и чужого опыта. И народ жалуется на новые квазилупы.
Они просто странные. Не бесявое желание мистрали залупиться на одной структуре, а именно выдирание предыдущих блоков.
Аноним 15/07/25 Втр 13:00:21 1277777 87
>>1277771
скриншоты чего? 22б реальных параметров дают о себе знать, это тупая хуйня которую даже сраный денсе квен 32б обходит
Аноним 15/07/25 Втр 13:02:05 1277778 88
>>1277741
>Как мистралеёб со стажем - мистраль всегда лупилась как блядина, причем прям адово.
>Тут же... Я даже не знаю. Словно она берет блоки текста из чата, чуть чуть меняет и тасует их в рандомном порядке.
Вот именно этот вид лупа лечит мой пресет: https://www.mediafire.com/file/zyhee5m1zl1d9bs/MS32-antiloop-2025-07-11.json/file
Я его в прошлом треде уже постил - на меня тоже какой-то шиз сразу наехал.
Там же и IMHO объяснение что происходит, почему пресет, а не семплеры (не работают).
Аноним 15/07/25 Втр 13:02:50 1277779 89
>>1277777
Получается ты сейчас высказываешь предположения и чужой опыт выдаешь за свой ? Я вот его не запускал, откуда мне знать как он работает. А аноны которые запускали, притаскивали вполне вменяемые скрины.
>обходит
Давненько мы не обсуждали почему методы тестирования параша ёбанная.
Аноним 15/07/25 Втр 13:03:02 1277780 90
>>1277659
> Этот "Аги" тебе вместо сахара туда стирального порошка положит, и ты отъедешь нахуй.
Ну, ебать, ну бывает… Некоторые люди и сами прекрасно с этим справляются, строго говоря. =(

>>1277692
Ну, строго говоря, Грок продает как раз те самые триггеры: сказал, она выполнила анимацию.
Но разница с прошлым в том, что сейчас есть MCP, на который модели надрачивают.
А в остальном-то, ну. Зе сейм.

>>1277733
Не-не, не переводи стрелки, аги-шизик! Ты спалился на том, что посчитал, что я твою хуйню в прошлом треде читать буду. =) Тока такие как вы могут в это поверить.

> в предыдущем сраче нет упоминаний об
> Ну я то определился с терминами, и даже дал их определения пару раз.

Бгг. )

>>1277735
> А если на материнке только огрызок псие3 х4?
шел мужик, нашел P104-100, вставил, а она ему — как раз 4 линии!

>>1277759
А в телеграме!.. Тоже есть пару чатов, читать очень забавно, если честно. =) Такие жемчужины порою находишь.

>>1277584
Пропустил, отвечая.
В прошлый раз она была прям плоха, но в этот раз пишут, что весьма норм.
Надо пробовать, на русский язык не надеюсь, но вдруг там кодинг и в правду хорош.
Аноним 15/07/25 Втр 13:05:18 1277781 91
>>1277699
Всё говно, кроме пэйнтедфэнтэзи, но и она говно по сравнению с той же фантазией, только 33б.
Аноним 15/07/25 Втр 13:05:36 1277782 92
>>1277780
>А в остальном-то, ну. Зе сейм.
Я его на радостях скачал, хотя шлем брал сугубо ради полетов в вуртундере на реактивах.
Как увидел этот блендер, чуть не охуел. Ну спасибо разработчики конечно за такой интерфейс, но я немного друго имел ввиду под словом заебаться.
Аноним 15/07/25 Втр 13:10:04 1277784 93
>>1277779
> чужой опыт
)
> Давненько мы не обсуждали почему методы тестирования параша ёбанная.
ну тут соглы. лично для моих нужд 235б = говно ебаное
Аноним 15/07/25 Втр 13:10:18 1277786 94
Или у меня вновь обострение и пора пить таблетки или сообщения исчезли.
Аноним 15/07/25 Втр 13:11:13 1277787 95
Аноним 15/07/25 Втр 13:11:43 1277788 96
>>1277786
моча потёрла хохлосрач. но таблетки пить не забывай.
Аноним 15/07/25 Втр 13:14:27 1277789 97
>>1277788
>таблетки пить не забывай
Это сильные депресанты, только когда ремиссия проходит и начинается рецидив. Но тогда есть вещи куда более интересные, чем писать в треде и заебывать анонов. Можно к примеру посчитать сколько отверстий в блоке или позалипать сидя в углу, потому что так спокойнее. Увы, реальная шиза скучная и тяжелая.
Аноним 15/07/25 Втр 13:20:53 1277790 98
>>1277788
Там вроде пара упоминаний была, но похуй. Вовремя отошел ничего не сказать, даже не узнаю что чмоня мне писал
А еще как удобно моча все потерла, я отвечал а теперь все без ответа, вот еще изза такого говна не хочется тут ничего нести и обсуждать

>>1277780
Спок аги шизик, не переводи стрелки

>>1277751
>база треда:
- тут полтреда токсичных уебанов, игнорируй хейт, опционально можешь ебать их мамок

Вот это реально база, а не всякие ваши нейронки
Аноним 15/07/25 Втр 13:24:48 1277791 99
1.png 11Кб, 638x78
638x78
Аноним 15/07/25 Втр 13:25:03 1277792 100
>>1277584
Годно, надо будет попробовать. Учитывая что там скользящее окно - нужно с осторожностью, опять чего-нибудь наломают.
>>1277740
Там бу толком и нету, цены +- как если новое цеплять по удачным условиям. Оварида.
Аноним 15/07/25 Втр 13:30:43 1277795 101
>>1277777
>>1277784
Фу блять, жир от диванного. Дебил байтит на срач, максимальное осуждение.
Как раз квен235 - одна из первых моделей где за мое не стыдно и действительно ощущается большой размер, а не микромодель на стероидах как в микстрале и прочих ее предках. Даже нет того провала и контраста между крутым ризонингом и "ах ты меня ебешь" в основном ответе как в прошлом дипсике.
Аноним 15/07/25 Втр 13:41:15 1277803 102
1.png 40Кб, 971x125
971x125
>>1277795
> диванного
пикрил
> ах ты меня ебешь
для дрочки 235 может и годится, не спорю. для работы это говно говна хуже чем 32б денсе
Аноним 15/07/25 Втр 14:01:15 1277818 103
>>1277803
> пикрил
С работы таких железок могу показать что ахуеешь, но какой толк с этого.
> это говно говна хуже чем 32б денсе
Полный абсурд. Показывай какая у тебя там "работа" что самая неудачная модель из серии справляется лучше.
Аноним 15/07/25 Втр 14:06:16 1277822 104
Аноним 15/07/25 Втр 14:06:30 1277823 105
>>1277818
Что у тебя за работа такая?
Аноним 15/07/25 Втр 14:08:59 1277826 106
>>1277760
А прок от озу? Ну влезет туда моделька на 150гб и будет пердеть 0.1т/с.
Проверил на 256гб сборочке
Аноним 15/07/25 Втр 14:09:11 1277827 107
>>1277823
Ты серьезно ? Я как бы мимо, но мало ли железячников, что сервера обслуживают. Я вот перепродавал первых хопперов после списывания. Нет, они были в серверном исполнении и я не видел смысла для себя их покупать, даже с ебейшей скидкой.
Аноним 15/07/25 Втр 14:09:57 1277829 108
>>1277826
MOE ? Так то на оперативе он как раз и работает. Ты ничего не перепутал ?
Аноним 15/07/25 Втр 14:12:17 1277833 109
>>1277829
Хз, вроде мистраль была. Возьми да собери себе сборочку на 256-512 Гб. Сейчас это уже не дорого в сравнении с видеокартами даже если выкинуть все зионы 2011
Аноним 15/07/25 Втр 14:14:14 1277834 110
IMG4569.jpeg 48Кб, 400x388
400x388
Аноним 15/07/25 Втр 14:16:06 1277835 111
>>1277822
Тем более ерунда. Хз насчет специализированных моделей, но из общих альтернатив квену только корпы и дипсик.
Именно с квеном получилось автоматизировать многие рутинные процессы, и с ним не западло вайбкодить. Остальные даже не близко и банально не могут понять что ты от них хочешь.
>>1277823
Аналоговнетная. В доступе много компьюта ибо расчеты, но только на профессорах.
Аноним 15/07/25 Втр 14:17:34 1277837 112
Аноним 15/07/25 Втр 14:23:09 1277840 113
>>1277837
Общее мнение по треду : imatrix лучше работают на языке оригинала и да, действительно быстрее.
Если тебе нужен великий и могучий ты берешь обычную жору или эксельки, если баренский то я_квант
Аноним 15/07/25 Втр 14:23:22 1277841 114
>>1277834
Всё в твоих руках. Докажи свой титул энтузиаста и погоняй бенчи на железе
Аноним 15/07/25 Втр 14:24:18 1277842 115
так падажжи, imatrix применяется во время квантизации. а как узнать, мои Q4 собраны с imatrix или без?
Аноним 15/07/25 Втр 14:24:58 1277843 116
>>1277841
Я понять не могу, почему в обсуждении MOE вообще всплыла мистраль.
Аноним 15/07/25 Втр 14:25:14 1277844 117
>>1277834

Человечек микстраль наверное иммет ввиду, не душни.
Аноним 15/07/25 Втр 14:25:54 1277845 118
>>1277842
Ты когда скачиваешь, монитор принципиально не включаешь ?
> а как узнать
Посмотреть на то что ты скачивал.
Аноним 15/07/25 Втр 14:27:53 1277846 119
>>1277842

Там imat в названии как правило
Аноним 15/07/25 Втр 14:28:25 1277847 120
>>1277837
>Q4
Вот твоя ошибка, хотя большие модели кажутся менее сломанными на 4 кванте, но они все равно теряют в мозгах при квантизации. Если хочешь пощупать как именно модель тупеет от квантов, то накачай какой нибудь геммы 4b и пообщайся с ней на разные темы в разных квантах. Какой нибудь 8, 4 ,3
Я этим занимался при тестах сеток переводчиков, и вобщем то только подтвердил свои старые выводы

>>1277844
>Человечек микстраль наверное иммет ввиду, не душни.
Для него не нужны 256 гб, он скорей всего про большой мистраль, да и не помнит уже никто о микстрале

>>1277826
Ты проверял плотные модели, мое модели считаются иначе, у них просчитываются только активные параметры, а не все что есть в модели.
Вот мое как раз на процессорах и запускают, они обычно активных параметров имеют 10-30b максимум
Аноним 15/07/25 Втр 14:28:46 1277848 121
>>1277837
Это база бомжеквантов. Сейчас методы оценки и выбора эффективной битности для групп весов не просто расшились, что уже в черную магию и qat полезли. Но как >>1277840 упомянул, грубо говоря оценка на ограниченном датасете сделает лучше работу в нем и хуже в остальном.
>>1277842
Чекай описание. Сейчас популярны динамические кванты от unsloth, на q3 и ниже там нюансы, но они сохраняют работоспособность даже на оче низких битностях. Если хочешь перфоманс модели приближенный к оригинальной и полные мозги - там q5 и выше, желательно без агрессивных перераспределений весов.
Аноним 15/07/25 Втр 14:30:21 1277849 122
>>1277837
>квен говно потому что я его в Q4 без imatrix запускаю

Нет, imatrix чуть-чуть улучшает квант, сделать из говна конфетку он не сделает. Квен надо настраивать, это очень капризная к настройкам модель.
Аноним 15/07/25 Втр 14:31:05 1277850 123
штош.jpg 675Кб, 1280x853
1280x853
>>1277848
> Если хочешь перфоманс модели приближенный к оригинальной и полные мозги - там q5 и выше
Аноним 15/07/25 Втр 14:32:25 1277852 124
>>1277842
Я проверил. Они, как правило (по крайней мере, все что скачивал) начинаются в названии с i1.
Аноним 15/07/25 Втр 14:32:58 1277854 125
>>1277835
на каком железе запускаешь квена и какой квант?
Аноним 15/07/25 Втр 14:33:38 1277855 126
>>1277850
Это для снобов, в треде вон вообще 1.8битный квант дипсика котируют и нахваливают. Большие модели переносят подобные издевательства и могут перформить, просто нужно держать в голове что юзая лоботомита проблемы могут быть не из-за плохой модели а от лоботомии и никто ничего не обещал.
Аноним 15/07/25 Втр 14:34:21 1277856 127
>>1277848
>динамические кванты от unsloth
А можно подробнее, это что за зверь такой?
Аноним 15/07/25 Втр 14:34:56 1277857 128
Аноним 15/07/25 Втр 14:35:43 1277859 129
Анончики, какие модели посоветуете, чтобы гигов в 55 влезало? Буду страдать на очень низкой скорости, но хоть посмотрю что там да как, интересно
Аноним 15/07/25 Втр 14:35:50 1277860 130
>>1277847
>Если хочешь пощупать как именно модель тупеет от квантов, то накачай какой нибудь геммы 4b и пообщайся с ней на разные темы в разных квантах. Какой нибудь 8, 4 ,3

Вредный совет.
В том и дело что чем меньше модель, тем больше она страдает от потери кванта, у 8б 4 квант уже дохлый, у 70б 2 квант юзабелен. И да, я лично сравнивал 70б модели на 6 кванте, 4 и 2. 4 и 6 на 70б я разницы не ощущал на глаз.
Аноним 15/07/25 Втр 14:37:23 1277862 131
>>1277857
>ага, то есть надо было качать отсюда
Анон, ну не ебись ты в глаза, у тебя же по первой ссылке
>weighted/imatrix quants of
>static quants are available at

Арбвыгалгхж... звуки пены из рта и воя.
Аноним 15/07/25 Втр 14:38:08 1277863 132
>>1277860
Я помню как тут анон запускал самые ужатые Q1 от больших моделей. Какая же годнота была читать его посты.
Аноним 15/07/25 Втр 14:39:38 1277867 133
>>1277854
Бомжериг, exl3 5bpw. Когда-то начинал с ud2, даже там модель хорошая но встречались ошибки и лень со скатыванием в ближайшую тривиальщину вместо правильной работы.
>>1277856
https://docs.unsloth.ai/basics/unsloth-dynamic-2.0-ggufs в их репах идут с приставкой UD, перфоманс может быть очень неравномерным по областям.
Аноним 15/07/25 Втр 14:39:49 1277869 134
>>1277859

Неиронично большой дристраль, хз какой квант влезет правда. Ну либо можешь гемму или квен на 8 битах запустить, хз зачем.
Аноним 15/07/25 Втр 14:40:07 1277870 135
>>1277778
пресет не работает, всё равно структурно лупится, топчется на месте, перефразирует куски только + ещё контекст пересчитывает каждое, сука блять сообщение, говно в общем, юзайте ChatML И не ебите себе мозги, если он начал лупиться, то он будет лупиться, помогает всё что раньше помогало
Аноним 15/07/25 Втр 14:42:00 1277877 136
>>1277870

Шло время, а дристралеебы всё продолжали жрать кактус и плакать...
Аноним 15/07/25 Втр 14:43:01 1277884 137
>>1277860
Анон, как бы тебе сказать. Если у тебя низкий рост ты пройдешь в низкую дверь и не заметишь, а если высокий то стукнешься головой.
С маленькой моделью у тебя высокий рост и ты стукаешься головой, замечая ее затупы при квантизации.
На большой модели потолок выше, и хотя он опускается при квантизации ты это не замечаешь проходя под ним.

Большие модели кажутся менее пострадавшими, и там можно спокойно пользоваться каким нибудь 2 квантом, но это не значит что они не ломаются, просто это незаметно на простых задачах.

Я предложил проверить на мелкой модели потому что на ней чувствуется, как именно модель работает не так от квантов.
Просто растягиваешь потом это понимание на большую модель с поправками на ее размер.
Аноним 15/07/25 Втр 14:43:12 1277885 138
Аноним 15/07/25 Втр 14:43:34 1277886 139
А что - эра 70b моделей прошла? Что-то я ни одной не вижу в обсуждениях
Аноним 15/07/25 Втр 14:44:56 1277892 140
>>1277867
Спасибо, сегодня вечером погоняю Гемму 27b от них, сравню со своим обычным Q4_K_L
Аноним 15/07/25 Втр 14:46:46 1277902 141
image.png 556Кб, 1280x720
1280x720
>>1277782
> я немного друго имел ввиду под словом заебаться.
Аноним 15/07/25 Втр 14:47:50 1277905 142
>>1277885
А разве Unsloth Dynamics не лучше будет? =)
Айматрикс один фиг на инглиш заточены, как и Анслот дайнэмикс, но последние прям круты, вроде как.
Аноним 15/07/25 Втр 14:47:55 1277906 143
>>1277884
>Я предложил проверить на мелкой модели потому что на ней чувствуется, как именно модель работает не так от квантов

В том и дело, что ты хуйню советуешь новичкам и вводишь их в заблуждение.
И потом они эктраполируют это неверное знание на старшие модели которых кванты почти не лоботомируют и пишут вбросы типа
>ниже q6 жизни нет
В то время как на 70b ты на слепом тесте не отличишь шестой квант от четвертого.
Аноним 15/07/25 Втр 14:50:34 1277911 144
>>1277906
Бля, я только что написал все что ты тут пишешь, а ты увидел только то что захотел и переврал мои слова
Иди нахуй, ты не осилил чтение
Аноним 15/07/25 Втр 14:50:57 1277913 145
>>1277886
ну kimidev чёто может, но там под капотом древний квен2.5
Аноним 15/07/25 Втр 14:52:07 1277919 146
>>1277884
> но это не значит что они не ломаются, просто это незаметно на простых задачах.
База
>>1277906
> на старшие модели которых кванты почти не лоботомируют
На самом деле еще как лоботомируют, просто проявляется иначе и базовые вещи сохраняются. Будет давать тебе унылые ответы и лупиться, при этом сохраняя общую адекватность. Но это больше для суб-4битных или в задачах где требуется точность.
Аноним 15/07/25 Втр 14:53:17 1277922 147
>>1277886
Модели до 32b можно спокойно запускать на потребительском железе. Даже на 12гб-помойках с неполной выгрузкой там будет терпимая скорость. Вот все и сосредоточились на мелочи - на это есть запрос большинства. Какой смысл делать модель ради 1.5 энтузиастов, у которых есть ресурсы на запуск 70b-120b? Правильно - никакого. Вот и нет новых 70b моделей. И Мистраль ларджа тоже нового нет. Все юзают 24b и довольно урчат и я тоже.
Аноним 15/07/25 Втр 14:54:25 1277925 148
>>1277911

Ты советуешь новичкам изучать квантование по 4б моделяям чтобы вбить им в голову ложь что кванты так же портят все модели, а злодей тут я. Ну ты и мразь.
Аноним 15/07/25 Втр 15:01:24 1277934 149
>>1277919
>На самом деле еще как лоботомируют

Если что-то не проходит слепой тест, то утверждение является коупингом и газлайтом.
Аноним 15/07/25 Втр 15:05:22 1277937 150
>>1277925
Если ты не замечаешь этого, то это только твоя проблема
Мразь ебаная, еще и мои утверждения перевирает лишь бы свое манямнение выставить правильным
Аноним 15/07/25 Втр 15:14:15 1277946 151
>>1277937

Я не перевирал твои посты. У тебя неверное представление что относительная динамика падения качества квантов одинакова вне зависима от размера, но на больших падение менее заметно только из-за эффекта большой величины.
На самом деле у маленьких и больших моделей относительное падение разное, там где маленькая упадет на 5% относительно самой себя там большая упадет на 0.5% относительно самой себя, тут не только эффект величины что делает паление что ты пытаешься донести, тут именно что относительное падение в разы меньше.
Аноним 15/07/25 Втр 15:14:31 1277947 152
Ниже FP64 жизни нет, чего уж мелочиться.
Аноним 15/07/25 Втр 15:16:10 1277950 153
>>1277947
Так и знал что будущее за x86 процессорами.
Аноним 15/07/25 Втр 15:17:17 1277951 154
>>1277946
>динамика падения качества квантов одинакова вне зависима от размера
Bruh, я другой анон, но ты хоть почитай что он писал тебе. Желательно дальше первых двух слов.
Аноним 15/07/25 Втр 15:20:11 1277954 155
IMG4495.jpeg 43Кб, 417x326
417x326
>>1277911
>>1277937
Вы еще подеритесь тут, горячие нейронные boys.
Аноним 15/07/25 Втр 15:21:21 1277955 156
>>1277886
Не выпускают сейчас, также как был большой пропуск в "эре 30б" которых сейчас вагон. Зато подъехали 100-200-300б.
>>1277934
Проходит, отличия вполне очевидны. Получается коупинг и газлайт в твоих словах. Даже интересно что ты пытаешься доказать там.
Аноним 15/07/25 Втр 15:27:31 1277957 157
>>1277955
>Проходит

На 4б да, проходит, на 70б нет.
Аноним 15/07/25 Втр 15:32:06 1277959 158
>>1277951

Это ты как раз не понял что тут >>1277884 он говорит об одинаковой динамике падения качества от квантов и том что на большой модели падение незаметно только из-за эффекта величины, но дело реально не только в этом эффекте.
Аноним 15/07/25 Втр 15:32:08 1277960 159
Аноним 15/07/25 Втр 15:39:00 1277962 160
>>1277847
> Вот мое как раз на процессорах и запускают, они обычно активных параметров имеют 10-30b максимум
Посмотрим какая разница будет между гпу и цпу онли на лламе скаут
Аноним 15/07/25 Втр 15:40:53 1277965 161
Так, я не закончил с говном99.
Эта мразь сидел здесь месяцами, читал посты, знал где находится, и порвался от "ну немотрон и говно, пресет анона99"
Сука, надо выписать его из крутых пацанов треда.
Аноним 15/07/25 Втр 15:44:36 1277967 162
>>1277870
Если идет полный пересчет контекста - проблема точно не в пресете. У меня ничего не пересчитывает, да и нечему там на это влиять. Изменяется только оформление последнего хода.
Допускаю, что кому-то и он не поможет, но претензии про контекст - это точно не сюда.
И этот пресет использует ChatML разметку.

>>1277877
>Шло время, а дристралеебы всё продолжали жрать кактус и плакать...
Шло время, а тролли все так же лезли из под мостов...
Аноним 15/07/25 Втр 15:49:19 1277969 163
>>1277965
скорее всего его заебали гниль и агрессия которые тут воцарились, но он и правда давно тут сидел. чел был слишком позитивным для этого места, часто помогал, видимо не двачер. френдлифаер ловил от тредовичков и горящие какашки от залетышей что не могут даже накатить пресет. в целом могу его понять, сам реже заходить стал сюда, вечный срач за модели и чья правда правдивее
Аноним 15/07/25 Втр 15:53:51 1277971 164
>>1277965
А кто самый крутой пацан треда? Можно список?
Аноним 15/07/25 Втр 15:54:32 1277972 165
Аноним 15/07/25 Втр 15:57:12 1277973 166
>>1277967
>пересчет контекста
Пересчёт идёт не всего контекста, но секунд 10 занимает.
Аноним 15/07/25 Втр 15:59:02 1277977 167
>>1277969
>скорее всего его заебали гниль и агрессия которые тут воцарились
про алетеана также говорили, ничо, остынет, вернётся
Аноним 15/07/25 Втр 16:00:38 1277979 168
>>1277965
Бля, вот иди нахуй, слов нет.

Самый ор, что я и был тот кто у него спросил пресет на Command-r, после чего, неожиданно, модель оказалась годнотой. И как бы да, он просто делал хорошие пресеты. Так ебальник можно было бы просто и завалить, но с другой стороны этого бум тоже не понял. Сейчас бы еще на мнение аутистов реагировать, да и в целом, не было ничего такого. Ну вялый немотроносрач.
,Meh~
Аноним 15/07/25 Втр 16:00:56 1277980 169
>>1277971
>самый крутой пацан треда
Тот тип что с системником метровой высоты и 512 памяти
Аноним 15/07/25 Втр 16:01:46 1277981 170
>>1277980
А мне доставлял теслошиз со своими охуительными идеями.
Аноним 15/07/25 Втр 16:02:35 1277983 171
А вас предупреждали, говорили, блядь, не трогайте немотрончик...
Аноним 15/07/25 Втр 16:03:59 1277986 172
>>1277983
Это интернет, детка, тут и на хуй послать могут.
Аноним 15/07/25 Втр 16:10:48 1277991 173
Тредик не болей
Аноним 15/07/25 Втр 16:12:27 1277992 174
image.png 137Кб, 919x202
919x202
image.png 512Кб, 1150x650
1150x650
image.png 14Кб, 1003x142
1003x142
>>1277962
Древние гпу всё же лучше древних цпу
Аноним 15/07/25 Втр 16:23:06 1278003 175
кароч я считаю что выдача квена235 хуже квена32 потому что квен32 у меня в Q8 а квен235 в Q4
Аноним 15/07/25 Втр 16:25:45 1278007 176
>>1278003
Что-то криво нашаманил и модель криво работает, или кванты/жора поломанные. Квен3-32 весьма косячный и использовать его тяжело, по уму они и близко не стоят. Покажи примеры ответов.
Аноним 15/07/25 Втр 16:42:17 1278025 177
Аноним 15/07/25 Втр 16:44:45 1278026 178
Аноним 15/07/25 Втр 16:47:52 1278027 179
Аноним 15/07/25 Втр 16:52:22 1278029 180
Часто создатели контента начинают мнить себя какой-то элитой, причем чем меньше контент, тем больше чсв. Пресеты любой может делать у кого руки есть, собственно любой в этом треде этим занимается на постоянке, иначе никакая модель не заведется, кроме всеядной геммы какой-нибудь. Потому и выложенный пресет не бог весть какой контент, чтобы выложившему в ножки кланятся и воздерживаться от критики если пресет реально хуйню выдает.
Аноним 15/07/25 Втр 16:55:05 1278033 181
>>1278026
у Behemoth-123B-v2.2b и Magnum-v4-72b ссылки на скачивание одинаковые и ведут на GGUF
у GLM-4-32B-0414 ссылка ведёт на QwQ
у NemoMix-Unleashed-12B ссылка ведёт на MN-12B-Mag-Mell-R1
у Magnum-v4-12b ссылка ведёт на 27b
Аноним 15/07/25 Втр 17:02:16 1278039 182
>>1278029
> кроме всеядной геммы какой-нибудь
На гемму тоже надо иначе она конечно заведётся, но тебя не заведёт а только соей зальёт.
Аноним 15/07/25 Втр 17:03:12 1278040 183
Аноним 15/07/25 Втр 17:03:42 1278041 184
>>1278026
Найс
> 2CH-LLM-TRED
Пора бы пофиксить это, наверно.
> Qwen3-30B
Стоит добавить -A3 в название чтобы не было путаницы и рядом указать обычную qwen-3-32b

Также предлагаю ссылки на кванты заменить на запросы к обниморде
> ?other=base_model:quantized:MODELNAME
Можно будет выбрать себе нужный
Аноним 15/07/25 Втр 17:07:00 1278042 185
>>1278029
Часто потребители контента начинают мнить себя какими-то экспертами, мнение которых непогрешимо. И чем меньше знаний и умений, тем больше чсв. Потому и их мнение выраженное с агрессивным апломбом имеет не бог весть какую ценность. Языком молоть - тут каждый в треде умеет, и регулярно этим занимается, а то бы здесь и не было никого. Потому, если что-то предлагают, можно бы элементарную вежливость проявить, а не фекалиями швыряться, вообще не разобравшись о чем речь. Ну, или просто проигнорировать, хотя бы.
Аноним 15/07/25 Втр 17:10:10 1278046 186
>>1278042
У нас тут не толерастные эльфы-пидарасы, если что-то говно, то говорится прямо что это говно.

Но справедливости ради в вовпросе с пресетом чел сказал модель плохая и ему не понравилась, а не пресет.
Аноним 15/07/25 Втр 17:12:56 1278050 187
>>1278029
Перегибаешь. Ну психанул анончик даже ничего в итоге не удаляя и т.д., а то и вообще кто-то за него вбросил. Так шиз пошел тиражировать и раздувать, странный наброс. Прувмивронг.
Аноним 15/07/25 Втр 17:14:12 1278052 188
>>1278042
Сами себе кумиров создаете, а потом жалуетесь. Если у них там неймфагов-выскочек посылают на хуй, то вы на снг бордах поощряете, а потом все закономерно скатывается в чатики для своих и драмы. Наверное, сказывается необходимость в сапоге.
Аноним 15/07/25 Втр 17:16:03 1278054 189
>>1278052
>скатывается в чатики для своих
Словно что-то плохое
Аноним 15/07/25 Втр 17:19:40 1278058 190
>>1278052
> Сами себе кумиров создаете
с третьей попытки поставил ударение правильно
Аноним 15/07/25 Втр 17:20:04 1278059 191
Аноним 15/07/25 Втр 17:29:54 1278066 192
>>1277860
>у 8б 4 квант уже дохлый, у 70б 2 квант юзабелен. И да, я лично сравнивал 70б модели на 6 кванте, 4 и 2. 4 и 6 на 70б я разницы не ощущал на глаз.
спорное утверждение. Запускал 70b в 2.25 и 4.25bpw и разница колоссальная. Модель теряет все мозги, способность нормальный текст генерировать. Также запускал и мистраль большой в 2.25bpw (или это был q2? забыл). В любом случае, ниже 4 кванта жизни нет. Исключение мб уже от 200b? Тыкал только квен в iq2_xs или как он там. Там мозг сохранялся и реально будто с большой нейронкой общался. Для себя сделал вывод такой, что ниже по кванту спускаться не буду, лучше в ущерб размеру параметров, но квант хотя бы q4_k_m или q5
Я тогда правда особо не понимал сэмплирование, мб надо модель полностью перекручивать, чтобы она на маленьком кванте работала?
Аноним 15/07/25 Втр 17:56:46 1278090 193
>>1278066
>спорное утверждение

А в чем спорное? Ничего в моем посте не противоречило тому что ты написал. Для 70б это так и выглядит - 2 квант юзабелен, но ощутимо глупее, 4 и 6 почти неотличимы друг от друга. Граница вменяемости после которой начинается резкое падение вниз на 70б где-то на трех битах находится. Двухбитный уже порядкком побитый из-за этого, но еще живой. У более крупных типа дипсика там и 1бит юзабелен.

>ниже 4 кванта жизни нет

Это база треда с самого начала, но у анонов с теслами и просто кучей видеопамяти иногда появляется желание самоутвердится и тогда они начинают затирать новичкам про ниже 6 кванта жизни нет и толкать шизоповестку как четвертые кванты рушат модели приводя в пример 4б, для которой реально граница вменяемости где-то на 5 квантах находится.
Аноним 15/07/25 Втр 18:01:25 1278094 194
Запускал Гемму 27b в Q3_K_L кванте и поначалу всё было норм. Но чем больше с ней переписывался тем чаще замечал проскакивающую шизу. В итоге заебался править это руками и вернулся на Q4_K_L.

Вывод - на средних моделях 3 квант использовать можно, если не лень периодически вмешиваться и исправлять бредик. Если лень - НЕ ЛЕЗЬ НАХУЙ ниже 4 кванта.
Аноним 15/07/25 Втр 18:04:24 1278096 195
>>1278090
Ну, я хотел сказать, что второй квант впринципе не юзабельный (как и ниже, да и 3 тоже пиздец), даже на 70б. По крайней мере я не вижу в этом смысла, с таким же успехом 24б модель в 5 кванте запускаешь и у тебя лучше аутпут выйдет по итогу.
Хотел потраить deepseek химеру в 3 xss кванте на 675 параметров, там есть ощущение, что возможно будет ощущаться качество, раз квен моешный так хорошо работал.
Аноним 15/07/25 Втр 18:04:53 1278098 196
>>1278029
пресетовичок был оч вежлив, не аватарил и ни разу за чсв не замечен, хз зачем ты это высрал. лучше бы своими пресетами поделился или сделал че полезное, но ты подтвердил правило. ну и в целом по ситуации, захотел анон отвалиться, его дело, чего вдруг такую шумиху подняли
Аноним 15/07/25 Втр 18:09:51 1278106 197
>>1278096
а, еще хотел заметить, что q4_k_m думаю идеал, q4_k_s показывал себя заметно хуже при сравнении одной и той же модели
Аноним 15/07/25 Втр 18:12:20 1278109 198
>>1278106
>q4_k_m
Почему не K_L? Разница в размере минимальна, а качество теоретически выше
Аноним 15/07/25 Втр 18:14:37 1278112 199
>>1278106
думаю можно и k_l, но его не так часто встречаю, в модельке что я тестил вроде не было такой квантовки (24b кстати)


----
кто-то пробовал кими инструкт, насколько она зацензурена?
Аноним 15/07/25 Втр 18:14:48 1278113 200
>>1278096

У нас давно нормальных новых 70b просто не было, а старые на уровне нынешних 32б, там-то понятно почему 5 бит геммы ебет 2 бит ламы 3.3, эти модели в 16 битах-то на одном уровне.
Раньше было иначе и 2 битка какой-нибудь мику уебывала с вертухи вообще все что ниже, просто камня на камне не оставляла. И тогда же были составлены метрики для лама моделей показывающие ценность квантов относительно младших моделей. И там было четко видно что любой квант старшей модели одного модельного ряда всегда лучше 16 бит младшей.
Аноним 15/07/25 Втр 18:23:33 1278126 201
>>1278106

От модели зависит, но как правило да, выбери 4_k_m и никогда не ошибешься. Разве что если мелочь гоняешь ниже 8б. Выше - уже излишество и имеет смысл только при наличии лишней(именно лишней, оставшейся после того как 128к контекста забил) видеопамяти. При этом даже с неограниченной видеопамятью выше 6 бит не имеет никакого смысла подниматься. Ниже 4 бит - только по необходимости. И только на моделях выше 32(т.е. начиная с немотрона и выше).
Аноним 15/07/25 Втр 18:25:45 1278132 202
>>1278098

Помню месяц-два назад был злой пресетовик, он все нахваливал свои пресеты но отказывался делиться так как его кто-обидел, назвав модель говном. Это он же? Я просто не заходил с тех пор.
Аноним 15/07/25 Втр 18:29:03 1278138 203
Чето глм много срёт описаниями но сюжет особо не двигает и на диалоги не напирает.
У меня уже 5 сообщений подряд блоуджоб в одной позиции, всё хочу чтобы он сам куда то двинул уже а не я за ручку вёл как маленького
Аноним 15/07/25 Втр 18:32:10 1278141 204
>>1278138

Скорее всего промпт такой или карточка.
Лично мне глм вообще не зашел. Вроде и норм модель, но ничем не зацепила.
Аноним 15/07/25 Втр 18:36:31 1278152 205
>>1278141
А что зацепило?
Я уже месяц немотрон-глм-коммандер пытаюсь распердеть
Аноним 15/07/25 Втр 18:38:35 1278156 206
>>1277584
А чем ее запускать? И llama, и тем более kobold просто падают при попытке загрузить модель.
Аноним 15/07/25 Втр 18:52:28 1278177 207
>>1278152

Геммой пользуюсь. Синтией. Квеном 3.Ну немотрон еще лежит - но он по сути та же самая 70В лама 3.3, разве что в 24 гб видеопамяти влезает. Еще Рп инк завалялся на базе квена 2.5.
Аноним 15/07/25 Втр 18:54:26 1278179 208
>>1278156

На странице модели написано же - надо их форк ламы цп ручками билдить.
Аноним 15/07/25 Втр 19:17:55 1278201 209
Даркнесс одного из наших анонов до сих пор лучшая в плане русского РП?
Аноним 15/07/25 Втр 19:38:51 1278227 210
>>1278046
>У нас тут не толерастные эльфы-пидарасы, если что-то говно, то говорится прямо что это говно.
Ну тогда не обижайся если тебя тоже прямо назовут.
Проблема то не в том, что говном назвали. А в том, что "раз у меня сразу не заработало как я хотел - значит говно, и точка". Мысль о том, что что-то неправильно понято, или не так сделано, даже в голову не забредает. Подсказать, как это называется?

>>1277778
Спс. Пресет рабочий. Попробовал - действительно сильно лучше стало. Только ты его аж в позапрошлом треде постил, еле нашел объяснения.
Аноним 15/07/25 Втр 19:47:29 1278247 211
>>1278227
>Ну тогда не обижайся если тебя тоже прямо назовут.
Меня и называют, и называли, за мержи, за пресеты, за карточки.
Ничо, до сих пор здесь.

Кому зашло, те благодарят и урчат.
Кому не зашло, тем не зашло.

>>1278201
>Даркнесс одного из наших анонов
Меня =))
Хотя попробуй Mistral-Small-3.2-24B-Instruct-2506-Q4_K_M
Он чуть выше 12B Q8 весит, зато и в русский, и в кум может, и умнее. Ну, а также есть и мержи на его основе.

Ещё есть гемма 12б, но аблитерация сломана, а без неё секасу не будет, даже за ручки не подержишься - сразу соей зальёт.

>>1278227
>Подсказать, как это называется?
"Вокруг одни долбодятлы, один я Д'Артаньян."
Аноним 15/07/25 Втр 19:51:05 1278250 212
f0e740b2cb93592[...].webp 220Кб, 2000x2000
2000x2000
55776243e8776fd[...].webp 239Кб, 2000x2000
2000x2000
c46189b6b60513c[...].webp 78Кб, 600x800
600x800
Небольшой офтоп. Но подскажите у кого опытный глаз, смогу я сюда ADATA XPG DEFENDER [DEFENDER-WHCWW] нормально поставить две видимокарты и 3 жестака 3,5. Пожалуйста. Фото с комплектухой не мои, но у меня тоже башня на проце.
Аноним 15/07/25 Втр 19:54:42 1278256 213
анонцы, а есть какая-то разметка, которая будет скрывать блок текста, который генерит нейронка? Хочу, чтобы она вела этакий статус персонажа/юзера под конец генерации, но чтобы в глазах не мельтешил
Аноним 15/07/25 Втр 20:00:42 1278262 214
>>1278256
Нечто подобное можно попробовать запилить со stepped thinking.
Но в целом локалки статблоки сильно склоняют к лупам.

Есть несколько фронтов кроме таверны с подобными штуками, но они все в разботке альфа-бета версиями.
Аноним 15/07/25 Втр 20:02:14 1278265 215
>>1278247
Слушай ну умнее не сказал бы. У меня вот сейчас как раз этого анона модель и как раз Q4.

https://huggingface.co/Aleteian/Sexpedition-MS3.2-24B-Q4_K_M-GGUF/tree/main

Например у меня ситуация NTR жанра и даркнесс как бы сразу выбирает нужного персонажа(условно говоря тренера) , а не парня тянки. И сразу двигает норм сюжет. Ну а этот 24b почему то воспринимает контекст по другому.
Аноним 15/07/25 Втр 20:04:31 1278268 216
Подскажите пожалуйста лучший переводчик с английского/русского на японский.
Не обязательно локалку, в асиге такое спрашивать сами понимаете
Аноним 15/07/25 Втр 20:09:49 1278276 217
image 856Кб, 1516x975
1516x975
>>1278265
>Sexpedition
Ахахах, вот только сегодня замержил и тестирую как оно.

Как впечатления?
Аноним 15/07/25 Втр 20:10:51 1278279 218
>>1278268
>лучший переводчик с английского/русского на японский
gemma-3n-E4B-it-Q8_0 попробуй
Аноним 15/07/25 Втр 20:13:16 1278283 219
image.png 32Кб, 1164x234
1164x234
Утка я тебе щас все перья выщипаю нахуй
Аноним 15/07/25 Втр 20:13:29 1278284 220
>>1278262
Кстати неплохой вариант, что статус в thinking запихнуть.
>>1278268
корпы будут всегда лучше chatgpt, а из локалок gemma-3, желательно 27b, можешь пробовать 12b и их новые уменьшенные, но ты заметишь падение качества.
>>1278265
тут может играть еще и сам фактор пользователя. Ты привык играть на ней, ты знаешь к модели подход. Попробуй syntwave или synthia-s1, неплохие тюны. За этот sexpedition не знаю, но мистралетюны сейчас в целом не лучший вариант, если есть возможность геммовские юзать. Или попробуй ванильынй последний мистралемалютка 24б, он не зацензурен насколько я могу судить по своему опыту общения с ним.
>>1278276
Ничосе, тредовичок запилил. Судя по мержу она должна лезть в трусы до того как пользователь напишет сообщение? Кстати магнум даймонд мне понравился, неплохой тюн
Аноним 15/07/25 Втр 20:14:01 1278287 221
>>1278265
>умнее не сказал бы
Тут может быть несколько факторов:
1) Мерж двух кум-тюнов, один из которых ужарен в хламину
2) Квант
3) Промт и карточка
Аноним 15/07/25 Втр 20:19:31 1278299 222
image.png 388Кб, 1920x1080
1920x1080
>>1278276
Применил пресет от одного из анонов.
Самый рабочий. Пока что тяжело сказать. Как будто даркнесс немного лучше понимал ситуацию в НТР и том куда вести игру.

Попробовал эту модель и она не понимала сначала что нужно меня, а не чела которому изменять будут, хотя гритинг прямо намекал кого вводить. С русским языком проблем нет.
Но я только запустил и пробую.

Тяжелая конечно для карточки на 12 гигов....
Аноним 15/07/25 Втр 20:26:18 1278317 223
image 886Кб, 1508x1043
1508x1043
>>1278299
>Тяжелая
С выгрузкой тензоров 6-7 т/с получается выжать.
--n-gpu-layers 99 -ot "\.\d*[01]\.ffn_gate=CPU"
ot ключ повторить ещё два раза указав вместо ffn_gate - ffn_up и ffn_down

Пресет свой завтра скину, как протестирую.
Аноним 15/07/25 Втр 20:33:15 1278334 224
fOFhQR0zpxs.jpg 27Кб, 568x285
568x285
Ну что там по итогу с Немотроном, разобрались? Порешали вопросики?
Аноним 15/07/25 Втр 20:35:46 1278340 225
>>1278334
Так давно уже. Чудесненько работает с пресетом почившего ананаса, v2 версия в перезаливе есть. Сичтем промт я другой поставил для своих хотелок и заебись
Аноним 15/07/25 Втр 20:36:45 1278345 226
>>1278334
по итогу с Немотроном:

> На немотроне кума нет
> Ассистентотрон говно
> Вы просто не умеете его готовить
> Пресетонеосиляторы, рофлан-ебало
Аноним 15/07/25 Втр 20:48:44 1278362 227
>>1278058
>>1278059
Двачую этих, проорал.
И не заебало уже которую сотню сообщений эту херню обсасывать.
>>1278250
> нормально поставить две видимокарты
Тяжело. Ты бы указал какие, если там что-то 2-трех слотовое и не высокое как на 3м пике - вторая карточка без проблем зайдет в штатную щель для вертикальной установки а первая этому не помешает. Если гпу высокая - уже сложнее, тогда придется первую опрокидывать тоже вертикально с помощью кронштейна.
Другой вариант с размещением вдоль задней стенки здесь врядли реализуем потому что корпус короткий, места не хватит для нее.
> и 3 жестака 3,5
2 точно влезут, куда-нибудь подоткнуть 3й наверно получится но будет уже колхоз.
>>1278334
Еще весной.
Аноним 15/07/25 Втр 20:50:44 1278365 228
Аноним 15/07/25 Втр 20:55:42 1278369 229
>>1278283
Ну а что, немотрон ? Немотрон.
Аноним 15/07/25 Втр 20:57:31 1278371 230
>>1278284
>Судя по мержу она должна лезть в трусы до того как пользователь напишет сообщение?
На удивление пока не лезет =))
Хотя может дело в самой карточке, там почти не слова про кум.
Посмотрим как перса до дома доведу =)
Аноним 15/07/25 Втр 21:08:51 1278379 231
Подскажите анончики, что я не так сделал? В общем в терминале кобольда вижу инпут системного промта, потом начнется описание карточки и не заканчиваясь резко обрывается, за ним следуют история чата с нейронкой причем тоже не с самого начала, а где то с середины хотя контекст ещё близко не переполнился. Как контрить? Мб в таверне или кобольда есть настройка максимума кол-ва токенов отправляемых за раз, но я ее не нашел... Или же в терминале оно как то сжимается вырезая излишние фрагменты чтобы не насрать стеной текста, а по факту это все на модель улетело, просто я этого не вижу и зря панику развел.
Аноним 15/07/25 Втр 21:39:41 1278419 232
>>1278299
> Применил пресет от одного из анонов.
Можешь линкануть?
Аноним 15/07/25 Втр 21:50:36 1278429 233
Аноним 15/07/25 Втр 22:32:29 1278458 234
Анончики, кто пробовал llama4 scout, на сколько она хороша или плоха в рп и куме? Или может для других задач годится?
Аноним 15/07/25 Втр 22:36:20 1278461 235
Нейронщики, как вы лечитесь от перенасыщения и выгорания? Последние пару месяцев замечаю, что захожу подрочить на буковки чисто по ритуальному принципу, вроде как по привычке. Порнуху смотреть скучно из-за однообразия, новелки читать скучно из-за искусственной растянутости и того же однообразия сценок. Локалки вроде как раньше все нужды перекрывали, но теперь есть ощущение, что каждый сценарий это лишь вариация чего-то одного, просто справленная другими деталями. И даже на корпоратках эта проблема сохраняется, словно это не вообще не про ограниченность определенных моделей.

Пытался экспериментировать с карточками, со сценариями, пытался брать перерывы длиной в несколько недель вообще не притрагиваясь к нейронкам, даже по рабочим задачам, но этого хватает на разик другой.
Аноним 15/07/25 Втр 22:50:48 1278471 236
>>1278461
Никак. После того, как я понял ограниченность ллмок в принципе, перестал кумить на буквы. Это, в лучшем случае, как игра с большим количеством развилок. Какими бы ни были модели, через сотню-другую тысяч токенов ты уже знаешь паттерны и даже словарный запас модели. Это как рогалики: до поры-до времени интересно, но стоит прощупать большинство возможностей, и интерес угасает. Вернулся к додзинсям, нарисованным людьми до 2022 года. Никакого аи арта, только старания людей и душа. Нашел на одном трекере дамп какого-то сайта с додзями на терабайт, думаю, этого хватит надолго. Иногда, конечно, по настроению тыкаюсь и в ллмки, особенно когда выходят новые (ГЛМ вот приятно удивил в куме), но надолго меня не хватает, и каждый раз все менее охотно к этому возвращаться.
Аноним 15/07/25 Втр 22:55:41 1278475 237
>>1277474
>Но нахуя зумеркам, выросшим со смартфонами в руках всирать кучу времени на эту хуиту?
Да, им не нужно, разрешаю творить им полную дичь, не учиться и не жениться, мне же будет больше работы исправлять говно за ними и больше девок непорченных.
>>1277584
Решительно негодую. Пропали модели средних размеров, 70-100. Прям беда какая-то. Либо залупки 27B, либо мое-параша 1488B. Что за хуйня?
>>1277636
>И, да, AGI уже здесь.
Нет.
>Мы даже гипотетически не знаем, можно ли в кремнии создать полноценное сознание
Можно, как минимум эмуляцией мозга. Хотя да, текущий путь хуйня. Впрочем, как соотносятся сознание и ASI, я вообще не ебу, у себя походу случайно токены перемешались, чини токенайзер.
Аноним 15/07/25 Втр 23:05:39 1278481 238
изображение.png 153Кб, 2128x1132
2128x1132
>>1277659
>Ни АГИ ни АСИ нельзя сделать на трансформерах на базе ЛЛМ.
Можно, но трансформер займёт половину вселенной.
>>1277729
>Олды для треда, но полностью нюфани для борды.
Я олд в имиджбордах, поздравьте меня.
>>1277736
>А нехуй токсить на контект мейкеров, необучаемые долбаебы.
Толстит залётная жирнота из кончай треда, мы то причём.
>он и на весь тред проецирует его, и уходит.
Ну ебать нахуй, в 2025-м не знать специфику имиджборд, и вообще обижаться на посыл нахуй в интернете. Кстати, иди нахуй, ты слишком соевый, снежинка что ле?
>>1277739
Да. И я считаю, что 90% населения Земли это тупые НПС, а не люди.
>>1277746
>форумов с кармочками где все сидят с языками в жопах
Ох, помню я срачи на 4пда в срачетемах типа "гейфон vs роботодебилы" откисал в бане половину времени.
>>1277747
>а когда ты соглашаешься - "Готов ли ты? Точно готов? Не ну я сейчас начну действовать, а ты готов?".
О, чайная экспириенс!
>>1277760
>Как будто на моем пк - 128 гб ОЗУ, и карта 3090
Почти такое вот, и нет, я не буду запускать на этом хламе квен, жду денег.
>>1277779
>высказываешь предположения
Прочитал как "невысказанные предложения", хотел было написать, что антислоп несработал.
Аноним 15/07/25 Втр 23:06:18 1278482 239
LLM-ки вызвали у меня какой-то экзистенциальный кризис или лучше сказать приумножили его. Не могу описать это словами точно, но это ощущение отсутсвия смыслов нарастает. Сеймы есть?
Аноним # OP 15/07/25 Втр 23:11:40 1278484 240
Аноним 15/07/25 Втр 23:12:30 1278485 241
>>1278482
Есть. У меня были похожие мысли несколько месяцев назад. Со временем пришел к выводу, что LLM-ки так на меня влияют не потому, что это именно LLM-ки, а потому, что это идеальный способ эскапизма. Как будто бы можно вообще всё, нужно только захотеть. Со временем наскучило (я вот выше >>1278471), да и поправил немного жизнь, меньше захотелось эскапировать. Траву начал трогать, гулять, и куда-то эти мысли отступили. Я хронический депр, потому годами борюсь с этой проблемой. Могу разве что пожелать удачи.
Аноним 15/07/25 Втр 23:17:14 1278488 242
>>1278461
Проблема не в ллм а в тебе. Любое увлечение и занятие априори является ограниченным и унылым, если ты пытаешься получать от него "удовольствие по запросу" помня о хорошем прошлом опыте и заведомо рассчитывая что все будет хорошо просто потому что должно.
Нормализуй гормональный фон и остальную жизнь, траву потрогай, займись физический активностью и каким-то хобби завязанным на создание чего-то или околоспорт чтобы был явно виден прогресс. И сразу сценарии будут разнообразнее а все проблемы если не исчезнут то найдешь решение.
Аноним 15/07/25 Втр 23:18:36 1278490 243
>>1278461
Никак. Я давно сгорел на этой теме. Жду новых моделей и дрочу на фантазии о собственном AGI.
Аноним 15/07/25 Втр 23:38:58 1278503 244
>>1278485
>Я хронический депр
>борюсь
Сейм, анончик, сейм. Стараюсь выбираться а потом возвращаюсь на стартовую точку. Насчет высшей формы эскапизма прав, а вот поправить жизнь трудно конечно. Но другого путя и нет. Ежедневные физ активности и сон это минимум для нормального состояния.
Кстати только понял, что до этого тут написали
>>1278461 >>1278471 у меня в голове лорбук триггернул и я высрал свое >>1278482
Аноним 15/07/25 Втр 23:57:28 1278524 245
>>1278503
> Стараюсь выбираться а потом возвращаюсь на стартовую точку.
Этот луп страшнее любого лупа LLM-ки. Помню, четыре года назад обещал себе, что обязательно выберусь из этого. Но похоже, это навсегда. Хорошо, что ты понимаешь про сон и физ.активности, туда же питание, витамины, это невероятно, пиздецки как важно. У каждого своя история и свой ответ, анонче, главное в конец не опускать руки. Я свой пока не нашел, но и не сдаюсь.
Аноним 16/07/25 Срд 00:22:40 1278556 246
123.PNG 18Кб, 385x592
385x592
Бляяя
Аноним 16/07/25 Срд 00:26:24 1278561 247
>>1278556
А в тот ли тред ты зашёл?
Аноним 16/07/25 Срд 00:28:53 1278564 248
А в треде есть тяночки хотя бы внутри? Вы бы пошли ко мне на чаепитие, если бы я вскользь упомянул про наличие кум-рига? Заглинтили бы глазки от возможности катать милф квена и мистраля? Если нет, надо бы как-нибудь сделать такую карточку.
Аноним 16/07/25 Срд 00:41:47 1278576 249
попробовал вернуться с ламатюнов 3.3 70б на 35б-24б а это как чай с сахарозаменителем. Грустненько, потому что хочется скорость аутпутов поднять, а пути назад нет будто.
Аноним 16/07/25 Срд 00:54:23 1278597 250
Аноним 16/07/25 Срд 02:01:44 1278632 251
>>1278564
> как-нибудь сделать такую карточку
Скидывай если сделаешь, только чтобы бедрами прилично размахивала.
Аноним 16/07/25 Срд 03:29:50 1278658 252
>>1277636
> но на деле никакого AI тут нет
Ты знаешь, я вот пытаюсь языки изучать, и заметил, что, в общем-то, процесс воспроизведения какого-то текста на чужом для тебя (но изучаемом тобой) языке, а так же чтения иностранных текстов (с долей неизвестных тебе слов) на самом деле очень похож на работу нейросети. Подбор каких-то смысловых единиц, тоже какое-то подобие токенизации, только основанное на понимании тобой грамматики и эмоционального тона.
Аноним 16/07/25 Срд 06:47:19 1278699 253
>>1278556
похуй отрефакторил что надо, халява не бесконечная но приятно
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов