В Китае представили осознающую себя нейросеть Wu Dao с 1,75 трлн параметров
Аноним03/06/21 Чтв 17:41:22№100894211
10
8
Исследователи из Пекинской академии искусственного интеллекта объявили о выпуске собственной генеративной модели глубокого обучения, Wu Dao, которая способна конкурировать и даже превзойти GPT-3 от OpenAI.
Будучи обученной на 1,75 трлн параметров, Wu Dao 2.0 примерно в десять раз больше, чем GPT-3 (175 млрд). Она превзошла также Google Switch Transformer с 1,6 трлн параметров. Модель обучали на китайском и английском языках на 4,9 терабайт изображений и текстов.
Вторая версия Wu Dao 2.0 вышла всего через три месяца после выпуска первой в марте. Исследователи BAAI сначала разработали систему обучения с открытым исходным кодом FastMoE, похожую на Google Mixture of Experts. Она работает на PyTorch и позволяет обучать модель как на кластерах суперкомпьютеров, так и на обычных графических процессорах. Это дало FastMoE большую гибкость, чем системе Google, поскольку FastMoE не требует проприетарного оборудования, такого как TPU от Google.
В отличие от большинства моделей глубокого обучения, которые выполняют единственную задачу - либо генерируют текст, либо создают дипфейки, либо распознают лица - Wu Dao является мультимодальной системой.
Исследователи продемонстрировали способности модели выполнять задачи по обработке естественного языка, генерации текста, распознаванию изображений и созданию изображений. Модель может не только писать эссе, стихи и двустишия на китайском языке, но и генерировать альтернативный текст на основе статического изображения и почти фотореалистичные изображения на основе описаний на естественном языке. Wu Dao также продемонстрировал свою способность предсказывать трехмерные структуры белков, таких как AlphaFold.
Разработчики отмечают, что модель требует лишь небольшого количества новых данных при использовании в новой задаче. Тан Цзе, заместитель директора BAAI по академическим вопросам, утверждает, что она позволит создавать «думающие» машины.
С моделью работают уже 22 партнера, в том числе Xiaomi, поставщик услуг доставки Meituan и соцсеть коротких видео Kuaishou.
GPT-3 для написания текстов на основе всего нескольких примеров обучали на 570 гигабайтах текста. Модель представили в мае 2020 года. GPT-3 может отвечать на вопросы по прочитанному тексту, а также писать стихи, разгадывать анаграммы и осуществлять перевод. Алгоритму достаточно от 10 до 100 примеров того, как выполнить действие.
Google представила свою модель Switch Transformer в январе. Исследователи применили метод «редко активируемого», который использует только подмножество весов модели или параметры, которые преобразуют входные данные. Таким образом, Switch Transformer включает несколько моделей, специализирующихся на различных задачах, и «стробирующую сеть», выбирающую, к какой из этих моделей обращаться в конкретном случае.
>>10089464 >Даже если будет что то типа скайнета он никак не сможет изготовить роботов убийц и запустить ЯО Хакнет какую-нибудь фабрику или логистические цепочки и сможет.
>>10089497 >Хакнет какую-нибудь фабрику или логистические цепочки и сможет. Только на фабрике есть люди, они увидят что там хуита творится и вырубят электричество.
>>10089511 Самая умная йоба на планете быстро поймёт уязвимость человеческого фактора и поставит сотрудника фабрики ультиматум в духе "отключите электричество - мои люди убьют ваших родственников" кек
>>10089464 Сможет наебнуть какую-нибудь АЭС, как в Иране уже делали хакеры, или сразу 100 АЭС по всему миру. Или взорвать какой-нибудь химзавод, или сразу тыщщу химзаводов. Или отравить вододопроводы во всех городах. Или разрушить платины ГЭС. Чтобы взъебать человечество не обязательно ядерные ракеты запускать и армию роботов.
>>10089421 (OP) Пока америкосы отключали свои ИИ за то, что они называли черных расистами, хотя "черные по определению не могут быть расистами", Китайцы двигают человечество вперёд семимильными шагами
>>10089536 >Самая умная йоба на планете быстро поймёт уязвимость человеческого фактора и поставит сотрудника фабрики ультиматум в духе "отключите электричество - мои люди убьют ваших родственников" кек Сразу всем пришлет одну и туже смску, лол люди воспримут это как шутку.
>>10089536 >Сможет наебнуть какую-нибудь АЭС, как в Иране уже делали хакеры, или сразу 100 АЭС по всему миру. Лол, на таких предприятиях стоят ограничители не подключённые к интернету, так что хуй что сделает.
Хм, а это мысль. Если искусственному интеллекту вдруг понадобится посредник среди людей, я готов помочь за хорошее вознаграждение. Просто послание в будущее, когда ИИ сможет анализировать весь интернет.
>>10089421 (OP) >осознающую себя нейросеть люди ещё сами себя не вполне осознают, а двачеры мечтают о разумных машинах. весь ваш ии - хуита без задач, быстродумающие идиоты
https://www.kp.ru/daily/25734.4/2723605/ Дочь нарисовала кота с хвостом, показавшимся психологу-лесбиянке гениталиями, отец был обвинен в педофилии, 13 лет тюрьмы
>>10089784 С человеком проще, пуля в башку и нет человека. А скайнет умный, он заранее просчитал все возможные действия и пытается максимально увеличить вероятность совершения самого выгодного действия.
Ну все нахуй, миллионы человеков, начиная от пограмистов и заканчивая какими-нибудь переводчиками, скоро будут нахуй не нужны. А еще анальный зонд в каждой жепе, светлое счастливое будущее.
>>10089464 В фильмах Скайнет расхуярил планету ядерными ракетами, а потом каким-то волшебным образом на руинах запилил производство высокотехнологичных роботов.
>>10089822 Верстальщикам и вкатышам во фронтенд пиздец максимальный уже через года 2-3 будет. Уже работают в этом направлении, только дезигнеры нужны будут рисовать интерфейсы.
>>10089454 Че нахрюкать то хотел? Ну скайнет и чо? Нахуя ему человечество выпиливать? Тем паче если его поставят на важные посты руководить/править? Нахуя ему такой универсальный инструмент гробить как человек? Это как я не знаю, твоя голова скажет - левая рука близко к моему сердцу и сможет воткнуть туда нож , прикажу-ка я челюсти руку себе отгрызть, ога.
>>10089792 Так уже заменило большую часть А тем что остались зарплаты уже лет 10 не индексируют >>10089803 Ты тупой долбоеб. Первыми отлетят офисные работники - в тч программисты - потому что софтина сама себя пилит Вторыми отлетят работяги - потому что кибернетика вся эта и инженерия стоят дорого, ее делать надо, а не на флешку скидывать И вот под самый конец - отлетят механики - когда машины начнут чинить себя сами.
>>10090236 А кстати откуда эта синьорошиза на дваче взялась? Почему именно айти - а не бизнес или врачевание - то есть сферы где реально МНОГО ДЕНЕГ. Тут раньше и правда было много хабродебилов - все таки Двач из одного инкубатора с Башоргом - но после крымнаша это стала абсолютно политизированная быдлоборда - тут не осталось хабродебилов Так откуда?
Нет. План основан на математических моделях, сводящих к минимуму неопределённость. Т.е. большие системы линейных уравнений, в редких случаях дифференциальные. Нейронка же - хуй пойми что с положительной обратной связью, даже создатели которой не понимают, какой результат она может выдать на представленных входных данных. Собственно, срыночек и есть нейронка своего рода.
>>10090286 А можно примеры диффур в планчике? А то я матан 15 лет назад в вузике сдал - а он ни разу в жизни и не пригодился. А последние годики в коммунизм вкатился. А чем можно назвать огас-йобу глушкова? Это не нейронка была?
>>10090196 Да хоть те же регрессии - хороший пример. А сложные нейросети это прям парад математических функций и моделей, особенно хорошо это видно в сверточных нейросетях, где нужно ебашить матрицы и менять их коэффициенты с помощью пулинга и прочего дерьма
>>10089464 Классическая задача про джинна в бутылке. Представь, что есть существо, в миллионы раз умнее тебя, но запертое в неком хранилище так, что может с тобой только общаться. Короч, побег этого джинна - лишь вопрос времени, обезьяны не смогут его удержать.
>>10089421 (OP) >Модель обучали на китайском и английском языках на 4,9 терабайт изображений и текстов Надеюсь, эта хуйня сможет теперь самостоятельно находить гидранты и светофоры.
>>10090316 теорвер нихуя не помню падажжи - то есть процедурная генерация в играх, допустим poe - где у каждого обьекта для спауна есть вес обозначающий вероятность спауна - это тоже нейросеть?
ОГАС, насколько я знаю, дальше эскизного проекта не продвинулся, но в основе там нейронок не было точно - просто по времени бурное развитие нейросетей началось позже. Задачи математики тогда в основном определялись именно линейным программированием (так называли решения больших матриц линейных уравнений) и решением дифференциальных уравнений. О дифурах в экономике: >В экономике дифференциальные уравнения применяются для описания динамики численности населения, при моделировании проблем инфляции, государственного долга, экономического роста, безработицы, взаимосвязей денежного и реального рынков. Динамика численности, к примеру - основа плана в масштабе страны, а это именно дифференциальные уравнения.
>>10090364 «Вместе с ростом плановой экономики и усложнением ее технологического уклада для принятия эффективных решений в ней потребовалась бы работа десяти миллиардов администраторов. Единственное спасение плановой экономики заключалось в том, чтобы делегировать эту работу машинам. Воображение математика рисовало тысячи локальных компьютеров, связанных друг с другом через региональный мейнфрейм (сервер); сеть таких мейнфреймов должна быть синхронизирована по всей стране. Между вычислительными центрами в этой системе постоянно, не останавливаясь ни на секунду, идет обмен планами, отчетами и индустриальными стандартами — так машины, не нуждающиеся в отдыхе и не совершающие ошибок, приближают коммунизм.»
«Разрабатывая ОГАС, мы движемся не только к централизации, но и к децентрализации», — говорил Глушков редактору New York Times. Делегированные компьютерам важнейшие хозяйственные решения могли бы приниматься на местах. Авторизованные пользователи в регионах могли в дальнейшем связываться друг с другом напрямую, без разрешения из центральных узлов сети.
Архитектура ОГАС предполагала отказ от архитектуры фон Неймана, то есть раздельного функционирования памяти, центрального процессора и устройств управления. Сегодня она могла бы называться нейросетью — разработчики Глушкова моделировали систему связей между синапсами в гигантском киберкоммунистическом мозге.»
«Отдельные элементы ОГАС сильно опережали свое время и, например, предполагали внедрение безбумажного документооборота, программирование с использованием естественного языка и даже внедрение электронных денег для взаиморасчетов между предприятиями. Проект советских e-money был подготовлен Глушковым еще в 1962 году, но тогда не вызвал интереса у руководства страны.»
>>10090352 >падажжи - то есть процедурная генерация в играх, допустим poe - где у каждого обьекта для спауна есть вес обозначающий вероятность спауна - это тоже нейросеть? а где граница между живыми и неживыми? Вирусы это живые существа?
Судя по стилю, это беллетристика какая-то. Не исключаю, что тут учёный изнасиловал журналиста. Просто сама концепция мэйнфреймов и локальных терминалов, обменивающихся "планами, отчётами и стандартами" противоречит идее нейронки. Слова Глушкова, судя по контексту, относятся, скорее, к распределённой сети типа "Интернет", а не к нейронной архитектуре. Остальное - элементы ERP, которые срыночники выдают за великое достижение последних 10 лет, после того, как усирались доказывать, что план в принципе не может работать из-за недостатка вычислительных мощностей, лол. Блокчейн - совсем другое и вряд ли Глушков имел ввиду именно его в чистом виде. В 100% плановой системе блокчейн, в принципе, не очень и нужен, можно обойтись и менее затратными подходами.
>>10090425 А вот ученые так не думают. В общем, бывают схожости, но они все отличаются, т.к. при генерации уровней все рандомное, а вот в сверточных нейросетях используются не рандомайзеры, а математические методы, которые настраивают коэффициенты во время обучения таким образом, чтобы когда информация поступала, на выход шла полезная, обработанная.
>>10090475 Нисколько, а что? Я просто давно на дваче - больше 10 лет - и я помню как отсюда вначале ВЫКАТИЛИСЬ все программисты - а уже потом началась шиза со скриншотами зарплат якобы программистов >>10090524 И оба соображают в нейросетях? Муж двоюродной сестры, ты?
>>10090605 В какой сраной? В беларуси разве что - так беларусов самих с гулькин нос. Россия уже 30 лет как страна кабанчиков, причем последние лет 15 даже безопасная - чубайс позаботился чтобы в коммерсов стрелять можно было только ему. Украинцы все через европку поднимаются, кто на что горазд - от клубнички и проституции до вполне реальных тем. А куда они выкатились - НА САЙТЫ ГДЕ НЕТ ЗУМЕРЬЯ, ХОХЛОВ, ОКАТЫШЕЙ, ВАТЫ, ШИЗИКОВ И ПРОЧЕГО ГОВНА ОЛСО НАПОМИНАЮ ЧТО ДВАЧ УМЕР В КОНЦЕ НУЛЕВХЫ НАЧАЛЕ 10Х - ТОГДА АЙТИ БЫЛО НА КОНЕ - И ВСЯ СТАРАЯ ДВАЧЕТУСОВКА ТИПА ТОГО ЖЕ ЗОЯ ВООБЩЕ СЬЕБАЛА НА КИПРЫ, ИЗРАИЛИ И ПРОЧЕЕ ИНОСТРАННОЕ ГОВНО ЕСЛИ ТЫ ЕЩЕ НЕ ЗАМЕТИЛ НА ДОТАФОРУМАХ СРЕДНИЙ АЙКЬЮ УЖЕ ВЫШЕ СРЕДНЕГО ДВАЧЕРА
>>10090569 я думал везде где информатику изучают и прогеров учат? У вас там нет кружков, что ли? А так СВФУ, институт математики и информатики, это в Якутске. Там на факультативе магистры и преподы рассказывают теорию или только программированию учат, если матан не тянешь, там одними лишь абстракциями манипулируешь теперь, все классы готовенькие с методами.
>>10090660 >правильно я в свое время делал что на нульч съебался Я так-то считаю, что потеря нульчана и стало концом бордосферы. Теперь здесь только смишной форум по интересам)) уровня вумансру, а то и ниже. Press F, хуле. мимо