Вот уже почти 4 года я занимаюсь разработкой и обучением нейронных сетей. Сейчас в команде уже 6 человек, некоторые живут не в России, но костяк находится в Москве, так что наше ПО можно считать российским. Поэтому и чатбот, которого мы разработали, говорит по русски.
На мой взгляд, довольно тяжело отличить его ответы, от диалога с живым человеком.ПодробнееНельзя сказать, чтобы наш подход никогда ранее не пытались использовать, хотя мы уверены, что добились в этом достаточно впечатляющих успехов. В первую очередь, когда вы пишите какое либо сообщение, оно проходит через семантический анализатор. Ничего особо нового мы тут не придумали, подобные системы используют поисковики для целых фраз поисковых запросов: буквы в словах кодируются числами и эти числа становятся координатами вектора в воображаемом многомерном пространстве. Мы проверяем, совпадает ли вектор с уже имеющимся в базе, если да, то все норм, слово передается "как есть", если нет - смотрим, какой вектор можно считать наиболее близким к искомому. Это позволяет быстро исправлять различные очепятки, которые ставили в тупик первых виртуальных собеседников, т.к. слово с неправильной буквой они считали совершенно новым, незнакомым им словом.
Понятно, что если вы напишите нечто вроде "лдаолпр" робот вас не поймет. Но справедливости ради, человек это тоже прочитать не сможет.Потом готовое предложение, прошедшее через анализатор и исправленное, передается обученной нейросети. Тут и происходит основная "магия": сетка составляет в процессе обучения слова в специальную базу знаний, которую также можно редактировать вручную. Эту идею мы позаимствовали у Cyc (слово английское, читается Сайк), как и их синтаксис, выглядит запись примерно так:(#$isa #$Путин #$Президент России) \;Сеть учится оперировать не каждым словом в отдельности, а системой понятий. Все зависимости, характерные для группы понятий, приобретает каждое новое слово, после объяснения его значения. Это позволяет сократить время на обучение новым словам, нам не нужно прогонять через сеть тысячи примеров использования слова "человек", напр, чтобы она начала его использовать. Достаточно объяснить его значение простым языком 1 раз, робот может задать несколько вопросов, чтобы уяснить для себя все зависимости и прописать слово в базе знаний. Такая форма обучения ближе к естественному запоминанию человеком, чем привычное машинное обучение. А обилие современных словарей позволяет обучать его довольно быстро.Модель поведения можно менять прогоняя сеть на специально подобранной выборке. Таким образом, например, можно научить его копировать стиль сообщений какой нибудь известной личности, логи переписки с которой у вас есть. Чем больше выборка - тем более похожим на оригинал станет поведение бота.Кроме того, он помнит контекст, если вы в начале беседы скажете, что купили красную машину, а потом сообщите, что ваша машина синяя, робот может спросить: "Так у тебя 2 машины?"
Что мы собираемся с этим делать?Сейчас этот робот довольно бесполезная приблуда, он умеет вести диалог с пользователем, но этого мало. Мы хотим сделать свой аналог Siri и ему подобных электронных помощников. Только с более прокачанным пониманием естественного языка. Наша цель - создать робота, с которым вы сможете общаться как с живым человеком, а также просить его выполнять различные поручения, отвечать за вас на письма и сообщения, и все в таком духе. Он даже сможет копировать ваш стиль общения и, например, поздравлять всех 2000 друзей в соцсетях (или сколько у вас там) с днями рождения или еще какими праздниками. Будет помнить ваше расписание, и если вы едите пиццу по четвергам - сам договорится о доставке к вашему приходу с работы. Ну и все в таком духе.Также мы разрабатываем конструктор, который позволит использовать робота на различных веб-проектах для диалогов с пользователями, без привлечения труда людей. Мы постараемся не дать возможности для незаконных действий вроде спам-рассылки, попрошайничества, вымогательства и всего такого. Если вы его об этом попросите - робот откажется.А сейчас мы проводим бета-тестирование: мы запилили тест Тьринга для своего робота. Любой желающий может зайти на специальную страницу, и пообщаться с незнакомым собеседником. Мы же соединяем либо 2-х пользователей между собой, либо пользователя с роботом. По окончании диалога спрашиваем, был ли собеседник роботом по мнению пользователя. А сами сидим скрестив пальцы и надеемся, что процент людей, догадавшихся, что общались не с человеком будет не выше ложных срабатываний, когда пользователь посчитает роботом другого пользователя. Понятно, что мы потом отфильтруем диалоги, слишком короткие из выборки удалим, оставим только те, на которых вывод был сделан не "с потолка". Т.к. робот не умеет в распознавание картинок, то мы добавили хитрость: он может такую просьбу переадресовать другому пользователю, с которым ведет диалог в настоящий момент, а его ответ переслать человеку, изначально задавшему вопрос.
>>160176879 (OP)Планирую вкатиться, щас учусь на робототехника.С чего начать, шельма? Хайкин "Нейросети: полный курс" подойдёт? Накинь инфы про способы реализации, задачки там, ещё хуету какую.Кит для чайника короче
Заебись, а этот робот сможет вместо меня ходить на работу?
Все диалоги мы записываем для анализа, они также будут представлены общественности, можно будет почитать, как проходил тест, а если вам нужна обучающая выборка подобных диалогов для обучения собственной нейронной сети - будет возможность скачать все диалоги в .txt формате.Для желающих убить время проводя тест Тьюринга для нашего робота (и тем самым помочь нам его разрабатывать) вот ссылка на страничку теста: http://neuronic.ru/test.htmlТе, кто еще и на группу вк к нам подпишется - впоследствии получат своего робота-помощника на 1 год бесплатно
Запустите его клянчить в вк 10 рублей на еду, и через неделю вам денег до конца жизни хватит.
>>160177100С некоторой вероятностью сможет. Ещё и зарплату вместо тебя будет получать
>>160176879 (OP)Хуле вы там эту ссанину 4 года писали?
Удачи че, я мимо-долина-нлп-кунбольшие успехи в этом деле обсуждались недавно на закрытых бордах по нейросетям. 1. сделали чат бота который просит задонейтить денег, за 2 дня собрали $15k2. сделали бота который раскручивал девок на интим фото, провели эксперимент на 2к выборке 43% успех. Так что бросайте херню с Меркель, есть другие темы. Слотфиллинг вам в помощь)
https://www.slideshare.net/KonstantinSavenkov/nlu-intent-detection-benchmark-by-intento-august-2017
>>160177095Смотря чего ты хочешь. Если конструировать свои - тут дофига нюансов, если поиграться хочешь - в сети полно готовых исходников, с подробными мануалами по обучению, имхо для большинства пользовательских задач, не разрабатывая промышленные образцы, тебе этого хватит из коробки.
>>160177334не эту. 4 года я вообще этим занимаюсь, а так, там много нюансов, прежде чем создашь что-то более менее удобоваримое, выкинешь половину наработок
>>160177423>1. сделали чат бота который просит задонейтить денег, за 2 дня собрали $15kА в каком именно чятике они бота запустили? И что за борды по нейросетям? Намекни хотя бы.
Оп, а я делаю чатботы уровня б.У меня был интерес сделать что-то подобное для разговоров максимально похожих на человеческие. Можешь подробнее объяснить про эти вектора?Что почитать?хотя есть ли в этом смысл, нет ни мотивации, ни условий для созидания
>>160177135Пиздец, заставил меня общаться с людьми с япа и пикабу. Пошел нахуй
>>160178729https://www.facebook.com/notes/leelooai-%D1%81%D0%BD%D0%B3/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-%D0%BE-%D0%BE%D0%BF%D1%8B%D1%82%D0%B5-%D0%B2-180k-%D0%B7%D0%B0-2016%D0%B3/1759955694295723/
Привет, ОП. Меня заинтересовал твой проджект. Это чистая нейронка?
>>160179132наебалово
>>160179180В чем же?Вот, я собираю команду для написания комбинированного чатбота с одновременным юзом шаблонов и нейронки. Пока только архитектура на голой бумаге и первые наработки с контекстами на пихоне.
>>160176879 (OP)Хуй то отсасываешь, надеюсь?
>>160176879 (OP)С ним можно поговорить? Тоже недавно хотел пытаться в чатбота, почитал инфу и понял, что для полноценной беседы боту нужно какое-то сознание или его аналог, чтобы он не просто твердил зазубренные фразы, а мог вести диалог из нескольких фраз, разбирал контексты, эмоциональную окраску и тд. А это реализовать никак не получится на данном этапе развития технологий.
>>160177010Ну расскажи тогда как это работает. Как нейросеть устроена, что на входе и выходе и все такое.Или хули ты вообще приперся?
>>160179714 и еще>буквы в словах кодируются числами и эти числа становятся координатами вектора в воображаемом многомерном пространствеКакая-та упоротая у вас лемматизация, может ты имел ввиду слова в предложениях?
В общем и целом ботов там не было. Кикало раз 20, было несколько собеседников и все живые аутисты. Потом вообще крашнулся чат.Наебало/10. Сириусли, тат тупо травят двоих людей, выставляя это за тест тюринга. Думаю, кто-то получит неплохие инвестиции
>>160176879 (OP)Ни одного агента бота не встретил. ОП, зачем наебываешь?
>>160180200бампаю этого гражданина, ботов не было
>>160180230До краша можно было воспользоваться чатом, как обменником ЦоПэ, но нет.
Ну а вы что думали, крупнейшие компании мира не могут создать "умного" бота, а дебил по кличке ОП взял и написал такого? Ну уж нет.
>>160176879 (OP)Ссылку-то дай на бота, анон его научит всякому.
Оп тут или нет?
Бот смог прожить всего 40 минут. Сорри, ушел чинить.
>>160180409>>160177135
Двачеры одолели тупую машину! Аве аноны!
>>160180513Если разрешишь обмениваться цп через твой чатик, то мы, двачеры, поверим, что там реально есть бот.
>>160179352Спорим, я тебя сдиваноню?
>>160180610Армянская ты моя душа.
>>160180646Я с акцентом спросил чтоли?
Бля, нравилось с людьми разговаривать, жаль все наебнулось так быстро
>>160180671>нравилось с людьми разговариватьОткуда здесь этот поехавший?
Инвестициями интересуетесь?
>>160176879 (OP)>4 года проебать на разработку чат бота на русскомя сейчас подавился чаем когда прочиталпросто какого это осознавать что ты проебал 4 года в никуда?даже без нейронных сетей анализировать текст на семантику умели еще в 90есейчас же любого бота ты можешь сделать за неделю просто залив в него тысячи диалогов
>>160178932Будто здесь ты не занимаешься тем же самым
>>160177909Я не он. Там использовались акки от социальных сетей.
>>160179352Зачем собирать команду если ты можешь сам это написать?
>>160181073Да
ОП, если ты еще здесь - добавь джаваскриптовое подтверждение при рефреше/закрытии вкладки
Сайт делал школьник за 100 рублей? Что за говно блядь, пиздос.
>>160181536это говно делалось 4 года, имей уважение к макакам
>>160181553говно по разводу на деньги. Люди сами с собой общаются.
Я в глаза тарабанюсь или бот действительно лежит и потестить его не получится?
>>160176879 (OP)какая-то хуйня, сразу палится что робот
>>160181668даже если не палится, то все равно говно без задач
>>160178729Охуенно. Такое есть на шиндошс?Алсо, ОП, а у подобных ботов может быть что-то вроде личности? Допустим вот этот анон сказал боту, что у него есть кот и котенок.
>>160181743>Охуенноэто самая хуевая реализация, которую я виделтакое даже на втором-третьем курсе любой студентик может запилить
>>160176879 (OP)Двач вашего бота положил.
>>160181823Да я не про реализацию, а про сам замысел.
>>160181910понимаешь он вместо допусти команды timeпереименовал бы ее what time is it? это тоже самое, это даже хуже мимикрии.
>>160181743А у тебя есть что-то вроде личности? Не спеши отвечать и обвинять меня в пристрастии к псевдофилософии. Ведь наша личность это и есть такой бот, который обучается и просто выдаёт заготовленные ответы.
>>160176879 (OP)Ну пили асечку\писечку На каком принципе основано его обучение?
>>160177010> аналог SiriЭто говнецо
>>160177149>Запустите его клянчить в вк 10 рублей на еду, и через неделю вам денег до конца жизни хватит.Лол А ещё лучше на сам проект.
>>160182041>нейросети>на каком
>>160181944Хуево. Я думал у него жто как-то более продвинуто.>>160182011Ну ты и грубиян. А могут ли мощности современного компьютера обеспечить поддержание этой личности? Можно ли уже говорить об осознании себя машиной?
>>160180513>Бот смог прожить всего 40 минут.Хули он сдох?
>>160176879 (OP)тест
>>160181205>даже без нейронных сетей анализировать текст на семантику умели еще в 90е>сейчас же любого бота ты можешь сделать за неделю просто залив в него тысячи диалогов+ не понял в чём новшество
>>160182131Двачеры заебали, я бы тоже не выдержал.
>>160182123>>нейросетиТак прям нейросети или как обычно?
>>160182130Думаю пока обычные компы слабоваты.
>>160182130>об осознании себя машиной?Поясни зачем эта хуйня?Вот у тебя есть человек - результат эволюции и имеющий еще бесконечное число изьянов.И ты вместо того что бы создавать что то без изьянов пытаешься создать подобие.Хочешь воссоздать человека - кончи в самку. Что касается мощностей. То они нужны не конкретно в его функционировании, а на этапе обучения.
Загадку про А и Б наверно задали. Оп, напиши как поломали то
>>160182182Я не ОП. Но в чем проблема их использовать? Сейчас куча библиотек в открытом доступе. Да и свою запилить довольно просто
>>160182184А вопрос с сознанием? Какие варианты развития будут, если машины осознают себя? построим флотилию и съебем в космос?
Я недавно одного чат бота чуть не убил тем, что назвал 2020й год датой своего дня рождения.
>>160182207Т.е. по твоему у идеального существа нет сознания?Алсоу, как нейросеть может стать идеальным существом, если она обучаетчя на людях или на их работе.
>>160182268>Алсоу, как нейросеть может стать идеальным существом, если она обучаетчя на людях или на их работеПохуй на идеал, если ты все равно не найдешь отличий от реального человека.
тетс
>>1601822681. Сознание и осознание - это разные вещи. 2. Нейросеть сначала будет обучаться на людях, потом уже сама на себе. Это стандартный прием обучения тащемта.
>>160176879 (OP)Переключайся на биткойн, предсказывай курс
>нейронные сети, пок-пок-покЧому сейчас каждый второй даун орёт, что занимается машинным обучением, а на деле не знает даже что такое слйчайная величина и всё что делает - это копипастит код с туторилов?
>>160182529потому что этот код работаета ты допустим знаешь сколько словоформ у глагола "идти"?
>>160182658На хуй.
>>160182529>каждый второйНу давай обсудим тобой написанное. Я окончил ВМК МГУ и были как курсовые так и диплом связаны с эвристическими алгоритмами, распознаванием и т.д. Ознакомился по теме со всеми лекциями в МИТ, Калтехе, общаюсь с лекторами и профессорами с http://ctn.uwaterloo.ca/Про тезорфлоу, опенаи и прочую хуйню даже не стоит упоминать. И тут выползает чмоха вроде тебя и рассказывает что я не смогу пояснить за случайную величину.
>>160182816>эти кукареки восторженного школьника, нахватавшегося баззвордов>вмк закончилНу охуеть теперь. Ребята защищают кандидатские и задротят статьи и не знают, что можно просто закончить шарагу, проебавшись 5 лет на всратой кафедре со старперами, посмотреть пару энтрилевельных туториалов на курсере и быть ДАТА-САЕНТИСТОМ.Ты там knn по памяти напишешь, машинный обучатель мамкин?
>>160182891>knn по памятиимплаинг я его мог забыть алсо>Ребята защищают кандидатские и задротят статьи проиграл с этого высера знатноладно, чмоха удачи я сьебал
>>160182957>пук-пук-пукЯсно. Как и ожидалось.
>>160182972ты же понимаешь что knn к нейросетям имеет такое же отношение как тригонометрия к гомотопиям
>>160176879 (OP)где скочать??? хочу в телеге запустить чтоб угорать над даунами!!
В общем, завтра создам второй тред, с некоторым пояснением, сейчас бот лежит, раньше завтрашнего вечера он не проснется.
>>160182225>библиотек Работа с готовыми предложениями как правило не очень нейросеть.
>>160183042Поугарал тебе защеку
>>160183047>раньше завтрашнего вечера он не проснется.Что случилось то? как ты его сломал?
>>160176879 (OP)А разрабатываете вы на иностранных компьютерах
>>160183047Лучше поясни как вкатиться в машинное обучение, а то заебал энтерпрайз.
>>160183887>А разрабатываете вы на иностранных компьютерахМожет они на Мастерах разрабатывают?
Ее
>>160177010я желающий, куда зайти початиться можно?
>>160176879 (OP)На чем пишете? Очень классно было бы поработать у вас. Хотя бы за идею. Интересна эта тема
>>160177135Это было настолько ожидаемо что я даже не разочарован
а вот и пердолики пожаловали. чмохи ебаные в очочках и с хвостиками, баб только на картинках видели. Любого из вас при встрече на улице ушатаю с 1 удара.