..но не знаю в каком направлении копать. Очевидно, что программа должна анализировать текст по частям речи и по роле в предложении. И если первое понятно, пишется просто и приятно, то второе это одна большая задница. Мне советовали читать про семантические сети, однако как полученную ценнейшую информацию использовать я не знаю.Программа должна переводить с эсперанто (однако в перспективе с любого языка, это зависит от первой части) на русский. В качестве языка написания выбран Haskell, но это не критично.
>>1037014 (OP)Тебе в тред машинного обучения.
>>1037033Интересуют классические алгоритмы
Гугли Natural Language Processing, в тырнетах много литературы, по абстрактам ясно подходящее или нетЕще могу посоветовать почитать что-то по компиляторам (тех же ахо\ульман) или попросту чужой код на этих ваших гитхабах
>>1037014 (OP)https://nlp.stanford.edu/На русский я, ясное дело, не стал бы переводить, а начал бы с английского - русский слишком сложен.
>>1037091Английский уныл, да и б-гмерзкие артикли присутствуют. Да и жесткий порядок слов неясно, плюс это, ил минус. В таком случае лучше всего переводить с любого языка на эсперанто, он очень простой.
>>1037116Артикли в английском как раз несложные, это просто сокращение слов this (этот, данный) и another (другой, какой-то, некоторый). Они позволяют делать некоторый семантический анализ для понимания контекста.Эсперанто как самый простой лучше сделать базовым языком системы перевода, и на нем вести словарь. При переводе с одного языка на другой делать перевод на эсперанто и обратно.В последних версиях Промта использовались разные словари для разной тематики, и при правильном выборе он переводил неплохо. Но сам определять тематику, анализируя текст, не умел.
>>1037138> это просто сокращение слов this (этот, данный) и another (другой, какой-то, некоторый)That и one, если отталкиваться от этимологии.
>>1037014 (OP)>И если первое понятно, пишется просто и приятноЛол, "течь" это какая часть речи?