Сап двач! Я знаю что ты не моя личная армия но не могли бы бывалые кодеры помочь с одной задачей. задача такая, Я использую Google vision для распознавания текста и он мне возвращает весь отсканеный текст и каждое слово отделно в таком формате {"description"=>"TOTAL","boundingPoly"=>{"vertices"=>[{"x"=>577, "y"=>809}, {"x"=>612, "y"=>809}, {"x"=>612, "y"=>817}, {"x"=>577, "y"=>817}]}}, {"description"=>"$4096.99", "boundingPoly"=>{"vertices"=>[{"x"=>636, "y"=>805}, {"x"=>685, "y"=>805}, {"x"=>685, "y"=>817}, {"x"=>636 "y"=>817}]}} (не уверен как макаба покажет все это по этому гист тута https://gist.github.com/anonymous/39d28fa4b9b83f8c771d61b4b587e16c) так вот. тут два слова которые я должен получить в результате. Я думаю что я каким то обазом долежн сопоставлять boundingPoly . Мы смотреть какие слова с тоталом в одной линии и смотрим цыфры ли это и если да то берем. Проблема что 'Шума' те таких хешей ну на каждое слово ну там сами представляете. Так вот есть ли какие то бестпрактисы к этой задаче? В замен отвечу итт ньюфагам на любые вопросы о фрилансе и о программировании. Сори что в б ибо трубы горят.
Бамп
Bump
cmooon 2ch.
>Проблема что 'Шума' те таких хешей ну на каждое слово ну там сами представляете.Перефразируй плес. Три раза прочитал - не понял что ты хотел сказать.
>>131380484 (OP)Т.е. ты хочешь что пека за тебя убирала шум из распознанных данных? Да ты ахуел
>>131381927извини написал как идиот. моя задача сопоставить Total и цифры напротив . но помимо этого там куча других слов , и к каждому слову хеш я назвал это шумом
>>131382058Я знаю что такое Json причем тут это. >>131382242Nope. я думаю что по координатом можно сопоставить Total со значение . но но хочу спросить у двача как это лучше сделать
>>131382245Total это распознанное слово? Т.е. сопостасить распознонное слово и его координаты?
>>131380484 (OP)я нихуя не понял что ты хочешь.нормально можешь написать?
>>131382633>>131382676нет . сопоставить слово Total со значением напротив
>>131382710что значит>сопоставитьБЛЯДЖ?
>>131382384Попробуй искать на коротком расстоянии.Ебани словарь из координат и значения.Бест практиз тебе хуй кто сюда завезет. Никто не делает это 7 раз в неделю.Сьеби вообще лучше на стековерфлоу.
>>131382772Я должен получить значение напротив total
>>131382710Теье только координаты рассчитывать. Причем молить аллаха что в распознанных данных сканируемая область была горизонтальна. Если, конечно, нельзя както восстановить векторный поворот.Алсо, гугли "обработка координат". Может найдешь чтото не пиздецовомедленное
>>131382900смотри объект справа от тотала и на той же линии. если это число то все норм.хотя если скан кривой то хуй.
>>131382900а, тогда тебе нужно искать слова с близкими координатами по вертикали.{"description"=>"TOTAL","boundingPoly"=>{"vertices"=>[{"x"=>577, "y"=>809}, // координата левого верхнего угола прямоугольника, описывающего слово{"x"=>612, "y"=>809}, // правый верхний {"x"=>612, "y"=>817}, // правый нижний{"x"=>577, "y"=>817}]}}, // левый нижний{"description"=>"$4096.99", "boundingPoly"=>{"vertices"=>[{"x"=>636, "y"=>805}, {"x"=>685, "y"=>805}, {"x"=>685, "y"=>817}, {"x"=>636 "y"=>817}]}}выделенные жырным - вертикальные координаты. парси строку на объекты - прямоугольники, затем ищи прямоугольник слова тотал, запомни его вертикальнае координаты, затем ищи другие слова с близкими по вертикали координатами. на твоем пике изоброжении таких будет ровно одно, получишь слово напротив Total.
>>131383254>вертикалигоризонтали (Х) не?
>>131383328да, конечно, в горизонтали со словом Total, с близкими координатами вертикальными координатами как у Total.Например если у тотал вертикальные координаты 809,817 то ищи слово например от 750 до 850. Зависит от разрешения картинки.
>>131382900Введи такую систему координат: принимай одну единицу по высоте равной максимальному количеству единиц по ширине и находи расстояния до всех вхождений + наложи фильтр, что результат должен быть справа. Наименьшее расстояние - решение задачи.
>>131383643математик в треде. расстояние до вхождений куда? формула фильтра?
НУ в принципе я так и думал что надо причесать и итерировать по координатам
>>131383797> расстояние до вхождений куда?Вхождения - объекты с указанными координатами, указанные в исходных данных, приведённых опом.> формула фильтра?Вхождения даны в виде четырёх пар ((x1,y1),(x2,y2),(x3,y3),(x4,y4)). Положение вхождения TOTAL известно. Очевидно, фильтром будет max(xt2,xt3) < min(xp1,xp4), где xt - координата тотала, xp - координата искомого вхождения>{"description"=>"TOTAL","boundingPoly"=>>{"vertices"=>[>{"x"=>577, "y"=>809}, // координата >левого верхнего угола прямоугольника, >описывающего слово>{"x"=>612, "y"=>809}, // правый >верхний>{"x"=>612, "y"=>817}, // правый нижний>{"x"=>577, "y"=>817}]}}, // левый >нижний>{"description"=>"$4096.99", >"boundingPoly"=>{"vertices"=>[>{"x"=>636, "y"=>805},>{"x"=>685, "y"=>805},>{"x"=>685, "y"=>817}, >{"x"=>636 "y"=>817}]}}
>>131384153> Вхождения > Вхождения - объекты с указанными координатамиОткуда терминология? Множества? Вхождение во что? Почему не называешь просто объект?Объекты с указанными координатами это просто объекты хранящие свои координаты.Алсо формула фильтра неочевидна. Как ты её получил? xt2 это координата тотала x1, x2, y1, y2?
>>131384830> Алсо формула фильтра неочевидна. Как ты её получил?Неочевидно, как проверить, что объект целиком лежит левее другого объекта?> Почему не называешь просто объект?Это область, ограниченная четырьмя точками, но никак не объект. Вообще говоря, как назвать, в данном контексте, значения совершенно не имеет.
>>131385946Терминология избыточна. То же самая проблема у тебя с переменными. Спросил - значит имеет значение. Область это тоже объект. Например прямоугольник.