[Ответить в тред] Ответить в тред

03/04/16 - Набор в модераторы 03.04 по 8.04
26/03/16 - Конкурс: Помоги гомункулу обрести семью!
15/10/15 - Набор в модераторы 15.10 по 17.10


[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 29 | 2 | 5
Назад Вниз Каталог Обновить

Аноним 08/07/16 Птн 20:41:16  131380484  
14679996766200.jpg (450Кб, 978x1529)
Сап двач! Я знаю что ты не моя личная армия но не могли бы бывалые кодеры помочь с одной задачей. задача такая, Я использую Google vision для распознавания текста и он мне возвращает весь отсканеный текст и каждое слово отделно в таком формате
{"description"=>"TOTAL","boundingPoly"=>{"vertices"=>[{"x"=>577, "y"=>809}, {"x"=>612, "y"=>809}, {"x"=>612, "y"=>817}, {"x"=>577, "y"=>817}]}},

{"description"=>"$4096.99", "boundingPoly"=>{"vertices"=>[{"x"=>636, "y"=>805}, {"x"=>685, "y"=>805}, {"x"=>685, "y"=>817}, {"x"=>636 "y"=>817}]}} (не уверен как макаба покажет все это по этому гист тута https://gist.github.com/anonymous/39d28fa4b9b83f8c771d61b4b587e16c)
так вот. тут два слова которые я должен получить в результате. Я думаю что я каким то обазом долежн сопоставлять boundingPoly . Мы смотреть какие слова с тоталом в одной линии и смотрим цыфры ли это и если да то берем. Проблема что 'Шума' те таких хешей ну на каждое слово ну там сами представляете. Так вот есть ли какие то бестпрактисы к этой задаче? В замен отвечу итт ньюфагам на любые вопросы о фрилансе и о программировании. Сори что в б ибо трубы горят.
Аноним 08/07/16 Птн 20:43:11  131380593
Бамп
Аноним 08/07/16 Птн 20:46:49  131380829
Бамп
Аноним 08/07/16 Птн 20:48:48  131380962
Бамп
Аноним 08/07/16 Птн 20:51:45  131381176
Бамп
Аноним 08/07/16 Птн 20:55:36  131381428
Bump
Аноним 08/07/16 Птн 20:58:45  131381625
Bump
Аноним 08/07/16 Птн 20:59:38  131381669
cmooon 2ch.
Аноним 08/07/16 Птн 21:03:09  131381927
>Проблема что 'Шума' те таких хешей ну на каждое слово ну там сами представляете.
Перефразируй плес. Три раза прочитал - не понял что ты хотел сказать.
Аноним 08/07/16 Птн 21:07:50  131382242
>>131380484 (OP)
Т.е. ты хочешь что пека за тебя убирала шум из распознанных данных? Да ты ахуел
Аноним 08/07/16 Птн 21:07:52  131382245
>>131381927
извини написал как идиот. моя задача сопоставить Total и цифры напротив . но помимо этого там куча других слов , и к каждому слову хеш я назвал это шумом
Аноним 08/07/16 Птн 21:10:05  131382384
>>131382058
Я знаю что такое Json причем тут это.
>>131382242
Nope. я думаю что по координатом можно сопоставить Total со значение . но но хочу спросить у двача как это лучше сделать
Аноним 08/07/16 Птн 21:13:25  131382633
>>131382245
Total это распознанное слово? Т.е. сопостасить распознонное слово и его координаты?
Аноним 08/07/16 Птн 21:14:03  131382676
>>131380484 (OP)
я нихуя не понял что ты хочешь.
нормально можешь написать?
Аноним 08/07/16 Птн 21:14:43  131382710
>>131382633
>>131382676
нет . сопоставить слово Total со значением напротив
Аноним 08/07/16 Птн 21:15:40  131382772
>>131382710
что значит
>сопоставить
БЛЯДЖ?
Аноним 08/07/16 Птн 21:16:38  131382839
>>131382384
Попробуй искать на коротком расстоянии.
Ебани словарь из координат и значения.

Бест практиз тебе хуй кто сюда завезет. Никто не делает это 7 раз в неделю.
Сьеби вообще лучше на стековерфлоу.
Аноним 08/07/16 Птн 21:17:28  131382900
14680018481490.jpg (92Кб, 707x978)
>>131382772
Я должен получить значение напротив total
Аноним 08/07/16 Птн 21:19:09  131382997
>>131382710
Теье только координаты рассчитывать. Причем молить аллаха что в распознанных данных сканируемая область была горизонтальна. Если, конечно, нельзя както восстановить векторный поворот.
Алсо, гугли "обработка координат". Может найдешь чтото не пиздецовомедленное
Аноним 08/07/16 Птн 21:22:08  131383191
>>131382900
смотри объект справа от тотала и на той же линии. если это число то все норм.
хотя если скан кривой то хуй.
Аноним 08/07/16 Птн 21:23:07  131383254
>>131382900
а, тогда тебе нужно искать слова с близкими координатами по вертикали.

{"description"=>"TOTAL","boundingPoly"=>{"vertices"=>[
{"x"=>577, "y"=>809}, // координата левого верхнего угола прямоугольника, описывающего слово
{"x"=>612, "y"=>809}, // правый верхний
{"x"=>612, "y"=>817}, // правый нижний
{"x"=>577, "y"=>817}]}}, // левый нижний
{"description"=>"$4096.99", "boundingPoly"=>{"vertices"=>[
{"x"=>636, "y"=>805},
{"x"=>685, "y"=>805},
{"x"=>685, "y"=>817},
{"x"=>636 "y"=>817}]}}

выделенные жырным - вертикальные координаты. парси строку на объекты - прямоугольники, затем ищи прямоугольник слова тотал, запомни его вертикальнае координаты, затем ищи другие слова с близкими по вертикали координатами. на твоем пике изоброжении таких будет ровно одно, получишь слово напротив Total.
Аноним 08/07/16 Птн 21:24:17  131383328
>>131383254
>вертикали
горизонтали (Х) не?
Аноним 08/07/16 Птн 21:26:38  131383474
>>131383328
да, конечно, в горизонтали со словом Total, с близкими координатами вертикальными координатами как у Total.
Например если у тотал вертикальные координаты 809,817 то ищи слово например от 750 до 850. Зависит от разрешения картинки.
Аноним 08/07/16 Птн 21:29:16  131383643
>>131382900
Введи такую систему координат: принимай одну единицу по высоте равной максимальному количеству единиц по ширине и находи расстояния до всех вхождений + наложи фильтр, что результат должен быть справа. Наименьшее расстояние - решение задачи.
Аноним 08/07/16 Птн 21:31:52  131383797
>>131383643
математик в треде. расстояние до вхождений куда? формула фильтра?
Аноним 08/07/16 Птн 21:34:39  131383951
НУ в принципе я так и думал что надо причесать и итерировать по координатам
Аноним 08/07/16 Птн 21:37:59  131384153
>>131383797
> расстояние до вхождений куда?
Вхождения - объекты с указанными координатами, указанные в исходных данных, приведённых опом.
> формула фильтра?
Вхождения даны в виде четырёх пар ((x1,y1),(x2,y2),(x3,y3),(x4,y4)). Положение вхождения TOTAL известно. Очевидно, фильтром будет max(xt2,xt3) < min(xp1,xp4), где xt - координата тотала, xp - координата искомого вхождения
>{"description"=>"TOTAL","boundingPoly"=>>{"vertices"=>[
>{"x"=>577, "y"=>809}, // координата >левого верхнего угола прямоугольника, >описывающего слово
>{"x"=>612, "y"=>809}, // правый >верхний
>{"x"=>612, "y"=>817}, // правый нижний
>{"x"=>577, "y"=>817}]}}, // левый >нижний
>{"description"=>"$4096.99", >"boundingPoly"=>{"vertices"=>[
>{"x"=>636, "y"=>805},
>{"x"=>685, "y"=>805},
>{"x"=>685, "y"=>817},
>{"x"=>636 "y"=>817}]}}
Аноним 08/07/16 Птн 21:48:27  131384830
>>131384153
> Вхождения
> Вхождения - объекты с указанными координатами
Откуда терминология? Множества? Вхождение во что? Почему не называешь просто объект?
Объекты с указанными координатами это просто объекты хранящие свои координаты.
Алсо формула фильтра неочевидна. Как ты её получил? xt2 это координата тотала x1, x2, y1, y2?
Аноним 08/07/16 Птн 22:06:08  131385946
>>131384830
> Алсо формула фильтра неочевидна. Как ты её получил?
Неочевидно, как проверить, что объект целиком лежит левее другого объекта?
> Почему не называешь просто объект?
Это область, ограниченная четырьмя точками, но никак не объект. Вообще говоря, как назвать, в данном контексте, значения совершенно не имеет.
Аноним 08/07/16 Птн 22:24:09  131387018
>>131385946
Терминология избыточна. То же самая проблема у тебя с переменными. Спросил - значит имеет значение.
Область это тоже объект. Например прямоугольник.

[Назад][Обновить тред][Вверх][Каталог] [Реквест разбана] [Подписаться на тред] [ ] 29 | 2 | 5
Назад Вверх Каталог Обновить

Топ тредов