Как сделать считывание текста с картинки?

У меня есть идея, считывать информацию с картинок. Картинки однотипные, из игры)
Мне для игры, хотел попробовать сделать быстрое и автоматическое считывание инфы, чтоб вывести нужную мне информацию общую, но не знаю, как это реализовать.
Делал через таблицу Excel, но это долго и муторно, тк картинок много, и на каждой много чисел.
Подскажите, как это можно сделать? Есть ли программы удобные, или лучше написать прогу под это? Программировать я не умею ни на каком языке, но занимался этим раньше, бэсик, паскаль учил, это все нравилось) так что могу даже выучить какой нибудь язык для этого (чтоб смог сделать прогу нужную). Пример картинки внизу

Что за игра?
Бывает проще сами данные доставать, особенно если игра браузерная.

Вряд ли. Они обычно для задач типа распознавания документов.

Это тоже сложно.

Есть разные бесплатные OCR библиотеки, в основном на основе Tesseract.
GitHub - kba/awesome-ocr: Links to awesome OCR projects
Но добиться норм результата может быть не так просто.

Если просто загрузить всю картинку в какой-нибудь онлайн сервис на основе Tesseract, то выдаст фигню.
Если вырезать только текст (чтоб автоматически в своей программе – как-нибудь по координатам и/или цвету), то лучше, но тоже не всегда и как-то так:

image

Рыба ©
Цена /! 1.17;
Прибыль и убыток +
Вес5

image

Рыйа 9
Цена
Привыль и усы ток +
Вес5

2022-04-19_11-33

Чай
Цена 426 (95%)
Прибыль и убыт

image

Чаи
ЧН!
ПрилЛЕ ие тк +
Ве; 37

Если опыта нет, то наверняка проще не тратить месяцы и сделать вручную или нанять кого-то вбивать данные за пару копеек )

Игра то походу для телефона. Может быть проще вытащить файл апк и разобрать его на ресурсы??

Не все прям так просто. Все системы распознавания достаточно специфичны. Может конечно и ошибаюсь, но что то мне подсказывает что за пару вечеров тут не осилить.

Ну а вообще, действительно проще заказать. врядли такой проект будет стоить дорого. нарезать кадры и свести информацию в таблицу.

Игра мобильная, Kings choice)
Да, данные сложно вытащить. Ещё учитывая, что таких скрины надо обрабатывать по шт 50 в день)
А на каждом скрине максимум по 12 позиций. Которые потом хочу объединить их в общую таблицу, которая будет выдавать мне нужную информацию.
Посмотрел те сайты. Где онлайн сервис, там точно выдает бессмыслицу)
А где сайт библиотек, то там ничего не понятно) что где как смотреть)
Даж как запустить и посмотреть не понял как. Как я понял, основной язык, это С++ и Python. Думаю можно начать их изучать)

Да, мобильная игра. Да еще и онлайн) не думаю, что так просто можно вытащить от туда. Хотя я и не умею. Но думаю это будет каким-то читерством) я бы хотел сам сделать распознавание скринов). Другим отсылать не вижу смысла, тк это мне нужно быстро, в течении всего дня, и так пару дней)
Да, похоже задумка слишком масштабная, чтоб изучить за пару вечеров) тут скорее месяц или несколько) просто хотел начать двигаться в сторону обучения программирования, хотя до этого с этим не работал с этим на сложном уровне

Странно … если прям такая спешка то однозначно лучше спеца нанимать. Хотя при таких сроках это будет достаточно дорого.

В целом то может начать делать что то и создать паралельно тему …

Ну это просто чтоб посмотреть что будет если тупо скормить Тессеракту эту картинку.
Как видно, результат так себе даже после вырезания, так что надо ковыряться с разными способами улучшить результат.
Improving the quality of the output | tessdoc
https://www.google.com/search?q=tesseract+ocr+improve+quality

Тут вроде шрифт стандартный. Я бы с помощью опенсв например сделал бинаризацию и затем просто распилил изображение на фрагменты. Дополнительно создал бы набор шаблонов из этого же текста и сопоставил их с буквами
А затем каким нибудь простеньким алгоритмом сравнивал фрагменты с заготовленными шаблонами. И выбирал шаблон с лучшим откликом.
По идее не должно быть слишком сложно.

Я не понял, а зачем это всё? :thinking:

А какая разница? Задача есть задача… У тс есть видимо интерес… Это его дело.

Задача слишком сложная, чтобы просто ради интереса.
Написать клон Майнкрафта и то легче. На ютубе его уже давно на скорость пишут, кто быстрее.
Следующим этапом, наверное, будет писать его сразу в обфускитированном виде :rofl:

Да ладно … это же картинка не из реалтайма. Тут нету бликов и отражений и прочего мусора. Чего тут распознавать то. За чашкой чая можно сделать.

Так там код то на жабе написан и все открыто. Если не получилось можно подсмотреть.
Да и просто блоки расставлять это мне кажется в юнити уже как библиотека присутствует. ))

Задача выглядит так:

  1. Получение снимка
  2. Поиск нужных фрагментов изображения
  3. Разбор знаков
  4. Отправка/обработка/сохранение информации.

2-ая тут вообще м.б. прибита к координатам, но если возможны смещения или переменное кол-во, то ищется легко сравненением с фрагментом, например, с заглавными буквами (Ц П В …)
В 3-ей если позиции фиксированы, то даже буквы не нужны. только цифры. Алфавит маленький в любом случае и штрифт стандартный - можно просто вырезать образцы знаков и сравнивать в цикле.

В любом случае нужно хотя бы почитать про сравнение изображений и распознание цифр.
Задача сильно проще чем капча. Но можно почитать и про капчу.