Цитата: Заключение воодушевляет: В следующей версии, срок выхода которой, к сожалению, не известен, планируется реализовать и добавить работу со сканером.
Сканирование - необязательная опция для OCR-приложений.
Cuneiform даже рядом не стоял с FineReader'ом. Говорю как давний поклонник (ещё с версии 6.0) этой замечательной программы, а также как пользователь Linux. Я пробовал Cuneiform. Для одной распознавания одной странички неформатированного текста он сгодится. Для всего остального - туфта. Жаль, но, по-моему, Cuneiform отстал от FineReader'а безнадёжно. Скорее Abbyy сделает порт на Линух своего FineReader'а (библиотеки для разработчика уже есть, нет только гуя), чем Cuneiform догонит FineReader. Жаль, но то, о чём я сказал, — факты.
Соврал. С версии 4.0 я пользовался FineReader. Вот тогда он ещё мог сравниться с Cuneiform. А уже после 6.0 (и, тем более, после 7.0) версии FineReader'а отставание от него Cuneiform стало безнадёжным.
Luca написал: Согласен, вполне достаточно если видео плеер умеет аудио проигрывать.
Сразу видно, что благородный дон, кроме холивара в интернетах, компьютером не особо того...распознавание текста и сканирование оного - два процесса, которые совершенно необязательно связаны между собой. При наличии самого что ни на есть файнридера. Авторы которого, кстати, в курсе, в отличие от вас.
И, кстати, если вы хотите использовать тире ("—") вместо дефиса ("-"), то осильте ввод спецсимволов с клавиатуры. Ах, да, sorry! На Винде ведь нет Compoze! Там ввод спецсимволов сделан через з.дницу! Потому и приходится вендочеловекам вместо "—" писАть "--"
Распознавание текста - это такая вещь, где иногда юзеру приходится повозюкать мышкой. Ну, блок выделить там, указать где таблица, где картинка, где просто текст.
Поэтому фраза "консольная утилита для OCR" доставляет неимоверно.
McFly написал: Распознавание текста - очень специфичная область. Менее 1му %ту пользователей это требуется в повседневной жизни.
опять "нинужна"? Эта штука требуется действительно редко. Но я уверен, что многим, хоть и редко. слишком многие товарищи не хотят, чтобы их тексты распространялись. поэтому те, кто их все равно распространяет, делают это в виде растра, не озабочиваясь OCR-ом.
Автомототроллер написал: Ах, да, sorry! На Винде ведь нет Compoze! Там ввод спецсимволов сделан через з.дницу! Потому и приходится вендочеловекам вместо "—" писАть "--"
Ну вот, а ещё отрицаете свою половую связь с [b]Тролл Лейбусом/b], который тоже заикался об этих символах и Compoze.
Автомототроллер написал: Причём здесь "разные результаты"?
При том, что если верить многим пользователям, то у них вполне сносно текст распознаётся. А вот у меня даже простейшие заготовки распознать не в силах.
Руслан Некарманов написал: Ну вот, а ещё отрицаете свою половую связь с Тролл Лейбусом, который тоже заикался об этих символах и Compoze.
Разве я что-то отрицал? Я сказал, что ничего не собираюсь отрицать. Вам надо? — Вы и доказывайте. По поводу Compoze доказывал тоже я. И к теме этой пришли случайно, в процессе, такскзть. Что там делал Тролл Лейбус, хр№н его знает.
Руслан Некарманов написал: При том, что если верить многим пользователям, то у них вполне сносно текст распознаётся. А вот у меня даже простейшие заготовки распознать не в силах.
Текст распознаётся Cuneiform вполне сносно. Что там у вас были за проблемы, хр№н его знает, попробуйте позвонить Главному по Глюкам и Кривым Рукам. Как говорят, он иногда помогает. Правда, исключительно по блату. Но речь шла не просто о разных результатах, а о вашем противопоставлении YAGF Cuneiform'у. Именно это противопоставление и вызвало иронию.
Tecna написал: этот суперридер тут все купили?
Все или не все, не знаю. Но стоит он копейки, дешевле антивируса (или на уровне антивируса). Только антивирус не нужен, а вот за такой продукт, как FineReader, заплатить не грех. Вот честно, я неоднократно покупал лицензию FineReader, и ещё ни разу не пожалел. Продукт стОит своих денег.
Руслан Некарманов написал: Но о разных результатах: я залил видео по ссылке
//печальным голосом:// Жаль, не могу посмотреть, — Ъ не ходят по ссылкам, не качают и не смотрят видео.
Впрочем, я и без видео могу сказать, что Cuneiform выдаёт приемлемые результаты (2-5 ошибок на страницу) при сканах не менее 300 dpi, с простым текстом, без таблиц и картинок. Всё, что сложнее, распознаётся очень и очень хр№ново.
Кстати, под "приемлемыми результатами" (2-5 ошибок на страницу) я имею в виду те результаты, которые были "приемлемыми" для FineReader 4.0. После версии 7.0 FineReader практически не выдаёт ошибок на простом тексте. А уж "десяточка", так вообще блестящие результаты выдаёт при распознавании. Даже фото распознаёт превосходно.
Ну значит карма, у меня версия та же самая, однако работает. Ролик я выкладывал. А может и руки, я свои туда не прикладывал, как поставилось так и поставилось.
Руслан Некарманов написал: фокус в том, что на моей рабочей машинке с openSUSE всё работает лучшем, чем в этой сборке Ubuntu.
Чёрт его знает, там ведь помимо собственно движка есть и noarch файлы, в которых, как я полагаю разные таблицы соответствия лежат. Вполне может быть что в бубунте на этих файлах в плане поддержки русского экономили, т.е. оставили только базовые данные. Для проверки неплохо было бы прогнать его на аналогичном по качеству английском тексте.
#1.Linups_Troolvalds