Убийца FineReader-а для Linux

#1. Linups_Troolvalds

Цитата:
Заключение воодушевляет: В следующей версии, срок выхода которой, к сожалению, не известен, планируется реализовать и добавить работу со сканером.

Сканирование - необязательная опция для OCR-приложений.

(30.11.2010 - 21:53) Цитировать

#2. Автомототроллер

Cuneiform даже рядом не стоял с FineReader'ом. Говорю как давний поклонник (ещё с версии 6.0) этой замечательной программы, а также как пользователь Linux. Я пробовал Cuneiform. Для одной распознавания одной странички неформатированного текста он сгодится. Для всего остального - туфта.
Жаль, но, по-моему, Cuneiform отстал от FineReader'а безнадёжно. Скорее Abbyy сделает порт на Линух своего FineReader'а (библиотеки для разработчика уже есть, нет только гуя), чем Cuneiform догонит FineReader. Жаль, но то, о чём я сказал, — факты.

(30.11.2010 - 21:55) Цитировать

#3. Luca

Linups_Troolvalds написал:
Сканирование - необязательная опция для OCR-приложений.

Согласен, вполне достаточно если видео плеер умеет аудио проигрывать.

(30.11.2010 - 21:57) Цитировать

#4. Автомототроллер

Соврал. С версии 4.0 я пользовался FineReader. Вот тогда он ещё мог сравниться с Cuneiform. А уже после 6.0 (и, тем более, после 7.0) версии FineReader'а отставание от него Cuneiform стало безнадёжным.

(30.11.2010 - 21:57) Цитировать

#5. Tiphon

Да уж. Еще лет 6 назад в файнридере "все работало" так что какое уж "убийство"...

(30.11.2010 - 22:14) Цитировать

#6. Руслан Некарманов

После YAGF я стал менее придирчиво относиться к Cuneiform.

(30.11.2010 - 22:58) Цитировать

#7. Автомототроллер

Руслан Некарманов написал:
После YAGF я стал менее придирчиво относиться к Cuneiform.

Не "блистайте", ради Бога! YAGF — это морда (GUI) к Cuneiform.

(30.11.2010 - 23:03) Цитировать

#8. Руслан Некарманов

Автомототроллер написал:
Не "блистайте", ради Бога! YAGF — это морда (GUI) к Cuneiform.

O_o
Это что получается, что от сборки к сборке -- разные результаты?

(30.11.2010 - 23:08) Цитировать

#9. Linfan

Luca написал:
Согласен, вполне достаточно если видео плеер умеет аудио проигрывать.

Неее, Linups_Troolvalds прав. Чем отсканить текст уже сейчас есть - та же Kooka. А вот распознавалки не хватает крайне остро.

(30.11.2010 - 23:52) Цитировать

#10. Linups_Troolvalds

Luca написал:
Согласен, вполне достаточно если видео плеер умеет аудио проигрывать.

Сразу видно, что благородный дон, кроме холивара в интернетах, компьютером не особо того...распознавание текста и сканирование оного - два процесса, которые совершенно необязательно связаны между собой. При наличии самого что ни на есть файнридера. Авторы которого, кстати, в курсе, в отличие от вас.

(1.12.2010 - 00:12) Цитировать

#11. Автомототроллер

Руслан Некарманов написал:
O_o
Это что получается, что от сборки к сборке -- разные результаты?

Причём здесь "разные результаты"? YAGF — это графическая оболочка для Cuneiform. Причём тут сборки? О_о!

И, кстати, если вы хотите использовать тире ("—") вместо дефиса ("-"), то осильте ввод спецсимволов с клавиатуры.
Ах, да, sorry! На Винде ведь нет Compoze! Там ввод спецсимволов сделан через з.дницу! Потому и приходится вендочеловекам вместо "—" писАть "--" biggrin

(1.12.2010 - 07:47) Цитировать

#12. McFly

Распознавание текста - очень специфичная область. Менее 1му %ту пользователей это требуется в повседневной жизни.

(1.12.2010 - 08:04) Цитировать

#13. DonDublon3

Распознавание текста - это такая вещь, где иногда юзеру приходится повозюкать мышкой. Ну, блок выделить там, указать где таблица, где картинка, где просто текст.

Поэтому фраза "консольная утилита для OCR" доставляет неимоверно.

(1.12.2010 - 09:31) Цитировать

#14. Luca

Linups_Troolvalds,
Меня во всем этом забавляет степень готовности Linux продуктов. Перманентная пре-альфа-rc

(1.12.2010 - 11:45) Цитировать

#15. DonDublon3

McFly написал:
Распознавание текста - очень специфичная область. Менее 1му %ту пользователей это требуется в повседневной жизни.

опять "нинужна"?
Эта штука требуется действительно редко. Но я уверен, что многим, хоть и редко. слишком многие товарищи не хотят, чтобы их тексты распространялись. поэтому те, кто их все равно распространяет, делают это в виде растра, не озабочиваясь OCR-ом.

(1.12.2010 - 12:27) Цитировать

#16. Руслан Некарманов

Автомототроллер написал:
Ах, да, sorry! На Винде ведь нет Compoze! Там ввод спецсимволов сделан через з.дницу! Потому и приходится вендочеловекам вместо "—" писАть "--"

Ну вот, а ещё отрицаете свою ~~половую~~ связь с [b]Тролл Лейбусом/b], который тоже заикался об этих символах и Compoze. smile

Автомототроллер написал:
Причём здесь "разные результаты"?

При том, что если верить многим пользователям, то у них вполне сносно текст распознаётся. А вот у меня даже простейшие заготовки распознать не в силах.

(1.12.2010 - 16:39) Цитировать

#17. ikkunan salvataja

Руслан Некарманов написал:
А вот у меня даже простейшие заготовки распознать не в силах.

Заготовку в студию! Чего там гадать хорошо или плохо не зная какого качества исходный материал.

(1.12.2010 - 16:46) Цитировать

#18. Руслан Некарманов

ikkunan salvataja написал:
Заготовку в студию!

В обзор Ubuntu for teachers загляните.

(1.12.2010 - 16:47) Цитировать

#19. ikkunan salvataja

Руслан Некарманов написал:
В обзор Ubuntu for teachers загляните.

Я там только скриншот видел, но не файл который распознавался.

(1.12.2010 - 17:02) Цитировать

#20. Руслан Некарманов

ikkunan salvataja написал:
Я там только скриншот видел, но не файл который распознавался.

http://depositfiles.com/files/ebct4vdr0
http://depositfiles.com/files/e9dc1hgjr

(1.12.2010 - 17:06) Цитировать

#21. Руслан Некарманов

ikkunan salvataja, ну что, проверили?

(1.12.2010 - 18:22) Цитировать

#22. ikkunan salvataja

Руслан Некарманов написал:
ikkunan salvataja, ну что, проверили?

http://zalil.ru/30059897

(1.12.2010 - 18:35) Цитировать

#23. Руслан Некарманов

А другой файл? Кстати, какой программой видео захватываете?

(1.12.2010 - 19:10) Цитировать

#24. ikkunan salvataja

Руслан Некарманов написал:
А другой файл?

А на другом файле finereader у товарища упал, правда там версия какая то сильно древняя и пиратская.

Руслан Некарманов написал:
Кстати, какой программой видео захватываете?

Штатный xvidcap.

(1.12.2010 - 19:19) Цитировать

#25. Tecna

ikkunan salvataja написал:
древняя и пиратская.

кстати да, а этот суперридер тут все купили? а то хорошо сравнивать рутрекерские сокровища и опенсорс с пятью кодерами, ага ))

кстати видела пост - чел использует в вайне легальный ридер и доволен, так что это не киллер-фича именно win.

(1.12.2010 - 19:38) Цитировать

#26. Руслан Некарманов

ikkunan salvataja, у меня вот так. Почему у меня с Вами результаты разнятся?

Может, другие тоже попробуют протестировать?

(1.12.2010 - 19:47) Цитировать

#27. Автомототроллер

Руслан Некарманов написал:
Ну вот, а ещё отрицаете свою половую связь с Тролл Лейбусом, который тоже заикался об этих символах и Compoze.

Разве я что-то отрицал? Я сказал, что ничего не собираюсь отрицать. Вам надо? — Вы и доказывайте.
По поводу Compoze доказывал тоже я. И к теме этой пришли случайно, в процессе, такскзть. Что там делал Тролл Лейбус, хр№н его знает.

Руслан Некарманов написал:
При том, что если верить многим пользователям, то у них вполне сносно текст распознаётся. А вот у меня даже простейшие заготовки распознать не в силах.

Текст распознаётся Cuneiform вполне сносно. Что там у вас были за проблемы, хр№н его знает, попробуйте позвонить Главному по Глюкам и Кривым Рукам. Как говорят, он иногда помогает. Правда, исключительно по блату.
Но речь шла не просто о разных результатах, а о вашем противопоставлении YAGF Cuneiform'у. Именно это противопоставление и вызвало иронию.

Tecna написал:
этот суперридер тут все купили?

Все или не все, не знаю. Но стоит он копейки, дешевле антивируса (или на уровне антивируса). Только антивирус не нужен, а вот за такой продукт, как FineReader, заплатить не грех. Вот честно, я неоднократно покупал лицензию FineReader, и ещё ни разу не пожалел. Продукт стОит своих денег.

(1.12.2010 - 19:52) Цитировать

#28. Руслан Некарманов

Tecna написал:
кстати да, а этот суперридер тут все купили?

А у вас там в сообществе коммерческий софт для Linux честно покупают? wink

(1.12.2010 - 19:55) Цитировать

#29. Руслан Некарманов

Tecna написал:
кстати видела пост

У нас тут без ссылок на слово не верят, так что подтверждай. smile

(1.12.2010 - 19:55) Цитировать

#30. Руслан Некарманов

Автомототроллер написал:
Именно это противопоставление и вызвало иронию.

Ну понятно, я просто не знал об этом, поэтому правда Ваша. Но о разных результатах: я залил видео по ссылке.

(1.12.2010 - 19:58) Цитировать

#31. Автомототроллер

Руслан Некарманов написал:
Но о разных результатах: я залил видео по ссылке

//печальным голосом:// Жаль, не могу посмотреть, — Ъ не ходят по ссылкам, не качают и не смотрят видео.

Впрочем, я и без видео могу сказать, что Cuneiform выдаёт приемлемые результаты (2-5 ошибок на страницу) при сканах не менее 300 dpi, с простым текстом, без таблиц и картинок. Всё, что сложнее, распознаётся очень и очень хр№ново.

(1.12.2010 - 20:03) Цитировать

#32. Автомототроллер

Кстати, под "приемлемыми результатами" (2-5 ошибок на страницу) я имею в виду те результаты, которые были "приемлемыми" для FineReader 4.0. После версии 7.0 FineReader практически не выдаёт ошибок на простом тексте. А уж "десяточка", так вообще блестящие результаты выдаёт при распознавании. Даже фото распознаёт превосходно.

(1.12.2010 - 20:06) Цитировать

#33. Руслан Некарманов

Автомототроллер написал:
Ъ не ходят по ссылкам, не качают и не смотрят видео

А посмотрели бы. Там по сути только текст.

(1.12.2010 - 20:07) Цитировать

#34. Автомототроллер

Руслан Некарманов написал:
А посмотрели бы. Там по сути только текст.

//тоскливо, сглотнув скупую мужскую слезу:// Не могу... Клятву дал... Присягал... самому... Столлману...

//отвернулся, делая вид, что что-то попало в глаз//

(1.12.2010 - 20:10) Цитировать

#35. ikkunan salvataja

Руслан Некарманов написал:
Почему у меня с Вами результаты разнятся?

Может быть ~~руки~~ карма? Там никаких настроек кроме входного языка и выходного формата в общем то и нет. Какая версия cuneiform?

(1.12.2010 - 20:42) Цитировать

#36. Руслан Некарманов

ikkunan salvataja написал:
Какая версия cuneiform?

(1.12.2010 - 21:14) Цитировать

#37. ikkunan salvataja

Ну значит карма, у меня версия та же самая, однако работает. Ролик я выкладывал. А может и руки, я свои туда не прикладывал, как поставилось так и поставилось.

(1.12.2010 - 21:43) Цитировать

#38. Руслан Некарманов

ikkunan salvataja, фокус в том, что на моей рабочей машинке с openSUSE всё работает лучшем, чем в этой сборке Ubuntu.

(1.12.2010 - 21:46) Цитировать

#39. ikkunan salvataja

Руслан Некарманов написал:
фокус в том, что на моей рабочей машинке с openSUSE всё работает лучшем, чем в этой сборке Ubuntu.

Чёрт его знает, там ведь помимо собственно движка есть и noarch файлы, в которых, как я полагаю разные таблицы соответствия лежат. Вполне может быть что в бубунте на этих файлах в плане поддержки русского экономили, т.е. оставили только базовые данные.
Для проверки неплохо было бы прогнать его на аналогичном по качеству английском тексте.

(1.12.2010 - 23:30) Цитировать

#40. Tecna

Руслан Некарманов написал:
коммерческий софт для Linux честно покупают?

пока было бы что покупать, зато искать хороший фрисофт легче через минт-каталог.

(2.12.2010 - 12:55) Цитировать

#41. Skynet2015

Руслан Некарманов написал:
А у вас там в сообществе коммерческий софт для Linux честно покупают?

Ну да. Честно купил BricsCAD и Nero. Благо обе дешевы.

(2.12.2010 - 13:18) Цитировать

#42. ALEX

Skynet2015 написал:
Ну да.

Я думаю, Руслан имел в виду не то, чтобы ему тут отвечали, а чтобы сами себе честно ответили. biggrin

(2.12.2010 - 17:01) Цитировать