И вновь продолжается бой.
"Линукс может не готов для домашнего применения, но в офис уж точно готов" - слышим мы на каждом шагу. И не только слышим:
Прямо таки панацея, и ничего не глючит и можно спокойно работать. Глядя на счастливые лица нарисованных человечков неволей задумаешься, а может вот оно - решение всех офисных проблем?
Посмотрим. Начнем со всеми любимой офисной периферии. Какой же офис без сканера, особенно где много приходится работать с текстом. В 50% случаев сканер в офисе используют для распознавания текста, в других 50% для сканирования оригиналов документов в целях отправки по электронной почте.
В правом углу ринга признаный лидер - FineReader 10 под Windows, посканировать я решил валявшийся под рукой гарантийный талон на двери. Режим сканирования: цвет 300 dpi. Результат более чем не плох, неверно распознано слово "воздуха", как раз в том месте где на изображении видно какое-то пятно. И сбито форматирование заголовка.
Теперь соперник, точнее соперники (ведь тыщи их!) - свободные программы написанные энтузиастами против злобных проприетарщиков.
Начнем с программы для сканирования - Xsane. За дизайн ее разработчикам стоит оторвать руки, целых четыре окна беспорядочно расположенных на экране и перекрывающих друг друга. Где выставляется разрешение сканирования нужно угадывать, хорошо хоть на ползунки повесили всплывающие подсказки. Ну хотя бы сканирует, и то хорошо.
Разработчики Canon вписали все настройки сканирования в одно удобное и компактное окно. Почувствуйте разницу:
Ладно, это лирика. Посканировали, теперь нужно распознать. В репозитарии нашелся hocr, мало того, что для распознавания надо нажать кнопку Apple, на выходе мы получили... Короче промолчим, потому как ваш покорный слуга увидев это разразился непечатной лексикой.
А дальше выяснилось, что несмотря на тыщи программ и миллионы разработчиков к нам полным ходом приближается полярный лис:
Да, это полный Пиздец, товарищи. Распознать текст в линукс банально нечем. Вопреки заявлениям сообщества, мол в линукс весь софт централизовано и не надо таскать всякие сомнительные программы из интернетов, идем в гугль. Безрадостная картина подтвердилась. Есть два консольных OCR движка (и что мне с ними делать), пара заброшенных проектов, один в зачаточном состоянии. Нагуглил еще Kooka, типа из КДЕ, только на сайте кед никакого упоминания про сего дивного зверя не нашел, ладно поищем в другом месте. За пять минут нашел деб-пакет, руками разрулил зависимости. Кажись работает, даже сканировать сам может. Сделано более продуманно, настройки сгруппированы по своим местам. Со сканированием проблем не возникло, посмотрим как дело обстоит с OCR, тем более на выбор два движка GOCR и OCRAD.
Но полярный лис уже с нами, помахивая пушистым хвостиком. Ни с одним движком Kooka так и не распознала наше изображение.
Что же пишут наши альтернативномыслящие друзья? На одном из форумов я нашел совет использовать Cuneiform под Wine. Ладно, поробуем напоследок. Для запуска танцев с бубном не потребовалось, однако при попытке обратиться к сканеру софтина уснула вечным сном. В принципе, ожидаемо. Попробуем просто распознать.
*лядь! Это альтернативное поделие похоже не умеет поворачивать страницу.
Ладно, поверну вручную. Результат в принципе приемлемый, кроме слова "воздуха" еще несколько неверно распознанных букв и полностью снесенное форматирование нижней половины листа. Но на безрыбье... Сами понимаете.
Выводы: это оглушительный, прямо таки феерический слив! Ни одного поделия способного более - менее распознать текст. И это предлагается в офис? Выкиньте свой сканер и осваивайте скоростную печать, мы там вам два тренажера в комплект положили. Это неебический стыд! Для распознавания текста в линукс в него через вайн тащат виндовое поделие. Одно хорошо, cuneiform, который под виндой никому на[beep] не нужен, хоть здесь пригодился.
А еще это показывает неспособность сообщества самостоятельно освоить сколь нибудь сложные технологии и алгоритмы, если им их не подарят или на крайняк не профинансируют деньгами.
"Оно, конечно, можно научить медведя ездить на велосипеде. Да только будет ли медведю от этого польза и удовольствие?" (с) А. и Б. Стругацкие
Неактивен
вообще-то, есть версия cuneiform для линукса, с гуём на ГТК, и Simple Scan как морда к SANE. Так что вы не правы. На cuneiform жалоб не имею, распознает нормально (не как ФР, но и не сверхужасно)
Добавлено спустя 05 мин:
и кстати, подсказка: все "сколь нибудь сложные технологии и алгоритмы" уже запатентованы.
Неактивен
вообще-то, есть версия cuneiform для линукса, с гуём на ГТК, и Simple Scan как морда к SANE. Так что вы не правы. На cuneiform жалоб не имею, распознает нормально (не как ФР, но и не сверхужасно)
В стадии ранней альфы. Поживем - увидим, тем более коды открыли, глядишь и у злых, жадных детей будет приличная распознавалка.
На cuneiform жалоб не имею, распознает нормально (не как ФР, но и не сверхужасно)
С простыми текстами проблем нет, а в общем на уровне FR5, хотя тот уже давно умеет правильно определять положение страниц.
Добавлено спустя 06 мин 14 с:
Тот же FR вполне работает под wine.
FR - платный софт, а покупая пакет за 70$, я как нибудь переживу покупку Винды за 100 (Home Premium). А вообще, сдается мне, было бы больше толку, если бы все сообщество вместо написания пародий на нормальный софт дружно допилило бы Wine.
Опять же, использование GNU/Linux совсем не означает отказ от программ под Windows.
А смысл, смысл в чем? Я использование Wine рассматриваю исключительно как признание факта, что нормального софта под линукс нет. Вы в MacOS эмулятор винды видели? Или в винде мака? Зато у альтернативномыслящих это в высшей мере достойный поступок. Нормального софта у нас нет, винду использовать религия не позволяет, но мы всех наебем, мы будем использовать виндовый софт под линукс.
Театр абсурда. Нюхаем цветы в противогазе.
Добавлено спустя 07 мин 33 с:
И что то тишина в левом углу ринга? Кто нибудь покажет мне нормальный OCR под линукс?
"Оно, конечно, можно научить медведя ездить на велосипеде. Да только будет ли медведю от этого польза и удовольствие?" (с) А. и Б. Стругацкие
Неактивен
И что то тишина в левом углу ринга? Кто нибудь покажет мне нормальный OCR под линукс?
К.О намекает, что такого нет. Так-то!
https://nolinux.w2c.ru - море баттхерта и деаонимизации
Неактивен
эмм... а чего именно абсурдного в использовании вайна, если он работает? А насчёт "пилить" - wine недавно до версии 1.2 допилили
Неактивен
а чего именно абсурдного в использовании вайна
Сама ситуация абсурдна. Линукс позиционируют как альтернативу виндовс и тут же лепят костыли для запуска виндовых прог. Смысл в использовании линукса? Как пускалку под вайн? Попахивает маразмом и фанатизмом.
К.О намекает, что такого нет. Так-то!
Я стесняюсь спросить, а что сообщество за 19 лет непрерывных побед не осилило такую простую и нужную в хозяйстве вещь? Или проблема в том, что никто не подарил, как ОпенОфис?
"Оно, конечно, можно научить медведя ездить на велосипеде. Да только будет ли медведю от этого польза и удовольствие?" (с) А. и Б. Стругацкие
Неактивен
Винда и макОСь получили своё место под солнцем в 80-90х годах: тогда уже софт начали писать под них. Линукс как десктопная ОС пришел не так уж и давно. Большого кол-ва софта под него нет. Вопрос: как привлечь разработчиков софта к линуксу? Поднять его долю на рынке. Как поднять долю линукса на рынке? Обеспечить разнообразием софта! То есть замкнутый круг. Для устранения которого и был создан вайн.
Неактивен
В отличие от вас - да. И некоторым ооочень пригождается.
Ага, порекомендовало 17 человек. Мноооогим пригодилось.
А нормального софта у нас достаточно.
Я еще раз спрашиваю: нормальный OCR есть? Так что не надо переводить стрелки на мифический софт. Со страшным свистом пингвин феерически слил... А до остального софта тоже доберусь, всему свое время.
Коротко итоги. В левом углу ринга стадо пингвинов, тыщи их. В правом выставленный злобными проприетарщиками Windows7.
Первый раунд: обучающий софт, 0:1 В пользу виндовс.
Второй раунд: OCR. Трибуны в шоке, нокаут. Полный пиздец пингвину! Кто-то вызвал неотложку.
"Оно, конечно, можно научить медведя ездить на велосипеде. Да только будет ли медведю от этого польза и удовольствие?" (с) А. и Б. Стругацкие
Неактивен
И кстати, каждый платиновый пункт в списке Wine AppDB - опровержение его кривости.
Неактивен
если эти виндовые программы на этом "кривом" таки_не_эмуляторе работают без нареканий, а "кривой" линух на данной конфигурации железа и данной сфере применения отлично делает то, что должен -- зачем нужна винда?
Неактивен
Умеют, только при написании любой более-менее серьезной программы вероятность попасть под действие патента стремится к 1. При этом не важно, сам ли ты с нуля написал код. Особенно это важно, собственно, для таких программ, как OCRы, где чуть ли не всё - одни патенты.
Неактивен