Здравствуйте, and-box. Спасибо за перевод нашей книги Маркин А.Н., Низамов Р.Э., Суховерхов С.В. Нефтепромысловая химия: практическое руководство в формат DJVU. Я скачал файл, но он не открывается на Mac программой DjVuReader Ex. Можете что-то посоветовать, как открыть его этой программой? С уважением, Graffist
Возможно, Вас заинтересуют исходники (сканы и фото) комиксов и манга серии WarCraft. В случае положительного ответа я закачаю файл (почти 3 Гб) на файлообменник и дам Вам ссылку. Файлы чужие, заниматься ими всё равно не буду, а выбрасывать жалко. Всего доброго!
Спасибо за предложение. К сожалению WarCraft не входит в круг моих интересов. Вот если попадется Крылов В.Н. Производство угольных и графитированных электродов, Каждан Я.С. Технология электродов, Фиалков, Микулинский А.С.На обработку просто нет времени. Кодировщик я еще не ахти. С Рождеством!
С Новым годом! Возможно, Вас заинтересует выложенный мной файл. Созданный DJVU-файл получается слишком большим и я не стал его выкладывать. Если хотите, можете повозиться и выложить DJVU-файл. Исходный скан найдёте здесь.
Пламенный привет! Вот задача, которая оказалась мне не по зубам (в смысле создания DJVU). Пришлось выложить исходник. Попробуйте, там всего несколько страниц. Это скриншот, поэтому разрешение низкое. С Новым годом!
Давайте покинем Книгомастера и перенесём нашу дискуссию на другую территорию. Цитирую Ваше предпоследнее послание полностью:
Спасибо за ответ. Но альтернативе djvusmall нет - это ломаный кодер с сегментатором - конкуренты бесплатные не умеют разделяемый словать делать... так что неясно, чем можно под х64 нормально кодировать.
Оно состоит из одних утверждений и вопросов не содержит. Прошу уточнить вопрос, чтобы я мог дать развёрнутый ответ. Быть может, Вас интересует, «чем можно под х64 нормально кодировать»? Тогда уточните исходные условия и конечную цель кодирования.
Вопрос прост - под Win x64 при нерабочести djvusmall (лизардтешевский кодер-сегментатор) тогда чем кодировать? преимущества djvusmall - обработка скольугодно большого списка файлов, сегментация и разделяемые словари фигур. с тонкой настройкой кодера.потому неясно - какой такой вы альтернативный кодер нашли? то что я видел из бесплатного - это в лучшем случае - огромный файл на выходе без возможности тонкой настройки кодирования.я предполагаю, что вы пользуете FineReader11. мне просто интересно - что лучше djvusmall (фирменных утилит лизардтеш)?
Конечная цель - получить электронную книгу, дающую возможность копировать текст и снабженную удобной навигацией и поиском по тексту. она должна быть небольшая по размеру файла, но иметь высокое графическое качество.djvu правильно кодированный дает такую книгу.правильно кодируют, пока что, только программы от лизардтеш.если х64 не дает возможности правильно кодировать - то в топку такое новшество.если дает - то к вам вопрос - чем?
правильно кодируют, пока что, только программы от лизардтеш
Вы неправы. 1) За те 4 года, что прошли с момента, когда LizardTech продала права на технологию DjVu, наверняка что-нибудь новое и «правильное» да появилось уже у других, тем более что открытость формата DjVu способствует его достаточно быстрому совершенствованию. 2) Меня всегда интересовал конечный результат, а не принадлежность авторских прав на библиотеку-кодер, используемую программой-оболочкой (в консоли я работаю крайне редко) той или иной фирме: так глубоко я не копаю. Поэтому только в связи с нашей дискуссией заглянув внутрь библиотеки DjvuLib.dll, входящей в состав пакета FineReader 11, я пришёл к выводу о принадлежности авторских прав на оную библиотеку фирме VeriSign, Inc. (это вовсе не означает, что она же и есть разработчик). А поскольку FineReader частенько даёт весьма неплохие результаты, то из этого вытекает, что обсуждаемое утверждение, как минимум, излишне категорично.
я предполагаю, что вы пользуете FineReader11
Вы правы. Главное преимущество электронной книги перед бумажной — в системе поиска. Поэтому наличие OCR-слоя в создаваемой мной книге обязательно. В соответствии с «бритвой Оккама» не станем умножать сущности и будем использовать для создания DjVu-книги ту же программу, которую использовали для распознавания текста. Так я и поступаю.Как быть, если качество DjVu-книги, созданной программой FineReader 11, оказывается неудовлетворительным? Тогда я создаю PDF-файл и уже его преобразую в DjVu. Загляните на страничку Книгомастера — мы с ним достаточно подробно обсудили этот вопрос, там есть все необходимые ссылки. Более того, Книгомастер экспериментировал с различными программами-конверторами и получил интересные результаты. OCR-слой при конвертировании сохраняется, потеря качества сведена к допустимому минимуму, по поводу оглавлений ничего сказать не могу, поскольку не вижу в них необходимости и сам их никогда не создаю.Вы, как я понял, прикипели душой к определённой последовательности действий по созданию книги и хотите сохранить её в х64. Флаг Вам в руки. Как я припоминаю, при переходе с 32 бит на 64 мне пришлось расстаться с несколькими любимыми программами. Со временем все проблемы были решены. В тех случаях, когда не удавалось найти эквивалентную замену какой-то программе, я менял дорогу от исходной точки к конечной. Помните, что «нормальные герои всегда идут в обход». Успехов!
Флаг у меня в руках. Файнридер хорош.... и текстовый слой у него... гммм... нестандарт. Кодирует вроде неплохо... Текстовый слой... почти хорош. Некопируемый. И кодирование нельзя настроить. так что fr11 годится, но... для тех кому деваться некуда. А с дежавю не так все просто - на том форуме есть обсуждение творений каминовы. Формат мне нравится. Но ограничения бесплатных кодеров - нет. Хорош пока только ломаный консольный. Попробуйте улучшить качество кодирования и вы поймете. В свое время я тоже сидел на файнридере и писал кипятком от разрезки страниц и выравнивания. Сейчас изучил под микроскопом свою продукцию и ужаснулся - пляшущие буковки, "инь" от соло и dee 6... место экономил. время. теперь вынужден изучить вопрос.
Дорогой друг, хотя я и приветствую Ваше желание дойти до самой сути, сам я так глубоко не копаю. Мне важен результат. Раскопки, т.е. поиск нужной программы, веду до тех пор, пока таковая не будет найдена, после чего копать прекращаю. И мне по барабану, в смысле фиолетово, т.е. глубоко перпендикулярно, если устраивающий меня результат достигнут с дефолтными настройками. А сейчас дело обстоит именно так, и проблемы создания DjVu-книг для меня не существует, в увеличении числа настроек для улучшения качества кодирования я не нуждаюсь, хотя, конечно, и не отказался бы от полезных дополнительных опций.
fr11 годится, но... для тех кому деваться некуда.
Если книга не содержит полутоновых иллюстраций, т.е. мы имеем дело только с ч/б текстом, то Файнридер выдаёт вполне приличный результат. Если имеются иллюстрации, особенно цветные, то в этом случае может повезти, а может и не повезти, и тогда я применяю обходной путь, о котором упомянул в предыдущем послании.
я тоже сидел на файнридере и писал кипятком от разрезки страниц и выравнивания
Резка разворотов страниц в Файнридере даёт неудовлетворительный результат только в автоматическом режиме. Так вы ручками, ручками… Вручную оно надёжнее. Выравнивание перекосов: а кто или что Вам мешает не использовать программное выравнивание, а просто пересканировать страницу, повернув её на нужный угол? Я понимаю желание получить максимальный результат с использованием минимум телодвижений, но увы… Не применяйте пакетную обработку, сканируйте и обрабатывайте каждую страницу индивидуально, и качественный результат Вам обеспечен.
текстовый слой у него... гммм...
Интересно, Вы сами пришли к такому к такому выводу, или вычитали на страничках, ссылки на которые привели? По поводу вычитанного там выскажу два соображения. 1) Люди делятся на тех кто может делать, и поэтому делает, и на тех, кто делать не может, и поэтому поучает, как надо делать. Козе понятно, к какому типу я отношу авторов высказываний с этих страниц. 2) Есть два способа преодоления преград типа «телеграфный столб» — перелезть и обойти. В отличие от упомянутых выше личностей я предпочитаю второй способ: обойти столб, т.е. не внедрять OCR-слой в имеющийся файл, а заново создавать DjVu-файл с OCR-слоем. И если руки у человека растут… гммм… из правильного места, то и результат будет таким, каким ему положено быть.
Когда заинтересует качество результата - приходите - побеседуем. На текущий момент, как сказала известная птичка, пребывайте в FR11+W7x64. Успехов вам на х64! P.S. А что не устроило в методике переноса текстового слоя?
Когда заинтересует качество результата - приходите - побеседуем.
Качество результата меня интересует всегда. Но на данный момент достигнутый уровень качества меня вполне устраивает, так что Вашим любезным приглашением я воспользуюсь не раньше, чем меня вынудят к этому обстоятельства: ломка динамического стереотипа — штука достаточно неприятная.Для интереса посмотрел, какой программный продукт выдал мне лучшие результаты. Это оказалась версия 2.1 открытой библиотеки DjVuLibre.
А что не устроило в методике переноса текстового слоя?
Получаемый результат. Текстовый слой… гммм… нестандарт. Копируемый, правда, но для поиска по тексту получаемый набор символов абсолютно не годится.
Копируемый, правда, но для поиска по тексту получаемый набор символов абсолютно не годится.
? Не понял о наборе символов. Повторите методику. Извлеките оба текстовых слоя. Найдите разницу в символах. Я это сделал. А ваша критика безосновательна - серьезный человек говорит обоснованно.
Помилуйте, разве я кого-то критикую? Вы задали вопрос, я ответил, что на интересующем Вас пути потерпел фиаско и потому избрал другой путь. При желании здесь можно усмотреть самокритику, но не более.
Повторите методику.
А зачем? Моя методика меня вполне устраивает.
Когда заинтересует качество результата - приходите - побеседуем.
Я выложил на сайте несколько DjVu-книг собственного изготовления (в списке моих книг их легко отличить от произведений других умельцев по указанному в описании разрешению сканирования, обычно это 400 dpi). Как я понимаю, Вас не устраивает их качество. Каких именно и по каким параметрам? Укажите эти файлы: истина всегда конкретна. В противном случае буду вынужден считать Вашу критику безосновательной, ибо серьёзный человек говорит обоснованно.
1) Люди делятся на тех кто может делать, и поэтому делает, и на тех, кто делать не может, и поэтому поучает, как надо делать. Козе понятно, к какому типу я отношу авторов высказываний с этих страниц.
о! так все учебники и научные труды - лажа?
2) Есть два способа преодоления преград типа «телеграфный столб» — перелезть и обойти. В отличие от упомянутых выше личностей я предпочитаю второй способ: обойти столб, т.е. не внедрять OCR-слой в имеющийся файл, а заново создавать DjVu-файл с OCR-слоем. И если руки у человека растут… гммм… из правильного места, то и результат будет таким, каким ему положено быть.
принцип GIMGO знаком?
Для интереса посмотрел, какой программный продукт выдал мне лучшие результаты. Это оказалась версия 2.1 открытой библиотеки DjVuLibre.
это чем? там разные утилитки есть. и разделяемый словарь они не умеют создавать. а у человека с головой и djvusmall всегда есть возможность варьировать сжатие/качество. в djvu напрягает то, что нет единого алгоритма выбора опций.
P.S. Обратил внимание, что Вы любите, преимущественно не по делу, оснащать свою речь умными оборотами типа «принцип Парето (к Вашему сведению, в русском языке имена собственные пишутся с заглавной буквы). А вот применять на практике «бритву Оккама» не умеете и даже не можете догадаться, что из принципа GIMGO вытекает необходимость иметь запас по качеству для обрабатываемых данных. Учиться, учиться и ещё раз учиться…
Кажется, друг мой, Вы теряете терпение и начинаете ругаться. Не надо… Брань есть довод того, у кого нет аргументов. Не касаясь конкретных вопросов, выскажу общее впечатление, которое сложилось у меня о Вашем подходе к созданию DjVu-книг. Судя по тому, какое внимание Вы уделяете постобработке сканов, Вы имеете дело преимущественно с некачественными сканами. Что тут сказать… Из дерьма, конечно, можно сделать конфетку, только конфетка эта будет дерьмовая. Если Вы вынуждены иметь дело с чужими сканами, то Вам можно только посочувствовать и пожелать дальнейших успехов на пути создания… гммм… конфет. Если же Вы сканируете сами, то совершенствуйте мастерство в работе с железом, и тогда не придётся мочиться кипятком, выправляя дефекты сканирования программным путём, и дефолтные настройки DjVu-кодеров будут устраивать, и вообще жизнь станет гораздо приятней. Успехов!
Простите, если мои замечания похожи на ругань. А про DjvuLibre и DjvuSmall вы не ответили. Если уж пишете - то будьте точны, чтобы можно было верифицировать ваши утверждения.
P.S. Обратил внимание, что Вы любите, преимущественно не по делу, оснащать свою речь умными оборотами типа «принцип Парето (к Вашему сведению, в русском языке имена собственные пишутся с заглавной буквы). А вот применять на практике «бритву Оккама» не умеете и даже не можете догадаться, что из принципа GIMGO вытекает необходимость иметь запас по качеству для обрабатываемых данных. Учиться, учиться и ещё раз учиться…
С файнридером одна проблема - он не дает выбора. А значит, что не является универсальным инструментом. Изменения вносимые в исходное изображение иногда абсолютно не нужны - потому лучший вариант - распознавать одним ПО, кодировать в DjVu - другим. Швейцарский нож - это на любителя. В целом FR11 приемлем. Книги ваши посмотрю.
что в приведенной методике переноса текстового слоя непонятно
Всё понятно. Знаете присказку: «если с первого раза не получилось, то парашютный спорт не для вас»? У меня не получилось, от создания DjVu-книг я вообще тогда отказался и вернулся к этой теме только после появления FR11.
о! так все учебники и научные труды - лажа?
О! Вы, батенька, кажется, увлекаетесь софистикой? За свою жизнь чего я только не понаписал, и одна из моих статей (не опубликованная, конечно) называлась «Пособие начинающему демагогу». Боюсь, что Вам рано со мной тягаться на этом поле.
принцип GIMGO знаком?
С позиций этого принципа идеальным был бы вариант, когда DjVu-книга от начала (этап сканирования) и до конца (создание DjVu-файла) создавалась бы в одной программе. Таковая в наличии имеется, но выдаваемый ею результат не всегда приемлем.
А про DjvuLibre и DjvuSmall вы не ответили.
Ответил, но мне нетрудно повторить. 1) Djvu Small попробовал один раз, не получилось, и Вы любезно объяснили мне причину. Повторять попытку не планирую до тех пор, пока жизнь не заставит. 2) Герой Бомарше не подозревал, что разговаривает прозой, пока ему это не объяснили. Я не подозревал, что использую DjVuLibre до тех пор, пока Вы меня не растормошили и я не заглянул в папку с файлами программы-оболочки. Ничего более по поводу этой библиотеки я сказать не могу.
это чем?
И на этот вопрос я уже отвечал. Цитирую самого себя:
я создаю PDF-файл и уже его преобразую в DjVu. Загляните на страничку Книгомастера — мы с ним достаточно подробно обсудили этот вопрос, там есть все необходимые ссылки. Более того, Книгомастер экспериментировал с различными программами-конверторами и получил интересные результаты.
Идём дальше.
у человека с головой и djvusmall всегда есть возможность варьировать сжатие/качество.
Следует ли понимать Вас так, что у людей, не использующих Вашу любимую программу (против которой ничего не имею) по не зависящим от них причинам (могли бы, дескать, ради такого случая поменять свою любимую операционку на более древнюю) упомянутый выше орган человеческого тела отсутствует? Рассмотрение сути вопроса я откладываю до выяснения этой вспомогательной проблемы.
Если уж пишете - то будьте точны, чтобы можно было верифицировать ваши утверждения.
Сент-Экзюпери учит нас, что из качественного текста нельзя удалить ни единого слова. Здесь же можно удалить целое предложение. Вы этого не сделали, поэтому пришлось потыкать Вас… гммм… попенять Вам на невнимательность.
лучший вариант - распознавать одним ПО, кодировать в DjVu - другим
Утверждение излишне категорично и справедливо не во всех случаях. Вынужден снова заняться самоцитированием:
Если книга не содержит полутоновых иллюстраций, т.е. мы имеем дело только с ч/б текстом, то Файнридер выдаёт вполне приличный результат.
И последнее.
В целом FR11 приемлем.
У меня много претензий к этой программе. Вы можете предложить что-то получше для распознавания русских и смешанных текстов? Что именно и где взять? Я с удовольствием воспользуюсь Вашей рекомендацией после проверки на её совместимость с моей системой. Пока же «за неимением гербовой приходится писать на простой».Успехов!
Комментарии
Спасибо за перевод нашей книги Маркин А.Н., Низамов Р.Э., Суховерхов С.В. Нефтепромысловая химия: практическое руководство в формат DJVU. Я скачал файл, но он не открывается на Mac программой DjVuReader Ex. Можете что-то посоветовать, как открыть его этой программой?
С уважением, Graffist
С Рождеством!
С Рождеством Христовым Вас!
преимущества djvusmall - обработка скольугодно большого списка файлов, сегментация и разделяемые словари фигур. с тонкой настройкой кодера.потому неясно - какой такой вы альтернативный кодер нашли? то что я видел из бесплатного - это в лучшем случае - огромный файл на выходе без возможности тонкой настройки кодирования.я предполагаю, что вы пользуете FineReader11. мне просто интересно - что лучше djvusmall (фирменных утилит лизардтеш)?
Файнридер хорош.... и текстовый слой у него... гммм... нестандарт. Кодирует вроде неплохо... Текстовый слой... почти хорош. Некопируемый. И кодирование нельзя настроить. так что fr11 годится, но... для тех кому деваться некуда.
А с дежавю не так все просто - на том форуме есть обсуждение творений каминовы.
Формат мне нравится. Но ограничения бесплатных кодеров - нет. Хорош пока только ломаный консольный. Попробуйте улучшить качество кодирования и вы поймете. В свое время я тоже сидел на файнридере и писал кипятком от разрезки страниц и выравнивания. Сейчас изучил под микроскопом свою продукцию и ужаснулся - пляшущие буковки, "инь" от соло и dee 6... место экономил. время. теперь вынужден изучить вопрос.
На текущий момент, как сказала известная птичка, пребывайте в FR11+W7x64.
Успехов вам на х64!
P.S. А что не устроило в методике переноса текстового слоя?
а у человека с головой и djvusmall всегда есть возможность варьировать сжатие/качество.
в djvu напрягает то, что нет единого алгоритма выбора опций.
А про DjvuLibre и DjvuSmall вы не ответили. Если уж пишете - то будьте точны, чтобы можно было верифицировать ваши утверждения.