Замечание по поводу Вашего комментария о файле /file/2195254/ ... Выдержка из письма: "Отправитель: Dosia На странице: Борн М., Вольф Э. Основы оптики Комментарий: Пожалуйста, объяснитесь по этому поводу с Сергей В ответ на: Взяли наугад 4-ю страницу описания: "Основы оптики. Ъорн Л1 , Вольф Э., изд. 2-е. Пере- вод с английского. Главная редакция физико-математической . литературы изд-ва «Наука», 1973. Наиболее полный и авторитетный труд по оптике в миро- вой литературе, учитывающий все последние достижения классической теории. Излагаются макроскопические уравнения Максвелла с фор- мально введенными константами и подробно разбираются во- просы распространения электромагнитных волн в среде, а также связь этих констант с поляризацией и намагничением. Уравнения геометрической оптики последовательно выво- дятся из уравнении Максвелла (при этом автоматически учитывается поперечность и векторный характер световых волн) и затем применяются к теории оптического изображения и к расчету аберраций. Рассматриваются интерференция, эле- ментарная и строгая теория дифракции, дифракционная теория аберраций и дифракция света на ультразвуковых волнах. Подробно излагаются вопросы распространения, интерференции и дифракции частично когерентного света; основное внимание уделяется случаю квазимопохроматического излучения, причем общее рассмотрение строится на использовании метода корре- ляционных функций Излагаются вопросы металлооптики и кристаллооптики. Во всей книге много внимания уделяется изложению математического аппарата. Таблиц 30, иллюстраций 369, библиография 814 назв." Всего три ошибки: "Ъорн Л1" вместо "Борн М ", "световых волн) " вместо "световых волн ". Где же здесь "текст НЕ ВЫЧИТАН И НЕ ВЫЧИЩЕН" по мнению СергейБал? Подчеркиваем, что речь идет только о русском тексте и латинских буквах. Dosia в последнем замечании предлагает оставлять формулы картинками. В книге полно формул. Картинки имеют большой объем в байтах. Файл уже весит 17,90 МБ. Будет ли кто скачивать файл размером 40-50 МБ, если учесть, что формат Де Жа Вю практически не сжимаем? Вопрос риторический. Он применим ко всем математическим текстам. Одна из причин того, что их в "качественно распознанных книгах сайта (понятно, их единицы)" (цитируется Dosia), - именно единицы, если речь идет о математических книгах."
(в цитате ниже) указывает на то, что вычитку даже русского текста нельзя назвать безупречной.Вы и сами это признали, когда упомянули про "всего три ошибки". Не всего три, а целых три.
Вы же признаете, что в тексте OCR-слоя есть ошибки, а это означает, что он НЕ ВЫЧИТАН И НЕ ВЫЧИЩЕН. О чем тут спорить?Но я еще кое-что хочу добавить к своему ответу. Возьмите "наугад" страницу с формулами, рисунком или таблицей. Вот, например, стр. 176 имеет такой OCR-слой:
При (pt= фг> i|?i р2 это выражение с учетом A4), A6) и A7) принимает вид B3) Так как п> 1, то tpi>tj;i; кроме того, поскольку 0 р1 я/2, то tg pi:>0. Следовательно, (d26/d Pi)>Q, т. е. отклонение минимально. Из B1) следует, что при таком отклонении лучи проходят через призму симметрично. Величина угла наименьшего отклонения, равна г„я — 2ч>1—а. B4) Углы падения и преломления иа первой грани призмы можно выразить через емнн и а в виде откуда п = sin \— (е sin_$i _ 12 е""" sin ( j a B6) Последняя формула часто используется при определении показателя прелом- ления стекла. С помощью спек- трометра измеряют значения еЧ1Ш в»/ \ i || ~>/»г и а' а затем п0 формуле B6) вы- ¦^х \ г \ I —• числяют величину п. Рассмотрим теперь прохож- дение через призму пучка парал- лельных лучей, выходящих, на- пример, из точечного источника Р, расположенного в фокальной плоскости линзы Lx (рис. 4.28); свет по-прежнему считается мо- нохроматическим. Пусть В, и Рис. 4.28. Схема, иллюстрирующая дисперсию призмы В', — основания перпендикуля- ров, опущенных из точек Вг и S2 на лучи, которые проходят через ребро А. Тогда BiB[ и В2В'2 являются линиями пересечения двух волновых фронтов с плоскостью падения (плоскостью чертежа). Эти две линии образуют между собой угол, равный углу отклонения в. Положим 6,5; = /,, b2b;=/s, BtB%=t. B7) Рассмотрим теперь параллельный^ пучок немонохроматического света. Если линза Lx исправлена на хроматическую аберрацию, то Bi-б', останется на волновом фронте падающего пучка. С другой стороны, линия В»В'% уже не будет единственной; ее положение будет зависеть от длины волиы X, поскольку пока- затель преломления призмы зависит от длины волны, т. е. п~п(К), B8) а следовательно, угол отклонения к тоже зависит от Я: Величину ds ds dn B9) C0) соответствующую постоянному значению угла падения q>i, часто называют угловой дисперсией призмы. Первый сомножитель в правой части C0) зависит только от геометрии системы, а второй характеризует относительную дисперсию
\в цитате пришлось удалить символы "<" чтобы не интерпретировалось как html-код\Где тут хоть что-то отдаленно напоминающее ВЫЧИТАН И ВЫЧИЩЕН? Вы представляете себе, сколько времени пользователю понадобится на правку этого текста? Какова польза от такого OCR-слоя? Взялись делать СУЩЕСТВЕННО УЛУЧШЕННЫЙ файл - ну так делайте! От начала и до конца. Сетуете на потенциально большой размер итогового файла при графическом представлении формул, рисунков и таблиц? Тогда хотя бы потрудитесь исключить их из текстовых блоков при распознавании. И тогда получите действительно чистый текст, как это и подразумевается п. 5 правил. Ах, формул, рисунков и таблиц слишком много и вам жалко тратить время на эту работу? Тогда не беритесь за этот труд. И не апеллируйте к тому, что качественно распознанных книг единицы. Это похоже на оправдание халтуры. Настаиваю на своем возражении против замены оригинального /file/35111/, на поделку типа /file/2195254/ . Вместе с тем, не буду возражать против замены /file/35111/ на файл с действительно качественным OCR-слоем, который был подвергнут редактированию, вычищен и вычитан. Но это не относится к /file/2195254/ . С уважением, ваш Сергей.
Сергей, спасибо за файл "Введение в нанотехнологию". Готовлю лекцию. Боялась, что не найду материал для презентации. И вот пожалуйста. Очень кстати. Как говорится - дорога ложка к обеду.
Комментарии
Выдержка из письма:
"Отправитель: Dosia
На странице: Борн М., Вольф Э. Основы оптики
Комментарий:
Пожалуйста, объяснитесь по этому поводу с Сергей
В ответ на:
Взяли наугад 4-ю страницу описания:
"Основы оптики. Ъорн Л1 , Вольф Э., изд. 2-е. Пере-
вод с английского. Главная редакция физико-математической
. литературы изд-ва «Наука», 1973.
Наиболее полный и авторитетный труд по оптике в миро-
вой литературе, учитывающий все последние достижения
классической теории.
Излагаются макроскопические уравнения Максвелла с фор-
мально введенными константами и подробно разбираются во-
просы распространения электромагнитных волн в среде, а также
связь этих констант с поляризацией и намагничением.
Уравнения геометрической оптики последовательно выво-
дятся из уравнении Максвелла (при этом автоматически
учитывается поперечность и векторный характер световых волн)
и затем применяются к теории оптического изображения
и к расчету аберраций. Рассматриваются интерференция, эле-
ментарная и строгая теория дифракции, дифракционная теория
аберраций и дифракция света на ультразвуковых волнах.
Подробно излагаются вопросы распространения, интерференции
и дифракции частично когерентного света; основное внимание
уделяется случаю квазимопохроматического излучения, причем
общее рассмотрение строится на использовании метода корре-
ляционных функций Излагаются вопросы металлооптики
и кристаллооптики.
Во всей книге много внимания уделяется изложению
математического аппарата.
Таблиц 30, иллюстраций 369, библиография 814 назв."
Всего три ошибки: "Ъорн Л1" вместо "Борн М ", "световых волн) " вместо "световых волн ".
Где же здесь "текст НЕ ВЫЧИТАН И НЕ ВЫЧИЩЕН" по мнению СергейБал?
Подчеркиваем, что речь идет только о русском тексте и латинских буквах.
Dosia в последнем замечании предлагает оставлять формулы картинками.
В книге полно формул. Картинки имеют большой объем в байтах. Файл уже весит 17,90 МБ. Будет ли кто скачивать файл размером 40-50 МБ, если учесть, что формат Де Жа Вю практически не сжимаем? Вопрос риторический.
Он применим ко всем математическим текстам. Одна из причин того, что их в "качественно распознанных книгах сайта (понятно, их единицы)" (цитируется Dosia), - именно единицы, если речь идет о математических книгах."
указывает на то, что вычитку даже русского текста нельзя назвать безупречной.Вы и сами это признали, когда упомянули про "всего три ошибки".
Не всего три, а целых три.
Взялись делать СУЩЕСТВЕННО УЛУЧШЕННЫЙ файл - ну так делайте! От начала и до конца. Сетуете на потенциально большой размер итогового файла при графическом представлении формул, рисунков и таблиц? Тогда хотя бы потрудитесь исключить их из текстовых блоков при распознавании. И тогда получите действительно чистый текст, как это и подразумевается п. 5 правил. Ах, формул, рисунков и таблиц слишком много и вам жалко тратить время на эту работу? Тогда не беритесь за этот труд.
И не апеллируйте к тому, что качественно распознанных книг единицы. Это похоже на оправдание халтуры.
Настаиваю на своем возражении против замены оригинального /file/35111/, на поделку типа /file/2195254/ . Вместе с тем, не буду возражать против замены /file/35111/ на файл с действительно качественным OCR-слоем, который был подвергнут редактированию, вычищен и вычитан. Но это не относится к /file/2195254/ .
С уважением,
ваш Сергей.