Зарегистрироваться
Восстановить пароль
FAQ по входу

Как повысить точность результата при поиске по сайту?

  • Добавлена пользователем
  • Отредактирована
Установлено и неоднократно проверено опытным путём.
Наверняка многие сталкивались с ситуациями, когда:
- поиск нужного файла через поисковую строку ничего не дал, однако спустя время он был благополучно найден при ручном поиске;
- после добросовестной проверки на повтор выкладываемого файла через полчаса всё же пришла "плюха" от Автомодератора о побайтном повторе.
К сожалению, на 100% такие ситуации исключить невозможно по следующим причинам:
* поиском не индексируются неодобренные файлы;
* поиск чувствителен к малейшим несоответствиям, поэтому может не сработать, если в заглавие раннего файла вкралась ошибка.
Тем не менее, имеется ряд возможностей минимизировать риск подобных ошибок, а именно:
0) Само собой разумеется, что запрос должен быть набран без ошибок и опечаток.
К критическим опечаткам относятся, среди прочего, символы, незаметно для глаза набранные не в той раскладке (например, с кириллическое vs. с латинское).
Дословность названия имеет колоссальное значение.
Если искомый материал называется "Справочник туриста", шансы найти его по запросу "Справочник для туриста" существенно снижаются.
Для точного поиска все указываемые в поисковой строке слова и формы слов (включая служебные - союзы, предлоги и т.д.) должны прямо совпадать с обложкой/титульным листом/библиоданными книги.
Если же название известно лишь приблизительно, следует использовать для поиска лишь ключевые знаменательные слова заголовка, дабы поиск смог найти все подходящие совпадения, не запнувшись об отличающиеся союзы/предлоги/артикли/и пр.
1) Для книг и иных материалов, оформляемых как книги (статья, методичка, диссертация и т.п.), поисковый запрос стоит формулировать в виде Фамилия Название.
Без имени или инициалов автора, т.к. шаблоны Фамилия И.(О.) и Фамилия Имя - равно допустимые на сайте - разнятся от файла к файлу.
Без подзаголовков, т.к. их указание/неуказание также разнится.
Кроме того, у материалов с длинными заглавиями рекомендуется вводить лишь начало названия.
Если у материала несколько авторов, стоит сделать несколько запросов, каждый раз вводя одну из фамилий поодиночке в сочетании с названием. Начинать с той, которая стоит на титуле первой (чаще всего указывается именно она).
Также следует попробовать поискать по фамилии редактора + названию - на тот случай, если вместо нескольких авторов предпочли указать одного редактора.
2) Для материалов, которые могут не иметь автора/редактора/составителя в заголовке (энциклопедии, сборники статей, дидактические материалы в педагогике, любые издания без явно указанного на обложке и/или титуле автора/редактора/составителя), стоит в дополнение к предыдущему шагу произвести поиск только по названию.
Если название слишком безликое, в дополнение к нему стоит попробовать указать год или издательство.
3) При поиске статьи имеет смысл проверять журнал или сборник, в который она входит.
Напоминаю, что одиночные статьи на сайте не размещаются при наличии полного журнала/сборника.
4) При поиске конкретных выпусков цельных периодических изданий наилучшие результаты даст запрос в виде Название журнала Год Номер (без знака "№" !) — например Научный журнал 1990 01.
5) При поиске на иностранных языках не пренебрегайте диакритическими знаками (дополнительные символы, уточняющие произношение, например á ä ã и т.п.) К ним поиск также чувствителен.
(По этой же причине не следует пренебрегать ими при оформлении файлов).
***
Внимание! Поиск на языках, использующих графику, отличную от латиницы и кириллицы (греческий, арабский, китайский, японский и т.д. и т.п.), не доступен нашему поисковому механизму в принципе.
Что делать:
- использовать общедоступные поисковики для поиска по нашему сайту;
- по возможности - проверять вручную (просматривая подходящие разделы).
***
На сайте не работают привычные по многим поисковым системам операторы-уточнители запроса.
Однако доступно нечто более интересное.
Для того чтобы указанный синтаксис действовал, поисковый запрос необходимо начинать с символа ~.
***
Last but not least: не следует огорчаться, если при всех возможных принимаемых мерах избежать повтора всё-таки не удалось.
Поскольку о несовершенствах поиска известно, никто Вас за это не осудит )
Дабы не пропал даром Ваш труд по составлению описания, удачным решением будет дополнить Вашим текстом описание более раннего файла - особенно если оно было изначально скудным и как раз это послужило причиной неудачи поиска.
Тема будет дополняться по мере необходимости. Наблюдения и пожелания в этой связи приветствуются.

Комментарии

Добрый день! Ввиду того, что поиска по символам, не входящим в русский и английский алфавиты на сайте нет, есть ли у Вас рекомендации относительно того, что делать с диакритическими знаками при создании нового файла? Оставлять ли ударения, умлауты, гачеки и домики (Müller > Muller, и т.д.) или упрощать написание для того, чтобы файлы было легче найти при поиске? Вопрос относится и к правкам, например, здесь теперь живут Bartoněk A. и Bartonek A.
Судя по всему, поиск их игнорирует.
Описания традиционно составляются по всем правилам своего языка.
Мы же не можем ради поисковой оптимизации запретить писать по-гречески или китайски.
Логично. Допустимо ли в целях оптимизации поиска включать альтернативное написание фамилии в описание файла? В вышеописанном случае большинство пользователей будут вводить с клавиатуры "Bartonek", и если указать это написание в описание файла под фамилией Bartoněk, то "найдется все". Или?
Дублировать имя автора просто по правилам оформления не стоит.
P. S. По Bartonek поиск не нашёл ничего, кроме Вашего комментария.
По Bartoněk прекрасно нашёл соответствующие книги. Так что, очевидно, поводов для беспокойства по поводу диакритики нет. )
Это из-за того, что кто-то уже вставил диакритику, так что на мой взгляд проблема остаётся. Впрочем, это все не так уж важно, поскольку пользователи, в конце концов, могут просматривать разделы. Буду писать по правилам языка оригинала.
Внутренним поиском буква с диакритикой игнорируется. Поиск идет по строке "Barton k", она отличается от строки "Bartonek".
В результатах Гугл или Яндекс будут оба варианта Bartoněk и Bartonek
Мораль комментария выше, в общем, в том, что "не пренебрегайте оригинальным написанием и всё найдётся".
Речь не только о диакритике, но и в более широком плане.
Наблюдение:
Хочу обратить внимание на такой момент. Сейчас делал запрос "Маклакова 2000", желая найти книги автора, изданные именно в этом году и /file/12787/ и /file/254135/ в выдачу не попали, так как в описаниях нет пробела между "2000" и "г" (такое по сайту встречается часто) и система "2000г" воспринимает как одно слово.
Именно поэтому все эти "г."стоит удалять при правках.
Поиска по символам, не входящим в русский и английский алфавиты нет. В частности, книгу по китайскому названию искать бесполезно. Но стоит попробовать яндекс отметив там поиск по сайту
Диакритику всю поиск понимает! Проверял на примере французского, испанского и польского. (или вы имели в виду вместо "русский и английский" "кириллицу и латиницу"?)
В этом плане раньше спасал инструмент от яндекса, который появлялся в случае, если ничего не найдено или поиск недоступен по тех.причинам (что бывает нередко). Однажды я впастил что-то греческое и яндекс мне сразу всё очень точно нашел.
Кроме того, яндекс искал не только точные соответствия, но и что-то очень похожее, что часто выручало в случае опечаток при вводе, ошибок в оформлении файла и т.п. Недавно искал и не мог найти книгу, а после выяснилось, что в заголовке была мини-ошибка (что-то типа "Воробъев" вместо "Воробьев", то, что в глаза не бросается, такого очень много). Или, бывает, введешь что-нибудь с опечаткой, не заметишь и тупишь потом минут 15, почему же на сайте так мало книг по ахиртектуре (это на пример, бывают гораздо более сложные случаи). А был бы яндекс,
он бы мигом подобные моменты вычленял бы.
Это я всё к тому, что есть ли возможность, как ранее вернуть на сайт Яндекс как дополнительный инструмент поиска?
Именно поэтому приходится настаивать, чтобы поисковые запросы вводились аккуратно, без ошибок и опечаток.
В принципе, никакого вреда, кроме пользы, от соблюдения этого требования не должно быть )
Поиск → szczęście
Поиск → szczążcie
Местный поиск считает дополнительные буквы латиницы и кириллицы пробелами. Так как в большинстве языков таких символов немного, поиск на них хоть как-то работает. А если китайский, который весь из юникода, то не работает никак. Искать дубликаты в китайском разделе невозможно.
Да, хорошо бы вернуть яндекс, если нет серьезных причин, мешающих этому.
Он мне по новогреческому слову logotekhnia [греческими буквами] ничего не нашёл (
По поводу яндекса комментировать не могу, но есть подозрение, что это не только от нас зависит.
Греческие буквы местный поиск просто не видит, так что фактически вы дали запрос с пустой строкой. Запрос на польское счастье равносилен "szcz cie", поэтому скорее всего счастье и он найдет. То, что поиск видит и находит, выделено жирным в результатах.
Пусть меня поправят, если неправ.
Еще можно дополнить (или в виде отдельной темы) описанием этого синтаксиса который работает при добавлении к начало запроса тильды (~).
Спасибо!
Пока пусть будет эта ссылка, м.б. позднее сделаю инструкцию в переводе на наши реалии.
В этом разделе нет комментариев.