Поиск по сайту. О Shpinx "своими словами".
Проблема организации хорошего поиска по сайту действительно большая. В основном для этого используют стандартные решения: встроенные модули, пишут дополнительные модули, оптимизируют уже готовые модули, но, как правило, этого бывает недостаточно, если действительно нужно повысить качество поиска по сайту. На помощь могут прийти поисковые системы таких гигантов, как Google, Yandex, Bing, но и они могут не подойти, в силу специфики Вашего наполнения сайта. Или же Вы, по разным причинам, не хотите, чтобы на Вашем крутом сайте красовался не менее крутой логотипчик тех же Google, Yandex, Bing. При этом одно из Ваших требований - это качественный поиск, позволяющий искать Ваш товар или услуги корректно.
В таком случае можно воспользоваться поисковой машиной Sphinx. Подробнее о самой поисковой машине Вы можете прочитать на сайте разработчиков.
Итак, принцип поиска и что именно умеет эта поисковая машина?
Пример поискового запроса по сайту: "Мама мыла раму".
На самом деле данный поисковый запрос разбирают на слова по отдельности, а именно:
- мама;
- мыла;
- раму;
после чего, еще выделяют, а точнее, пытаются выделить исходную форму слова:
- мама - с этим словом все однозначно ясно;
- мыла - здесь непонятно, что именно за слово;
- мыть - действие - мыть;
- мыло - предмет, обычное мыло;
- раму;
- Рам - кличка собаки;
- от "Харе кришна харе рама";
- рама - собственно оконная рама.
после чего, в принципе, и начинается поиск...
Данные преобразования нужны для того, чтобы "поймать" наибольшее количество вариантов по тексту в наполнении сайта.
Но тут же может возникнуть проблема: возможно, на сайте такого же точно порядка слов по тексту нет, но есть похожий по смыслу словесный ряд, что тогда? Стандартные модули могут и не справиться с такой задачей, Sphinx же решит ее.
Опечатки в поиске.
Допустим, что в этом поисковом запросе мы еще и опечатку сделали. Например, вместо слова "мыла" написали "млыа". В таком случае Sphinx, с помощью хитрых манипуляций, можно настроить и на такой поиск опечаток.
Словоформы.
Все же бывают случаи, когда стандартного выделения из слова исходной формы не хватает, и почему-то слово "раму" разценили не как оконную раму, а как нечто другое. Но мы точно знаем, что это слово у нас на сайте может принять именно такой характер, и исходное слово в нашем случае должно быть "рама". Для этого предусмотрено использование базы словоформ, которую можно сформировать исключительно под нужды сайта, тем самым "научив" поисковую машину, правильно воспринимать контекст.
Также базу словоформ можно использовать и для таких случаев.
Пример:
- поисковый запрос: экономика соединенных штатов америки:
- поисковый запрос: экономика США.
Допустим, что в первом случае пользователь ввел поисковый запрос, но у нас на сайте не используется аббревиатура.
Допустим, что во втором случае пользователь ввел поисковый запрос, но у нас на сайте нет ни одной аббревиатуры, а есть полные ее расшифровки.
И в том, и в другом случае пользователь будет либо долго искать и подбирать ключевой запрос сам, либо уйдет на другой сайт, где это в поисковой машине учтено, или наполнение сайта оптимизировано под данный запрос.
Такой момент тоже может решить поисковая машина Sphinx.
Спецсимволы.
В данном контексте такими специальными символами могут быть ", ', &, /, - и т.д., а у Вас на сайте ищут как раз такие слова, в которых используются спецсимволы.
Например:
- P&G (Procter & Gamble);
- LSW-3/01.
И в том, и в другом случае стандартные поисковые модули на сайтах могут ничего не выдать, или вообще выдать ошибку. Здесь же можно все гибко настроить.
Выводы.
Плюсы:
такая поисковая машина может учесть:
- "смысл поискового запроса" и предложить схожее с ним соответствие;
- перестановку слов;
- опечатки;
- словоформы;
- использование спецсимволов.
Минусы:
Скорее, один минус - данную машину нельзя установить на обычном хостинге.
Услуги по настройке поиска на сайте
Наша студия может квалифицированно помочь Вам в настройке такой поисковой машины. Если Вам нужен качественный поиск по сайту - звоните или пишите, мы всегда рады Вам помочь.
Данный блок был написан с использованием материалов, полученных на мастер-классе Андрея Аксенова "Как готовить Sphinx", который проходил в Киеве 18-го июня 2011. Организатор мастер-класса - компания SmartMe.
