Многогранный поиск Gone Wild: эффективное использование Endeca и Lucene для SEO

Граненый поиск был довольно редким. Теперь, кажется, везде! Неправильное получение подробных сведений о том, как вы изменяете видимость сайтов при поиске с помощью этой функции, является одной из наиболее часто встречающихся проблем на сайтах электронной коммерции сегодня. Здесь, на Flying Point Digital, мы снова и снова сталкиваемся с одними и теми же проблемами, и с точки зрения SEO это не просто «сделать страницы категорий лучше». Хотя это важная часть исправления, это только половина истории.

Спасибо, Капитан Очевидность

Существует достаточно упущения или неправильного представления о том, что происходит с граненым поиском и насколько хорош этот метод навигации по сайту для SEO, что пришло время написать статью. Это та же самая, старая, случайная история о ловушке паука, но с изюминкой. Или, скажем так, с новыми измерениями. Для тех, кто какое-то время занимался SEO-индустрией, это, вероятно, достаточно информации, чтобы и вывести, и решить проблему. Фасетный поиск создает паутинную ловушку размером с любую комбинацию возможных вариантов фасетов, если ваша навигация «дружественна поиску».

Проблема определена. Решения неявные. Вы соленые старые собаки SEO-индустрии могут уйти. Для тех, кто только слышит об этом или имеет дело с этим впервые, читайте дальше. Сначала мы погрузим вас в историю, плохую ситуацию, которая часто существует на таких сайтах, а затем, в конце концов, выложим несколько общих штрихов одного возможного решения.

Сначала мы погрузим вас в историю, плохую ситуацию, которая часто существует на таких сайтах, а затем, в конце концов, выложим несколько общих штрихов одного возможного решения

Каталоги миллионов продуктов

Везде, где есть электронная коммерция с большими каталогами, насчитывающими миллионы или даже десятки тысяч продуктов, существуют структурированные данные, такие как цена, цвет и размер, чтобы описать все это. И термин, выбранный для описания пользовательских интерфейсов, построенных вокруг поиска и фильтрации с использованием таких описателей продукта, является аспектом.

Фасетный поиск - это просто все фильтры, по которым вы можете щелкнуть, чтобы уточнить поиск, помимо добавления ключевых слов или детализации навигации. Здесь есть некоторые формальные определения и подразумеваемая нечувствительность к порядку (чего нет при переходе по иерархии). Развертывание чувствительных к порядку меню (например, веб-гиперссылок) подразумевает определенную завершенность вашего исследования. Все, что вы «находите», аналогично файлам на жестком диске или узлам дерева. В то время как это возможно, просто сложнее создать ловушки для пауков с помощью навигации вниз. Именно так в основном работает Интернет, и именно это делает поиск и индексирование Google такой блестящей и эффективной системой. Это также то, что дало Google несправедливую репутацию «не любящих» динамических сайтов.

Ловушки пауков и смешанные сообщения

Как только в URL вводится знак вопроса, сайт считается «динамическим», и сайт может работать вечно. Подумайте о веб-странице календаря, где вы всегда можете нажать ссылку «на следующий день». Это действительно так просто - создать ловушку для пауков. И не наличие знака вопроса делает сайт динамическим, плохим или нечитаемым для Google каким-либо образом. Дело в том, что вопросительный знак присутствует на типах сайтов, которые Google в какой-то момент должен отложить в сторону, и продолжать заниматься поиском сайтов, которые не делают вещи несчастными. В противном случае все, казалось бы, бесконечные ресурсы Google были бы потрачены на то, чтобы создать один простой бесконечный календарь на одном маленьком сайте.

Динамические сайты (или URL) не так уж плохи, как считают некоторые. Что плохо, так это то, как легко делать случайные ловушки пауков и никогда не осознавать, что у вас даже есть проблема. Со стороны Google они просто реалистично переходят на следующий сайт, поэтому не тратят все свое время на раскручивание колес. В наши дни у Google гораздо больше желания смело нырять в ловушки пауков, откинуть несколько миллионов страниц и посмотреть, не могут ли они понять это.

В этой статье мы сосредоточимся на одном конкретном типе динамической URL-ловушки-паука, генерируемой навигационной схемой, часто называемой граненым поиском. Веселое слово, грани. Заставляет вас думать о порезанных гранях драгоценного камня. Я полагаю, что это отлично подходит для бизнеса электронной коммерции, и это проще, чем говорить о произвольно параметризованных или атрибутированных или многомерных или полевых фильтрах поиска. Не все параметризованный поиск являются аспектами. Аспекты, как правило, позволяют себе идти в разных порядках и, казалось бы, в бесконечных перестановках - и то, что делает их «гранями», и такая особенно неприятная ловушка для пауков.

Endeca и Lucene

Мы замечаем проблемы с поисковыми сайтами чаще, потому что теперь стало проще создавать сайты, которые их используют. Этот метод навигации был значительно реже из-за затрат и опыта, необходимых для его настройки, и из-за высоких требований к серверу для предоставления этой функции (с точными данными) в масштабе. Это меняется. Независимо от того, в чем заблокированы ваши данные, некоторые продукты, такие как Endeca (теперь от Oracle) или Lucene (проект Apache), могут провести его и построить базу данных и индексы, необходимые для подключения к компонентам создания сайтов, которые имеют уровень огранки. поиск по сайту.

Endeca долгое время была доминирующим коммерческим программным обеспечением корпоративного класса, предлагающим граненый поиск - именно поэтому вы слышите, что их имя вызывается так часто, когда возникает эта тема. Вы заплатите за это доверие, конечно. Но если у вас есть уверенность в себе и сильная команда разработчиков, есть альтернатива Lucene, не являющаяся частной (бесплатной и с открытым исходным кодом).

Lucene, как мне сказали, поскольку я не являюсь опытным разработчиком этого конкретного программного стека, делает почти все, что делает Endeca, даже с производительностью на уровне предприятия, но бесплатно. Как и в случае с Endeca, на самом деле существует целый пакет отдельных продуктов, которые работают вместе в своего рода экосистеме. Вершина этой экосистемы - Apache Software Foundation (эквивалент компании), затем проект Lucene (эквивалент продукта), а затем, часть, которая создает реальный веб-интерфейс, о котором мы говорим, - Solr или Elastic Search.

Так что все эти вещи Lucene и Endeca, по общему признанию, - это то, что ИТ-инфраструктура, с которой «Облако» должно удерживать вас от необходимости иметь дело, и создает ощущение старой школы «сделай сам». Если вы небольшая компания или просто не хотите проблем с реализацией и хотите использовать самые согласованные передовые методы из коробки и при этом считаться корпоративным классом, всегда есть Demandware или множество других продуктов, которые заполняют ниши между Endeca / Lucene в одном крайнем случае и самостоятельно размещенным экземпляром WooCommerce в WordPress в другом.

Кроме того, все действительно крупные технические игроки, такие как IBM, Microsoft и SAP, предлагают что-то, чтобы решить проблему многогранного поиска в Интернете. Endeca и Lucene - это имена, которые появляются снова и снова, когда вы занимаетесь поисковой оптимизацией и решаете эти проблемы, так что это простой способ сформулировать эту многогранную поисковую дискуссию, но имейте в виду, что на каждом конце спектра есть другие, и бесчисленное множество промежуточных. Если, например, вам нужна облачная простота Demandware, но с возможностью когда-нибудь взять все в свои руки, чтобы начать многоуровневую настройку в экстремальных условиях для получения конкурентного преимущества, Hybris находится на высоком уровне, а Magento на низком уровне.

Два экстремальных сценария

Но в конце концов, все эти инфраструктуры имеют некоторую форму поиска и должны иметь дело с одним и тем же набором проблем. Как правило, граненый поиск попадает в одну из двух категорий. Все миллионы потенциальных страниц, которые «становятся возможными», являются либо:

  1. Совершенно невидим для поиска по той или иной причине
  2. Доступен для поиска, но создает сайт, который робот Googlebot никогда не закончит сканировать и исследовать

В первом сценарии многогранные поисковые сайты, которые невидимы для поиска, либо невидимы, потому что пользовательский интерфейс построен со старомодными элементами CGI-формы и требует отправки или выполнения JavaScript для выполнения поиска, либо он фактически сканируемый, но владельцы сайта «отключили» возможность Google сканировать / индексировать сайт с помощью robots.txt или с помощью какого-либо другого механизма - обычно потому, что они страдали от проблем второй ситуации.

Во второй ситуации весь поисковый сайт и все потенциальные страницы, которые он может сгенерировать, отлично просматриваются Google. Однако страницы никогда не заканчиваются, и 99% этого бесконечного сканирования - дублированный контент. Другими словами, это ловушка для пауков. Google видит весь ваш сайт, но из-за нелепости поставленной перед ним задачи он сдается и переходит на следующий сайт.

Редко, но крайне важно подумать о том, что эта «ловушка для пауков» будет влиять на ваш рейтинг в поиске, разбавляя или полностью запутывая «базовый набор» важных страниц, которые ваш сайт может / должен генерировать, которые можно расположить в легко доступных -обнаружить пути кликов (основная и дополнительная навигация) и настроить их так, чтобы они соответствовали известным поисковым и известным конвертируемым ключевым словам.

Думайте с точки зрения фактических реальных деревьев

Итак, хитрость заключается в том, чтобы осветить этот основной набор страниц, например основной ствол и ветви дерева. Возможно, они представляют первые два выбранных аспекта или какой-то другой механизм для «определения основного набора страниц», который согласуется с тем, для чего предназначены ваши исследования ключевых слов. Ствол и ветки являются основными. Они являются вашим основным набором канонических неповторяющихся страниц, независимо от того, были ли они на самом деле созданы путем выбора параметров многогранного поиска. (Ваши основные страницы могут состоять из них).

Даже если ваш сайт может генерировать на миллионы больше страниц, чем этот, это «ядро» из 100-10000 страниц может стать вашим основным каноническим набором. Все остальные миллионы в основном дублирующих вариантов могут иметь канонические теги, возвращающие к наиболее подходящему URL из основного набора. Да, здесь могут быть некоторые пользовательские разработки, если ваш платформа электронной коммерции не поддерживает такие готовые трюки.

И это только один из подходов к тому, чтобы взять под контроль эти ловушки пауков - пусть все индексируется ... пусть ловушка пауков продолжает существовать ... но быть в курсе Google о том, что происходит и как кто-то проползает в конечном итоге ... очевидное ядро ​​/ важный набор - это чрезмерная и, возможно, ненужная работа. Google-поиск с модификатором сайта должен возвращать примерно то количество канонических основных страниц, которые вы сейчас явно рекламируете, а НЕ остальные, которые, как вы признаете, являются перестановками с низким приоритетом.

Лучшие решения всегда те, где сайт может генерировать только конечное количество страниц, и Google может пролистать их все за несколько дней. Попробуйте запустить Кричащая лягушка против сайта (с большим количеством памяти). Если это никогда не закончится, у вас может быть ловушка для пауков.

Это как на любом дереве, это может быть сложно, но вы могли бы сосчитать листья! Это возможно, но вы закончите. Так же Screaming Frog закончит ползти на правильно ограниченном сайте.

Порядок вопросов - сокращение перестановок

Определенная гибридизация фасетов может помочь контролировать ситуацию - например, заставить некоторые фасеты активировать только в сочетании с некоторыми другими фасетами, чтобы отразить и усилить ограничения отношения данных. Вы можете рассматривать это как комбинацию гораздо более конечной схемы детализации с поисковыми фасетами. (Фасеты представлены специально на определенных уровнях детализации). Развернутая навигация имеет тенденцию навязывать определенный порядок параметрам строки запроса (обфусцируется как папки или нет).

Вы также можете тщательно составить URL-адреса с определенным принудительным порядком для граней, чтобы иметь дело только с комбинациями, а не с перестановками. (Выполните поиск «комбинации против перестановок».) В частности, если вы выберете фасет A и затем фасет B в одном случае, а затем фасет B и затем фасет A в другом, URL-адреса будут отличаться, но в результате страница такая же. Это можно исправить, просто алфавитно или используя какой-то заранее установленный порядок отображения параметров в URL.

И, наконец, помня, что мы придерживаемся метафоры дерева для иерархии сайтов, цель дерева - разложить его ветви, веточки и листья, чтобы создать площадь поверхности с листьями для наиболее эффективного захвата солнечного света. Эволюция сформировала деревья так, что они не продолжают расти после того момента, когда они наиболее эффективно отражают свет.

Художественное оформление сайта

Как указывалось в заключении этой статьи, большинство многогранных поисковых сайтов либо делают свой сайт невидимым для поиска, либо невозможным сканирующим занятием. Настоящий ответ где-то посередине - художественное оформление. Есть много способов справиться с этим, от внесения изменений в файл robots.txt до настройки параметров Google Search Console (ранее Инструменты для веб-мастеров), до изменения мета-тегов в вашем источнике просмотра.

Решения разнообразны, и все они должны руководствоваться всеобъемлющей стратегией таргетинга на ключевые слова и основываться на том, что поддерживается вашей технологической платформой и может быть реализовано вашей командой. В отличие от естественных деревьев, чья максимальная форма определяется природными ограничениями, граненые сайты могут расти беспрепятственно, и вы никогда не узнаете об этом, за исключением того, что никогда не работали в Google.

Похожие

SEO Смотреть
... ия своих алгоритмов, которые изменяют отображение страниц поисковой системы. Качество SEO компания приложит все усилия, чтобы не отставать от этих обновлений, чтобы избежать отставания. В сентябре у Google было обновление, в котором маркетологи боролись, потому что они не понимали, что происходит. Не было анонса ожидающего обновления алгоритма в изменяющемся поведении в выдаче, и это было досадно, если не сказать больше. Последнее обновление
TYPO3 SEO
Анализ, определение потенциала, оптимизация и устойчивые изменения - это страсть. Нет, этот ботаник говорит не о себе, а о своем клиенте, CPC AG. SEO для CPC AG → OnPage SEO Консалтинг для 365FarmNet. Чтобы поисковая оптимизация
SEO компания, SEO услуги, Ченнаи, Мумбаи, Индия
... seo-kompania-seo-uslugi-cennai-mumbai-india-1.png> Местное SEO Ваш бизнес ориентирован на местную аудиторию, особенно в каком-либо районе города? Если это так, вам нужно привлечь трафик, ориентируясь на конкретные локальные области. Это поможет вам легко их найти, воспользовавшись Google Local SEO Services. Наша команда Web Rifer является экспертом в онлайн-продвижении Google Local SEO. Не стесняйтесь обращаться к нашей команде, чтобы продать или нацелить нужную аудиторию на
Майами SEO Компания
... для вашего бизнеса. Никакие два веб-сайта или клиенты не требуют одинаковой работы или одной и той же стратегии SEO. Вот почему мы рады поговорить с вами о ваших целях и о том, как наилучшим образом их достичь, о ранжировании первых страниц на страницах результатов поиска и об оптимальной окупаемости инвестиций. В основе нашей стратегии SEO лежат идеи, полученные из нашего постоянного анализа конкурентной среды, обширных исследований ключевых слов, профилей обратных ссылок, существующей
Offpage SEO - веб-переводы
Обратные ссылки на сайт могут повысить его эффективность в поисковых системах. Многие известные веб-сайты имеют нереализованный потенциал обратных ссылок, что дает конкурентам возможность извлечь выгоду, заполнив вакуум. Создание ссылок трудно сделать хорошо и устойчиво. Кроме того, для поддержания хорошего рейтинга в поисковых системах любые ссылки должны быть добавлены в соответствии с этическими нормами, чтобы избежать наказания со стороны поисковых систем. Наказание требует значительного
Сан-Диего SEO Эксперт
... ичие от многих SEO-фирм на Западном побережье, Quantm Media верит в этические методы SEO. Факты показывают, что вам не нужно обманывать поисковые системы, чтобы получить желаемый результат. Вы можете получить лучшие результаты, давая поисковым системам то, что они хотят. Конечно, вы не получите такого же мгновенного вознаграждения, если будете вести себя этично, как если бы использовали сомнительную тактику для ранжирования своего сайта, но долгосрочные выгоды намного перевешивают непосредственные
SEO не умер
Вы слышали слухи. Вы видели аналитические материалы, обсуждающие годовой спад органического трафика и то, как нативные мобильные приложения поглощают все «традиционные» поиски. Все это указывает на одну вещь, утверждают они - конец поисковой оптимизации.
SEO Australia - SEO услуги Австралия - веб-сайтgurus
... seo-australia-seo-uslugi-avstralia-veb-sajtgurus-1.jpg" alt="SEO Australia являются экспертами в основах поисковой оптимизации (SEO)"> SEO Australia являются экспертами в основах поисковой оптимизации (SEO). Есть несколько основных факторов, которые составляют этот важный аспект интернет-маркетинга. Вам не нужно знать их самим, потому что SEO Australia знает, но чтобы заверить вас, что ваш сайт будет создан с учетом основ SEO, вот несколько вещей, на которые стоит обратить внимание. SEO Australia
SEO Мастер SEO курс: помимо ключевых слов
... для содержания курса, а для одного из участников) и самое веселое из всех: общение с людьми, которым было о чем поговорить. После 16 часов вы в конечном итоге немного теряетесь от такого количества новостей, но я уверен, что большинство из них ушли с головами, полными идей и готовыми применить их на практике. Я рекомендую этот курс всем, я думаю, что он может помочь профессионалам, начинающим как я, и тем, кто уже на рынке.
Лучшая SEO компания Индия, Лучшее SEO агентство, Этическое SEO Сервис Индия
Знаете ли вы о SEO? Вы хотите занять место в топ поисковых систем, таких как Google? ДА, вы в нужном месте! В SEO AIM POINT У нас многолетний опыт в SEO, и мы занимаемся SEO, когда рейтинг в Yahoo был мечтой многих веб-сайтов. Поисковая оптимизация является важной
Топ 5 SEO плагинов для WordPress
... им из основных преимуществ WordPress CMS является то, что он достаточно прост в обращении и практичен для SEO . С хорошей темой и некоторыми плагинами мы можем быстро получить хороший веб-сайт за короткое время. Чтобы улучшить SEO , существует множество плагинов SEO для WordPress , но они

Комментарии

Знаете ли вы, Yoast SEO является одним из конечных SEO плагины для пользователей WordPress ?
... для Baidu. Но с чего начать? В Китае очень строгие законы об интернете, а язык сложен, поэтому может показаться сложным локализовать и оптимизировать ваш сайт для выхода на китайский рынок. Тем не менее, с населением более 1,3 миллиарда человек ( 18% населения мира ), 640 миллионов из которых имеют доступ к Интернету, Китай представляет собой привлекательный рынок для многих компаний. Чем
Если ваш органический (SEO) рейтинг резко падает во время, когда Google обновляет алгоритм, что делает ваш SEO, чтобы добраться до сути проблемы?
Если ваш органический (SEO) рейтинг резко падает во время, когда Google обновляет алгоритм, что делает ваш SEO, чтобы добраться до сути проблемы? Одна из наиболее очевидных отправных точек - выяснить, опубликовала ли Google или SEO-сообщество дату (или диапазон дат) для алгоритмического изменения, которое совпадает с падением рейтинга / органического трафика. Эта информация часто широко доступна на популярных форумах SEO (таких как
Авторитетный нишевый дизайн сайта с SEO - Пример: как я вырастил авторитетные нишевые сайты до $ 17,903 / мес с SEO + Что работает сейчас?
Авторитетный нишевый дизайн сайта с SEO - Пример: как я вырастил авторитетные нишевые сайты до $ 17,903 / мес с SEO + Что работает сейчас? Как я вырастил свой авторитет и нишевые сайты до $ 17,903 / месяц с SEO + Что работает сейчас? В 2009 году я наткнулся на страницу продаж «секретной системы», в которой говорилось, что я буду зарабатывать
В чем ваша проблема с SEO?
В чем ваша проблема с SEO? Если вы ищете услуги SEO, мы хотели бы знать, почему. Большинство наших клиентов приходят к нам из других SEO-агентств, которые не дали результатов. Но мы помогли клиентам с широким спектром знаний. Описывает ли что-либо из вашей ситуации? Ваше текущее SEO агентство или консультант не соответствует вашим потребностям. Вы пытались заниматься SEO самостоятельно, но обнаружили, что это слишком сложно и отнимает много времени.
Что такое Seo Powersuite?
Что такое Seo Powersuite? Seo Powersuite - это продукт от link assistant.com, состоящий из 4 комплексных инструментов SEO, каждый из которых предназначен для работы с определенным аспектом Seo. Это программное обеспечение позволяет получить рейтинг в поисковых системах, трафик и продажи для вашего бизнеса. 4 всеобъемлющих инструмента в SEO powersuite: Отслеживание ранга Аудитор сайта SEO SpyGlass
Но и после SEO (исследование ключевых слов, внутренние ссылки, внешние ссылки, Ranktracking), верно?
Но и после SEO (исследование ключевых слов, внутренние ссылки, внешние ссылки, Ranktracking), верно? Видите ли, элементы не являются взаимоисключающими, но прекрасно работают вместе. Я не хочу пропустить входящий маркетинг без SEO. вывод Внешне SEO и входящий маркетинг могут иметь существенные различия. Но у обоих есть одна общая черта: клиент! Если бы это был супермаркет, SEO бы позаботился о том, чтобы в магазин пришли правильные потенциальные
Итак, в чем разница между контент-маркетингом и SEO?
Итак, в чем разница между контент-маркетингом и SEO? Что ж, правда в том, что два компонента цифрового маркетинга поддерживают симбиотические отношения. Один не может выжить без другого. Поисковая оптимизация без контента практически невозможна, в то время как контент без SEO оказывается погребенным под обломками неиндексированных страниц. Ключевые слова Поисковые системы действуют как посредники между вашей аудиторией и вами. Они направляют
Что такое SEO?
Что такое SEO? Всякий раз, когда вы что-то гуглите, вы знаете, что генерируются тысячи, часто миллионы результатов. Как генерируются эти результаты? Поисковая оптимизация (SEO) - это метод, который веб-разработчики используют для поиска сайтов. Благодаря включению ключевых слов и фраз в контент страницы и устранению барьеров для индексации действий поисковых систем, сайт становится более заметным для поисковых систем и, следовательно, занимает более высокое место в списках результатов
Почему я должен инвестировать в видео услуги SEO?
Почему я должен инвестировать в видео услуги SEO? Визуальный контент может помочь пользователям найти ваш бренд и убедить их купить. Согласно Институт контент-маркетинга «Вероятность привлечения, вставки, обмена и комментирования видеоконтента в аудитории примерно в 10 раз выше, чем в блогах или связанных социальных публикациях». По данным Ассоциации местного поиска,
А как насчет веб-дизайна и SEO?
А как насчет веб-дизайна и SEO? Хорошие фирмы веб-дизайна в 2017 году сосредоточены на создании сайтов, которые следуют Рекомендации Google и обеспечить отличный пользовательский опыт. SEO не должно быть «лишним». Оптимизация сайта для поисковых систем должна быть фундаментальной
Но как насчет SEO?
Но как насчет SEO? Но есть проблема. Часто говорят, что одностраничные сайты WordPress вредны для SEO (поисковая оптимизация), потому что они объединяют все на одной странице. Это затрудняет использование некоторых из наиболее распространенных стратегий WordPress SEO, таких как оптимизация каждой страницы вашего сайта под разные ключевые слова с помощью URL-адреса страницы, заголовков, метаописаний, заголовков, плотности ключевых слов и т. Д. Это распространенное заблуждение

1.png> Местное SEO Ваш бизнес ориентирован на местную аудиторию, особенно в каком-либо районе города?
Вы хотите занять место в топ поисковых систем, таких как Google?
Но с чего начать?
Если ваш органический (SEO) рейтинг резко падает во время, когда Google обновляет алгоритм, что делает ваш SEO, чтобы добраться до сути проблемы?
Но и после SEO (исследование ключевых слов, внутренние ссылки, внешние ссылки, Ranktracking), верно?
Итак, в чем разница между контент-маркетингом и SEO?
Что такое SEO?
Как генерируются эти результаты?
Почему я должен инвестировать в видео услуги SEO?
А как насчет веб-дизайна и SEO?