Задача определения аффилирования двух сайтов в Яндексе всегда была одной из важнейших в SEO-аналитике. До недавнего времени было несколько рабочих способов ее решения, в основе которых лежал один основополагающий принцип: необходимо было определенным образом сформировать поисковую выдачу, чтоб можно было убедиться в следующем.
Если в поисковой выдаче находятся документы с обоих проверяемых на аффилированность сайтов, и при этом имеет место группировка выдачи по сайтам, то эти сайты не аффилированы.
Если же при отсутствии группировки по сайтам, в выдаче присутствуют документы с обоих сайтов, а при наличии группировки – только с одного, то проверяемые сайты аффилированы.
Этот принцип накладывает существенные ограничения на выбор способа определения аффилированности двух сайтов.
Нам нужно максимально сузить несгруппированную по сайтам выдачу так, чтоб в ней присутствовали документы с обоих сайтов. А потом суметь ее сгруппировать, чтоб проверить, сохраняется ли в ней присутствие документов с обоих сайтов, либо один из них исчезает. Либо продемонстрировать в сгруппированной по сайтам поисковой выдаче наличие документов с обоих.
В разное время я опубликовал три способа определения аффилированности сайтов в выдаче Яндекса, основанные на этом принципе.
Первый способ был самый простой и изящный. Выдача сужалась до самого минимума – двух документов (по одному с каждого сайта) с помощью оператора url:. Но у этого оператора, равно как и у большинства документных операторов текущего официального довольно скудного языка запросов Яндекса (а именно, site:, host: и rhost:, исключение составляет только оператор domain:, но об этом чуть позже), есть одно свойство – они разгруппируют выдачу по доменам. Поэтому после сужения построенную выдачу необходимо было сгруппировать по доменам, чтоб проверить наличие аффилированности. И это делалось довольно простым, но интересным способом – добавлением к запросу любого документного оператора (как правило, использовались операторы url: или site:) с произвольным значением (естественно, отличным от значений операторов url:, использовавшихся в базовом запросе) после оператора отрицания ~~. Эта связка оператора отрицания и документного оператора вызывала обратный эффект применению документного оператора – она группировала выдачу.
Но, к сожалению, после периодических кастраций языка запросов Яндекса оператор отрицания ~~ потерял статус документированного, хоть и продолжал корректно работать во многих случаях. Но самое неприятное, что несколько месяцев назад исчез чудесный эффект обратной группировки по сайтам, присущий его связке с документными операторами. Минус один способ, увы.
Второй способ базировался на использовании для сужения выдачи точных цитат со страниц проверяемых на аффилированность сайтов. Но со временем логика языка запросов Яндекса сильно изменилась, и теперь он не желает корректно применять оператор | («логическое ИЛИ») к точным фразам (заключенным в оператор «кавычки»). В итоге в поисковой выдаче по запросам, сформированным путем применения оператора | к точным фразам, получается сущая белиберда, не связанная с логикой запроса. Минус два способа, увы и ах.
В запасе остался третий способ, основанный на единственном документированном документном (прошу прощения за невольный каламбур) операторе domain:, который в отличие от остальных документных операторов не разгруппировывает выдачу по сайтам. Но и он некоторое время назад начал выкидывать фортели.
Дело в том, что из достаточно большого количества известных мне пар аффилированных доменов (и не только пар, но и троек, четверок и т.д.) проверка с использованием этого способа вдруг перестала показывать их аффилированность. Для примера возьмем пару сайтов, использовавшихся мной в качестве примера аффилированных в последней статье об этом методе. Сейчас они прекрасно чувствуют себя на одной странице в выдаче, сформированной с использованием оператора domain:
То есть они, с точки зрения озвученного мною выше принципа определения аффилиатов, не считаются аффилированными. Более того, есть и четвертый метод, о котором я еще не писал. Он основывался на использовании для сужения выдачи некогда ставшего недокументированным оператора inurl:, который подобно оператору domain: не разгруппировывает поисковую выдачу. Так вот, он тоже сейчас пасует на всех известных мне случаях аффилированных пар сайтов, в том числе и на вышеупомянутой:
Вместе с тем, как мои практические наблюдения, так и мнения других SEO-специалистов, высказываемые в приватных профессиональных беседах, говорят за то, что сам по себе аффилиат-фильтр никуда не делся. Но очень похоже на то, что он мимикрировал, сменив свою природу с жесткой группировки аффилированных сайтов в поисковой выдаче на нечто иное, например, некий дисконт (пост-штраф) к значению релевантности для страниц одного из аффилиатов, который сочтен алгоритмом ранжирования менее релевантным, чем другой.
Если это действительно так, то на возможности адекватной проверки двух сайтов на аффилированность, к моему большому сожалению, можно поставить крест. Но все-таки хочется и не исключать вероятность какой-то иной причины наблюдаемого эффекта, например, чем черт не шутит, масштабной амнистии аффилиатов, под которую попали все известные мне пары. Поэтому я буду очень признателен, если читатели пришлют мне на e-mail ludkiewicz@ya.ru свои примеры некогда аффилированных пар сайтов для пополнения моей тестовой выборки.