Сегодня, 18 ноября, в Минске начала свою работу международная практическая конференция «Продвижение сайтов в белорусском интернете. Революция». В рамках секции по поисковым системам и их сервисам прозвучал доклад Александра Садовского «Поиск Яндекса и изменения тренда в Беларуси»
Уже 12 декабря 2009 года стало ясно, что байнет уже не будет прежним. Именно в это время появился МатриксНет, появился он в Белоруссии, и мы начали ранжировать сайты по-новому. По сути, мы перешли от формулы, которую мы могли увидеть и пощупать, к формуле такой сложности и такого размера, которую исправить руками уже практически невозможно. Она строится полностью автоматически, и любое вмешательство ведет к ухудшению. Поэтому мы ее вообще никак не трогаем, потому что это цельное произведение искусства.
Результатом этой формулы стало резкое улучшение качества поиска, вследствие которого и начала расти наша доля в Белоруссии. Это четко совпадает по датам, буквально с точностью до дня. Мы думаем, что это именно МатриксНет и те изменения в поиске, которые мы за этот год сделали.
Мы запустили релиз «Барановичи».
Зал: - А у нас еще Бобруйск есть!
Александр Садовский: - Ну, Бобруйск это совсем не красиво. Неудобно как-то людей посылать на Яндекс - что, скажут, в Бобруйск посылаете?
Зал: - А Барановичи лучше что ли?
Александр Садовский: - Мне кажется - да. Вообще же, в Белоруссии есть несколько красивых городов, и мы обязательно используем их названия в следующих релизах.
Кроме того, в релизе «Барановичи», кроме МатриксНета было еще одно очень важное изменение – мы сделали белорусскую морфологию, и мы перенастраивали формулу уже не по оценкам каких-то странных москвичей, пытающихся из себя изобразить белорусов, мы сделали это по белорусским оценкам, которые асессоры, сидя в Минске, зная белорусские реалии, зная белорусский язык, могут понять что нужно белорусскому пользователю.
Этот релиз также заметно сказался на общей версии поиска. Мы улучшили понимание языка. Например, мы начали понимать сокращения, которые нам задают пользователи, и наоборот, когда человек задает длинную расшифровку [министерство там чего-нибудь и еще чего-нибудь], какую аббревиатуру тоже нужно искать.
Мы сделали поисковые подсказки, которые показывают, чем интересуются белорусы. Какие именно глубоко философские вопросы их интересуют. Мы сделали много тематически структурированных поисков, которые смешиваются, сливаются с поиском, и помогают сразу получать ответ. Это не когда мы улучшаем ранжирование сайтов естественным образом, а когда у нас есть структурированный источник данных, которые мы начинаем подмешивать для того, чтобы дать более полный ответ.
У нас есть сервис Яндекс.Музыка, и мы начали его показывать не только в Белоруссии, но и на Украине. Там, на текущий момент, уже больше миллиона треков, и эта музыка на 100% легальна. Треки мы закупаем у мейджеров в оригинальном качестве. Можно совершенно точно сказать, что когда вы слушаете музыку на Яндексе - вы поддерживаете авторов, потому что им идут авторские отчисления, а слушая музыку в любом другом месте, вы воруете у них деньги.
Но даже если вы не нашли нужную музыку на Яндекс.Музыке, то вы можете найти ее классическим образом на другом сайте. Мы скачиваем трек и разбираем данные и, прежде чем перейти на тот или иной сайт, человек уже знает, что там будет за трек и какого он формата.
Мы делаем, например, тематические поиски по работе. Вы можете сразу узнать диапазон зарплат для интересующей вас вакансии в каком-то конкретном городе или регионе. Либо перейти сразу же на сайт интересующей вас компании, и посмотреть, есть ли там нужные вам вакансии.
И таких поисков много, а будет еще больше, - не случайно Сергей Петренко стал представителем Яндекса в Белоруссии. Но это ведь SEO-конференция, хочется поговорить про SEO.
В SEO мы сделали несколько полезных вещей. Во-первых, мы усовершенствовали робота-зеркальщика.
Раньше зеркальщик склеивал и расклеивал сайты со случайным периодом, бывало что и месяц-полтора была задержка. Сейчас он работает абсолютно регулярно – не реже чем раз в 2 недели. Если он делает это реже – смело пишите в саппорт.
По просьбам трудящихся мы сделали копию сохраненной даты, то есть, можно зайти в сохраненную копию и посмотреть, какая там дата и время.
Про сниппеты будет доклад Саши Шубина, не будем забегать вперед.
Мы много работали над проблемами, которые указывали нам на то, что очень важно находить оригинал текста. Эта проблема довольно серьезная, она еще полностью не решена ни одной поисковой машиной. И именно Яндексу, судя даже по независимым оценкам, удалось приблизиться к идеалу при поиске оригиналов. Хотя и только в 55% случаев по ашмановскому анализатору мы находим оригинал. По внутренним метрикам, которые мы считаем более репрезентативными, - это происходит в более 70% случаев. Но это тоже не 100%. То есть, с большей степенью вероятности мы найдет нужную страницу, но по-прежнему полной уверенности в этом нет. Но мы будем улучшать эти показатели до тех пор, пока не достигнем 100%.
Мы сделали много в Яндекс.Вебмастере за этот год. Мы дали возможность задавать свои запросы, смотреть запросы по региону и т.д. Но есть вещи, которыми мы и противодействовали, - мы сильно постарались, чтобы сайты, которые выводят по 15 страниц текста на главной странице (которые сами оптимизаторы называют портянками) не находились высоко, потому что мы считаем это разновидностью поискового спама.
Мы постарались, чтобы ни по одному запросу, где может хотя бы только подразумеваться порно, оно не находилось. Потому что, вы не поверите, но есть запросы, которые нормальный человек не считает порнографическими, но аудитория считает. Я сейчас говорю даже не про запросы типа [школьницы] или [студентки], а про такие, как например, запрос [конь], оказывается, что он на 30% порнографический. Мы проводили статистику, естественно, не методом фокус-групп.
Ну и последнее. Когда мы находимся на SEO-конференциях, нас обычно спрашивают о том, как мы относимся к SEO-ссылкам. SEO-ссылкам мы говорим - «Нет!».
Оптимизаторы пытаются нас убедить в том, что SEO-ссылок нет, что это все естественно, как в том анекдоте про естественные ссылки:
«Спрашивает один оптимизатор другого:
- Что такое естественные ссылки?
- Ну, скажи, ты бы поставил на своем сайте ссылку за 1000 баксов?
- Естественно!
- Вот это и есть естественная ссылка».
Говоря языком цифр, есть запросы, где вклад ссылок в релевантность практически не меняется, то есть, он маленький и он не меняется. Это информационные запросы. Но есть запросы другого типа, запросы, связанные с поиском коммерческой информации, в этих запросах, если ничего не происходит, если никто ничего не делает, вклад ссылок постоянно растет, ссылочная масса увеличивается, и выдача все меньше и меньше похожа на естественную. Поэтому мы все-таки работаем, и жизнь делает так, что вклад ссылок уменьшается в этих запросах все сильнее и сильнее. И если 2 года назад, процентов 70 факторов в топе были ссылочными, то на сегодняшний день из всех факторов ссылочными остались только 2. Это так мы говорим ссылкам – нет.
Что осталось людям, которые хотят продвигаться ссылками? Вот здесь найден последний оптимизаторский бубен (достает бубен), вы можете в него стучать. А тем, кто все-таки хочет делать сайты для людей, и выбирает правильную таблетку, для этих людей есть рассказ Саши Шубина «Оптимизация вида сайта в результатах поиска Яндекса». Он расскажет, как можно повысить конверсию на сайте и получить пользу для конечного клиента, не манипулируя выдачей, а работая вместе с нами на благо пользователей.
Зал: - Вопрос по регионам. Почему семь? Не 15, не 2?
Александр Садовский: - Ответ очень простой. Это связано с тем, что семь - это именно то число регионов, которые имеет смысл считать по одному. Если больше семи - то это просто Россия. Если вы, например, говорите – Владивосток, Екатеринбург, Москва, Орел…. и если число городов перевалило за семь – то это уже просто регион России. Если при этом города распределяются между странами, например, Минск, Бобруйск - то это уже называется СНГ. Просто не хочется превращать возможность указать регион в какое-то странное явление, где будет много ошибок.
Зал: - Вопрос об аффилятах. Будет ли считаться таковым сайт на поддомене, в котором все страницы одинаковые, и только будут различается страница контактов и условия доставки?
Александр Садовский: - Если это отдельный поддомен, то сайту можно поставить отдельный регион. И он будет в выдаче выше, чем такой же сайт из другого региона.
Зал: - Например, берем сайт, который работает по всей России. В Москве - головной офис. Мы сделаем поддомен, например, питерский.
Александр Садовский: - Питерский сайт в Питере будет ранжироваться лучше.
Зал: - Будут ли считаться аффилятами сайты на русском и белорусском языке? Будут ли считаться сайты одинаковыми?
Александр Садовский: - Нет. Будут считаться разными.
Зал: - Почему по одному и тому же ключевому запросу в Яндекс.ру и Яндекс.бай выдает разные страницы одного сайта? Разве у них разные алгоритмы отбора релевантных страниц?
Александр Садовский: - Конечно. Белорусы ищут нечто другое, чем то, что ищут россияне. Например, россияне не ищут 60-й закон, а белорусы не ищут Триумфальную площадь. Потому что в разных государствах ищут разное и по-разному.
Зал: - Сайт прописан по 4 регионам – Гомель, Минск, Москва и Киев. Контакты указаны на сайте. Все продвигаемые запросы являются геозависимыми. Как лучше продвигать сайт – создавать отдельные страницы для каждого региона или в контенте ключевое слово прописывать с названием города?
Александр Садовский: - Очень сложный философский вопрос. Я бы ответил так – на текущий момент мы движемся к этому, но пока мы определяем регион сайта и поддомена, а не определяем регион конкретной страницы. Поэтому в данный момент лучше указывать в тексте, но через некоторое время мы научимся определять регион конкретных страниц, и тогда можно будет сказать, что лучше посвящать страницы. Но при определении мы все равно будем использовать в том числе и контент.
Зал: - То есть, нет необходимости покупать разные домены? Есть смысл просто на странице написать, что эта страница для региона Москва, да?
Александр Садовский: - На текущий момент важно на каком домене сайт расположен до того момента, пока регион не определился автоматически, а как только он был определен или в Я.Вебмастере задан был вручную, то в этот момент уже совершенно не важно, на каком домене сайт.
Зал: - А Google говорит по-другому, он советует под каждый регион делать свой сайт. У вас разные алгоритмы?
Александр Садовский: - Конечно. Это нормально. Здесь мне нечего стыдиться.
Зал: - Недавно в панели Вебмастере появилась возможность отправить страницу на переиндексацию. А потом она исчезла. Почему?
Александр Садовский: - Возникли технологические проблемы, эта возможность не работала так, как надо. Чтобы сделать эту функцию качественной, мы временно ее закрыли. Но она появится.
Зал: - Не могли бы вы развеять мифы о поведенческих факторах? Учитываются ли они, если да, то какие, и какова их доля?
Александр Садовский: - Да, учитываются. Все, до которых мы можем дотянуться.
Зал: - И что делать? Стоит ли на них обращать внимание?
Александр Садовский: - Что такое поведенческие факторы? Это отражение того, насколько пользователям тот или иной сайт интересен. Мы берем эту информацию из разных источников, она помогает нам сделать выдачу релевантной. Вам специально делать ничего не нужно, просто не нужно нагонять глупый трафик.
Зал: - Значит, поведенческие факторы уже учитываются? Они важнее ссылочного?
Александр Садовский: - Если говорить о самых важных, то да, они важнее ссылочного.
Зал: - Говорят, вы заключили соглашение с Фейсбуком и получили доступ к их поведенческим факторам. Будете ли вы это использовать в своем поиске?
Александр Садовский: - Да, некоторую информацию мы у них получаем. Такого соглашения, чтобы получить доступ к их поведенческим факторам – мы не заключали, но соглашение, позволяющее лучше их индексировать – да. В этом смысле мы будем использовать это для улучшения своего поиска.
Зал: - Может, легче договориться с вКонтакте?
Александр Садовский: - С вКонтакте тоже договоримся. Уже практически договорились.
Зал: - То есть, нас ждет следующий этап в развитии поиска, это когда выдача станет поведенческой, правильно?
Александр Садовский: - Это нормальный этап развития соц. сетей. Раньше они хотели построить абсолютно автономный мир и закрывали ссылки во внешний мир. Была идея, что можно создать много приложений, и они повторят весь интернет внутри вКонтакте. За 2 года эта идея сошла на нет. ВКонтакте понял, что нужно идти на контакт, и у нас уже образовалось несколько точек взаимодействия. Мы им помогаем проверять ссылки на вредоносный код. Точно также мы помогаем и другим сервисам обнаруживать рекламу и ссылки, содержащие вредоносный код. Потому что нам всем это выгодно. Чем меньше трафика получает создатель вирусов, тем менее прибыльна ему эта деятельность, тем более вероятность того, что она рано или поздно совсем исчезнет. Вконтакте также используют Яндекс.Карты, встраивают по API, - пошел нормальный процесс взаимодействия крупного сайта с другим порталом, а не какого-то автономного мира, который замкнулся и ни с кем не желает общаться.
Зал: - Как вы определяете покупные ссылки?
Александр Садовский: - Будет неудивительно, если я скажу, что мы используем МатриксНет. У нас есть обучающая выборка хороших ссылок и выборка заведомо сео-ссылок. Используя эти две обучающие выборки, мы придумали несколько десятков разных факторов, и некоторые из них хорошо легли в формулу, которая позволяет с точностью более чем 90% отделить покупные ссылки от естественных.
Зал: - Как долго мы еще можем не бояться появления персональной выдачи?
Александр Садовский: - Если делаете хорошие сайты, то можете никогда не бояться. Если будете делать плохие сайты, то у вас они будут на первом месте, а у клиентов - где-то в конце. Но если серьезно – то персональный поиск уже давно с вами, просто есть разная степень персонализации. В Яндексе регионализация – это тот же самый персональный поиск, просто на чуть большем уровне. В 2011 году уже что-то появится ведущее к тому, что у рядом находящихся людей будет разная выдача.
Зал: - Александр, вот 3-4 декабря была SEO-конференция в том году здесь, и 12 декабря появился МатриксНет, как вы связываете это все?
Александр Садовский: - Ну… можно сказать, вдохновились. За 9 дней написали алгорим. Мы первыми экспериментировали, как на кроликах, на Украине, и она выжила.
Зал: - Мы все время думали, что белорусы кролики, а оказалось – украинцы….
Александр Садовский: - Нет, Сергей благородно подставил Украину….
Зал: - Теперь он будет так же благородно подставлять Белоруссию?!
Александр Садовский: - Нет, на Украине проще тестировать, она ровно посередине между Белоруссией и Россией. И по размеру аудитории, и по активности. Все тренды мы по ней видим.
Зал: - Бытует мнение, что одним из критериев покупной ссылки является то, что по ней никто не ходит. Вы используете такие данные в МатриксНет?
Александр Садовский: - Нет, мы пока не используем. Если будем использовать, то по-умному. Накрутить это будет непросто, не советую зря работать в этом направлении.
Зал: - А как будет ранжироваться в Москве сайт с регионом Россия и сайт с регионом Москва? У какого-то из них может быть преимущество?
Александр Садовский: - Сайт с регионом Москва будет ранжироваться в Москве выше, чем с регионом Россия. Но насколько выше - зависит от сайта. Крупный федеральный сайт получает факторы по всем регионам и таким образом, имея эту фору, ранжируется лучше, чем московский.
Сергей Людкевич: - Представляется, что все-таки будет лучше, если сайт будет московским.
Зал: - Любая реклама - платная. Рассматриваете ли вы ссылки как элемент рекламы? Любая ли покупная ссылка является спамом?
Александр Садовский: - Если она стоит в том месте, где она видна пользователю, и понятно, что она обозначает, интересна для аудитории сайта и пользователи по ней ходят - это реклама. А если она убрана в подвал, ее не видно, и на сайте про кошечек ссылка «пластиковые окна – купить недорого» - это сео-ссылка.
Зал: - Значит, с точки зрения Яндекса, рекламные ссылки могут быть, и вы их учитываете?
Александр Садовский: - С точки зрения Яндекса мы хотим к этим ссылкам относиться иначе, чем к сео-ссылкам, они не настолько плохи.
Зал: - Если статья солидная, сайт солидный, это не реклама, а PR - будет ли такая ссылка помогать поисковому ранжированию, либо она тоже потеряет всякую ценность и вес?
Александр Садовский: - Мы в первую очередь ставим себе такой вопрос – а нужно ли это пользователю? Если бы вообще поисковиков не существовало, вы бы стали себе ставить такую ссылку за такие деньги? Это - главный вопрос. Если ответ – естественно, то конечно – да, это полезная, рекламная ссылка.
Зал: - Подскажите, пожалуйста, поведенческие характеристики пользователя приводят на сайт, он чувствует там себя хорошо, проводит достаточное количество времени, посещают много страниц, но ведь они приходят из разных источников. Вот, к примеру, у меня есть школа французского языка, и кто-то из пользователей идет ко мне не из натуральной выдачи, а из контекста, будет ли поведение таких пользователей учитывать для оценки качества сайта?
Александр Садовский: - Учитывается поведение всех пользователей. Но разных пользователей - по-разному.
Зал: - Холодильники Атлант хотят выйти на всю Россию. Вы согласны, что эти холодильники могут продаваться, допустим, в Магадане? Кто-то там ведь может искать холодильники? Но как выйти им на новый рынок? Как продвигаться в регионе Магадан, если у них нет там представительства, но они хотят его открыть? И таких регионов много – вся Россия? Что делать? Как быть с этими семью регионами в Яндекс.Вебмастере? Просто написать, что мы хотим продавать наши холодильники в Магадане и этого будет достаточно, чтобы быть по холодильникам в топе магаданской выдачи?
Александр Садовский: - В вашем вопросе было целых два утверждения. Я отвечу последовательно. На утверждение «как быть с семью регионами», у нас уже была дискуссия. Что же касается регионов, где нет представительств, но могут покупать холодильники, - мы разделяем типы регионов. Есть регион ГДЕ - где находится офис и представительство. И есть регион ДЛЯ - на какую аудиторию ориентируется. Например, курорт в Абхазии может быть ориентирован на москвичей. Точно также холодильники Атлант – завод может находиться в Минске, а быть ориентирован на Россию. Сейчас возможности задать в Вебмастере регион ДЛЯ нет, но мы ее реализуем, и она скоро будет.
Зал: - Вот Яндекс заявляет о том, что старается не ранжировать высоко сайты-клоны, а я стучал на конкурентов, у которых 3 сайта с одинаковым контентом, - уже месяц прошел, а сайты из выдачи так и не убрали.
Александр Садовский: - Куда стучали, нам? Плохо стучите. Сейчас это не помогает. Мы алгоритм, который не выводит похожие сайты по одному запросу, уже года полтора или два не используем вручную. Мы используем эти данные только для обучающей выборки, для алгоритмического склеивания и расклеивания.
Зал: - Может ли конкурент плохими ссылками или пустым трафиком понизить позиции сайта?
Александр Садовский: - Мы стараемся об этом думать, и нам кажется, что нет простых способов завалить конкурентов. Пишите в службу поддержки, постараемся разобраться. Но эти случаи должны быть очень редкими и нетипичными.
Зал: - А DDoS-атака?
Александр Садовский: - Если сайт недоступен, то он на время удаляется из результатов поиска. Как только он восстанавливается, сайт возвращается в выдачу. Поэтому DDoS-атака влияет только на то время, которое она длится.
Зал: - Ну, я же могу купить на сайт конкурента порнотрафика?
Александр Садовский: - Почему, под словами «поведенческие факторы» вы представляете что-то простое, примитивное? Вы же видели в первом ролике, как все сложно. У нас, естественно, есть защита от таких вариантов. Если кому-то из вас удастся таким способом наколоть Яндекс, - у нас есть вакансия.