funsad

Рейтинг
116
Регистрация
15.11.2000
Как писал LiM
Я правильно понял, что это ответ от имени фирмы Яндекс?

Нет, неправильно. Все ответы на этом форуме отражают мою личную позицию, если в ответе не написано обратное. Я отстаиваю свою позицию в обсуждениях внутри компании, но это не значит, что итоговое решение Яндекса отражает только мое мнение.

Стоп! Откуда взялась эта тема? Александр, Вы меня, право, удивляете! Про склейку доменов здесь никто до Вас не говорил.

Перечитайте, пожалуйста, сообщение Мелькова -- речь идет о группировке страниц по доменам второго уровня. Соответственно, склеиваются страницы домена второго уровня и страницы поддоменов третьего уровня. Поэтому, как я написал выше, все ваши попытки вывести идеальное определение сайта не имеют смысла -- на сегодня Яндекс группирует страницы по доменам второго уровня.

Ваши примеры обсуждать нет смысла -- как верно заметил Gray, это разговор в одну сторону. Вы не отвечаете на мой вопрос о качестве выдачи, а ищете теоретический повод назвать плохим решение, выбранное Яндексом.

Судя по тому небольшому промежутку времени, который Вам понадобилсся после перехода на работу в Яндекс для познания ситуации «одинаково хорошо с двух сторон»

Я говорил о конкретном решении по группировке выдачи. Доводы в пользу решения Яндекса достаточно хорошо изложены на предыдущих 11 страницах обсуждения. Перечитайте их еще раз, и если у вас появятся аргументированные возражения (в форме "запрос -- оценка качества поисковой выдачи без группировки -- оценка качества выдачи после группировки"), с удовольствием их выслушаю.

С уважением,

Александр Садовский.

Как писал AntiFriz
В таком случае пользователь теряет часть информации.
Потому что в большинстве случаев он естественно не нажмет на кнопку "Еще с сайта" и не узнает дополнительные интересные вещи, которые он хотел бы узнать.

Посчитайте вероятность события, что информация есть только на двух доменах из миллиона, ее ищет неопытный пользователь (не найдет ссылки "еще с сайта"), при этом оба домена независимы друг от друга (иначе можно пройти по ссылкам), но располагаются в одном домене второго уровня. Стоит ли рассмотрения такая ситуация?

В любом случае, ее проще будет решить разгруппировкой доменов, если найден только один сайт, чем расклеивать домены для всех запросов.

С уважением,

Александр Садовский.

Как писал AntiFriz
Не рассмотрен случай, когда по теме есть уникальная информация и на lib.ru и на lim.lib.ru, в этом случае пользователь теряет часть информации.

Во-первых, слово "уникальный" означает "единственный в своём роде; исключительный". Если информация есть на двух сайтах, она уже не уникальна.

Во-вторых, перейдя по ссылке "еще с сайта", пользователь получит полный список страниц, который содержит нужную ему информацию. И, по большому счету, ему все равно, на каких доменах она расположена.

С уважением,

Александр Садовский.

Как писал LiM
Вы в данном утверждении явно передергиваете, очень своеобразно трактуя понятие "сайт". Есть общеупотребимая трактовка понятия "сайт"

Думаю, вы понимаете, что веб меняется очень быстро, и то определение, что вчера охватывало 99% случаев, сегодня едва покрывает половину. В Яндекс.Энциклопедиях есть и другое определение сайта, которое вы почему-то обошли стороной:

Сайт - это место в интернете, которое определяется своим адресом (см. URL), имеет своего владельца и состоит из веб-страниц, которые воспринимаются как единое целое. Строгого определения сайта не существует

Переводя с русского на русский, объясняю, что у сайта есть точка входа и владелец (что очевидно), а границы сайта обозначены как группа страниц, воспринимающихся как единое целое. При этом неважно, какой классификационный признак выбран -- содержание, дизайн и т.д., так как строго определения сайта не существует.

Могу привести и другой вариант:

..."site," properly speaking, is an location or gathering or center for a bunch of related pages linked to from that site.

То есть достаточно, чтобы страницы были связаны и на них можно было пройти по ссылкам с главной страницы сайта.

Чтобы вы не думали, что это трактовка Яндекса, направленная против оптимизаторов, приведу определение термина, которое описывалось во многих договорах AdLabs:

Сайт — совокупность информации, способа ее представления и технических средств, объединенная, как правило, одной темой и/или целью, которая дает возможность пользователю, подключенному к сети Интернет и имеющему соответствующие технические средства, получить доступ к части или всей информации, на платной или бесплатной основе, зная его адрес. С любым сайтом связаны один или несколько адресов (каждый из которых может быть как доменным именем, так и IP адресом), однозначно определяющих сайт или его разделы в конкретный момент времени.

Это определение, привязывающее к сайту все поддомены и другие домены второго уровня, было выработано еще год назад, и поэтому упреки в передергивании выглядят довольно надуманными.

пример тому мой сайт lim.lib.ru, который даже географически находится на расстоянии в несколько тысяч(!) километров от сайта lib.ru.

Склейка доменов -- отдельный вопрос, не связанный жестко с определением слова "сайт". Если же рассматривать текущую реализацию алгоритма, то что вас смущает в случае lim.lib.ru? Что пользователи не найдут страницы с сайта? Если информация уникальна, она не будет пересекаться с содержимым lib.ru, и по запросу всплывет именно ваш домен. Простой пример. Ищем авторов, чьи произведения есть на вашем сайте -- "Изабелла Джен", "Ольга Дидковская" и т.д. На первом месте в обоих случаях -- ссылка на lim.lib.ru.

Если же содержимое дублирует lib.ru, и по какому-то запросу будет выдана страница с домена lib.ru, а не lim.lib.ru, то чем это плохо для пользователя? Почему страница с вашего сайта лучше точно такой же страницы сайта lib.ru?

пока видно лишь сильное изменения поведения Александра на форуме, которое выражается не только в стиле написания сообщений, но и в пропагандируемых им мыслях.

Теперь я знаю ситуацию одинаково хорошо с двух сторон, и, естественно, это немного меняет мою позицию. У промоутеров, которые смотрят далеко вперед, изменения в выдаче не вызывают никаких вопросов, более того, они приветствуют их. Для них ясно, что движение в данном направлении неизбежно.

С уважением,

Александр Садовский.

Как писал ostmaster
Я рассматривала вопрос в целом. Попытка приписать мне узкоэгоистические интересы не пройдет ;).

И где же результаты рассмотрения вопроса в целом? Присылай на e-mail, я с удовольствием их изучу. :)

Замечу еще раз, что мы по-разному ставим вопрос. Участники форума спрашивают "почему (не) склеился сайт АБВ?", а я спрашиваю, "по каким запросам из-за склейки доменов качество выдачи снизилось?" При этом если одна релевантная страница была заменена другой, то это не ухудшение.

Напомню, речь шла не про склейку вообще, а про склейку сайтов, описанных в разных категориях каталога.

Эти домены не конкурируют между собой -- они находятся по разным запросам. Возможно, их действительно не стоит склеивать, но по идеологическим причинам, а не из-за того, качество поиска станет от этого лучше. Спасибо за идею, подумаем.

Как бы ни казалось все просто, идею нельзя сразу начать воплощать. Во-первых, любое исправление кода требует затрат, несет риск добавления ошибок и т.д. Поэтому вначале нужно посмотреть, как часто поддомены одного сайта описывают в разных рубриках из-за действительно их разного содержания, а не по ошибке. Если окажется, что таких сайтов 3-4 на рунет, стоит ли из-за них усложнять правила? Во-вторых, подобное правило сделает возможной технику "расклейки" доменов с помощью каталога, когда сайт описывается, затем меняется его содержимое или добавляется подраздел на другую тему, что потребует дополнительных усилий по контролю. Поэтому лично я пока вижу минусов в таком решении больше, чем плюсов.

С выдачей я вообще сильно сомневаюсь, что кто-то будет что-то слушать.

В своей фразе я подчеркнул слово "аргументированно", и показал, ответ на какой вопрос будет выслушан с интересом. Итоговое решение -- это всегда сумма векторов, где учитывается техническая сторона, рекламная, пиар и т.д. Когда пользователи предлагают идеи на уровне "давайте сделаем так-то, мне это очень поможет", даже если Яндекс полностью согласен, что данному пользователю это поможет, никто не бросится реализовывать его идею. Потому что выдвинутое предложение, как правило, интересно десяткам пользователей из миллионов. Даже если мы видим перспективы от воплощения идеи (допустим, она нужна всем пользователям), остальные векторы могут перевесить и наложить "табу" на идею. (То ли затраты на реализацию велики, то ли это будет мешать рекламодателям и т.д.)

Очень часто такие мелочи со стороны не видны, и кажется, что Яндекс не хочет прислушиваться, но это не так. Мы все видим, все слышим, обо всем думаем. :) Пишите, ваши предложения не теряются и даже если они не воплощаются, вы все равно помогаете Яндексу стать лучше -- мы видим больше способов, которыми можно помочь пользователям и можем лучше решить ваши задачи.

С уважением,

Александр Садовский.

Как писал euhenio
-пару слов в защиту Казака :) Сделать лазейки - можно не обязательно преднамеренно, и преднамеренность никто не утверждал.
<...>
Но это все в порядке оппозиционерства :)

Если бы не было слов "для инсайдеров и партнеров", смысл слова "лазейка" был бы именно таким. Инсайдер же -- это тот, кто владеет внутренней информацией, недоступной остальным. Следовательно, лазейка для инсайдеров -- это тот самый backdoor, а не просто непреднамеренное построение алгоритмов, которое спамеры могут использовать в своих целях. Для сравнения: лазейка в законодательстве доступна всем.

Решение о группироке принимается "руками" и находится в ведении конкретного человека. Лазейка есть

Твоя фраза, фактически, допускает, что этот человек при принятии решения может руководствоваться не внутренними правилами, а интересами владельца сайта. Это не что иное, как обвинение сотрудника в недобросовестности или даже взяточничестве. Если он руководствуется только служебным долгом, никакой лазейки нет.

Хотя насчет закрытия обсуждения юридических вопросов поддерживаю. :)

С уважением,

Александр Садовский.

Как писал Cossack
Предположение о необходимости набора новых людей и увеличения расходов от расклейки поддоменов - 100% нормальный вывод из ваших постов.

Это говорит еще раз о том, что нужно работать над сайтом, а не пытаться строить неверные гипотезы на основе чьих-то слов. :)

Фактически, алгоритм вывернут и более того, может привести к реальным искам пользователей, которые не захотят видеть свой сайт под чужим адресом даже просто в результатах поиска.

Юридические вопросы пусть решают юристы. Как пользователь я утверждаю, что сайт ничем не отличается от каталога или страницы, которыми также может владеть отдельное лицо. Соответственно, с таким же успехом можно предъявлять претензии к любому поисковику, который использует в выдаче группировку страниц.

есть интересный вопрос - он в привате. Надеюсь вы его учли, а то склейка может и по вам "ударить".

По ряду причин предложенный тобой вариант воздействия на результаты поиска не сработает. Не веришь -- попробуй.

2. Выдранные из текста и перевернутые слова - не могут классифицироваться как клевета,

Я процитировал в точности твои слова, не переворачивая их. Повторяю цитату еще раз: "Увеличили расходы на персонал и сделали новые лазейки для инсайдеров и партнеров." Под словом "лазейки для инсайдеров", однозначно, подразумеваются преференции для людей, связанных с Яндексом или его сотрудниками. Или признай, что это только твои предположения, или опубликуй список инсайдеров (партнеров) и описание лазейки, доступной только для них.

N.B. Я допускаю, что мы можем по-разному понимать слово "лазейка", и ты мог иметь в виду не backdoor для нужных людей, а просто новый способ поискового спама. Однако, указание на инсайдеров и партнеров говорит, что мы, скорее всего, понимаем слово "лазейка" одинаково.

а вот обвинение другого человека в клевете - уже серьезно. Тем более от лица человека, представляющего компанию,

Есть разница между понятиями "представлять компанию" и высказывать частное мнение в нерабочее время. Яндекс делает заявления через пресс-релизы и официальные ответы, а не устами программистов и менеджеров. Все мои ответы на форуме не являются официальными заявлениями, если в них не сказано обратное.

С уважением,

Александр Садовский.

Как писал LiM
Очень интересно, и какой же сайт должен выдавать Яндекс на запрос "поборы гаишников в соборах Москвы"?..

Прошу не забывать, что Яндекс выдавал и продолжает выдавать по запросу самую релевантную страницу с сайта. Следовательно, пользователь может быть ущемлен только в том редком случае, когда на этом сайте, и только на нем есть две одинаково релевантных статьи, причем не заменяющие друг друга, а дополняющие, и расположены они не на одном домене, а на разных. Вы верите, что это распространенная ситуация? Я -- нет. Значит, на запрос "поборы гаишников в соборах Москвы" будет показана прекрасная страничка с одного из двух доменов, которая сделает пользователя счастливым.

Как писал Cossack
Просто добавили себе новый отдел и обеспечили его работой. Увеличили расходы на персонал

Какой еще отдел? Расскажите, выходит, вы знаете о Яндексе больше, чем его сотрудники.

Предположение, что любой алгоритм, применяемый в ранжировании или при группировке сайтов, должен давать идеальные результаты, в корне неверно, хотя бы потому что веб, по которому ведется поиск, меняется очень быстро. Соответственно, даже если наступает момент, когда дальнейшая доработка алгоритма не даст существенного улучшения качества, это не значит, что нанимается отдел из сотрудников, которые своей работой подменяют алгоритм. Если бы Яндекс, Google и др. действовали так, то всего населения Москвы не хватило бы, чтобы заполнить вакансии в отделе расчета авторитетности страниц, подменяющего алгоритм, аналогичный PageRank. Надеюсь, вы понимаете, что ваша фантазия ничем не обоснована. И если алгоритм дает улучшение результатов, даже если он не идеален, никто не будет подменять его работу ручным трудом.

Как писал Cossack
и сделали новые лазейки для инсайдеров и партнеров.

Если у вас есть доказательства, опубликуйте их, а если это только ваше предположение, которое не имеет под собой никаких оснований, то это называется клевета, и как модератор я попрошу не засорять ею форум. Пишите на компромат.ру и прочие "желтые" сайты, там вас с радостью примут.

Как писал ostmaster
Полагаю есть немало случаев, когда сайты висят на поддоменах просто потому что не захотели тратится на хостинг и использовали то что было.

Рассуждая про исключения из правил старайтесь помнить, что это именно исключения. Вы видите, как склеился близкий сердцу проект, и думаете, как же доказать, что склейка вредна. И, конечно, находите пример. Яндекс, перед тем как принять решение, рассматривает картину в целом и выбирает такой вариант, который принесет улучшения подавляющему большинству пользователей.

Конечно, возможна ситуация, когда по какому-то запросу вы заметите ухудшение выдачи. Но пока вся приведенная в этом обсуждении критика ни разу не упоминала запросы, где выдача стала хуже из-за склейки. Говорили о социальной значимости Яндекса, о том, почему склеился или нет конкретный сайт, но никто не привел пример негативного влияния склейки на качество результатов поиска по конкретному запросу.

Мы всегда открыты для аргументированного диалога. Проведите исследование, возьмите сотни запросов, выбранных так, чтобы отражать интересы всех пользователей, и посмотрите, как повлияла на результаты склейка. Если вы получите результаты, отличные от результатов Яндекса, мы обязательно прислушаемся к вашему мнению.

С уважением,

Александр Садовский,

менеджер проектов, компания Яндекс.

Как писал Sim
Правильно ли я понял, что все сайты, сделанные одной дизайн-студией, Яндекс рассматривает теперь как единый ресурс?

Наводящие вопросы: а разве дизайн-студии пишут и контент сайта? Или у Яндекса есть поиск по дизайну, а не по содержанию текстов?

С уважением,

Александр Садовский.

Как писал euhenio
Саша, ты не мог бы (раз уж проговорился) поподробнее объяснить политику Яндекса в смысле сливания "по владельцам" в результатах выдачи? Надо ли ховать данные персоны по домену? Будут ли стучать друг на друга "а вот эти домены - одного хозяина, слейте их, там контактный телефон одинаковый"?

"Проговорился" -- громко сказано, никакой военной тайны в изложенной мной информации нет. Прятать данные по домену не нужно, менять фамилию, прописку и пол тоже. Было бы смешно в России определять принадлежность сайта по юридическим или другим формальным признакам.

В данном случае, как уже сказал Паша, есть небольшой "белый" список исключений -- все остальные домены сливаются. Конечно, если ты настаиваешь, специально для твоих проектов мы попробуем завести "черный список" и слить их воедино. :) Но, предполагаю, ты вполне доволен статус-кво.

С уважением,

Александр Садовский.

Всего: 1503