pro-maker

pro-maker
Рейтинг
281
Регистрация
08.12.2003
Интересы
трафикогенерация, и-маркетинг
nickspring:
(2) совсем другой аспект. Просто ищутся морды в сквозняках (т.е. кроме ссылки с морды, стоят еще ссылки с внутренних).

Т.е., если в бэках не морда и есть "Еще с сайта", смотрится есть ли в "Еще с сайта" морда и выводится анкор с морды?

nickspring:
Скажите, а с какой целью Вам нужна более высокая точность по Яндексу? Для оценки, или для других целей? Может быть просто имеет смысл сделать отдельный инструмент - "максимальные беки по Яндексу" (что-то в этом роде)

nickspring, в чем различия (1) между высокая точность по Яндексу (vantala), (2) тонкий отсев ссылок с морд (только для Яндекса) (CS Yazzle) и (3) вероятный отдельный инструмент - "максимальные беки по Яндексу" (nickspring)?

MiRaj:
в таком случае моделирую ситуацию: документ содержит 6 ссылок, полезных для пользователя и 6 явно продажных. Как уменьшить эффект от продажных ссылок, не понижая эффект от естесственных и не ухудшая поисковой видимости самого документа.

Пока нет большого желания заниматься угадыванием слабо-проявляющихся механизмов ранжирования. :)

MiRaj:
остается открытым вопрос - когда возможность будет реализована

Не обязательно учитывать "на лету", можно оценить насколько сайт использует спамные методы продвижения, чтобы рассчитывать коэффициент типа ТрасРанка, который уже задействовать в расчетах "на лету".

Для начала хотелось бы напомнить общее определение тематики, предложенное Спарком:

Тематика - зона выборки документов, относящихся к определенной теме
Т.е. набор документов, соответствующий определенным условиям. В прикладном применении техническая реализации тематики зависит от контекста. Например, в контексте Я.Каталога это м.б. двумерная матрица, в ячейках (рубриках, подрубриках) расположены списки сайтов, "тематическая близость" в которой м.б. выражена растоянием между рубриками. А в Я.Директе тематика м.б. реализована как лексическая и тематическая общность, что позволяет показывать рекламу по соответствию запроса ключевикам, т.е. лексическому совпадению.
MiRaj:
1) Тематика (принадлежность разделу ЯК) определяется только для сайтов.
2) Тематику отдельного документа невозможно определить, тем более "на лету".

MiRaj:
1,2) Делать выводы о тематике документов по тематике сайта, их содержащего, нельзя (сайт может содержать документы совершенно не соответствующие тематике сайта). Определить тематику (раздел ЯК) для каждой страницы тоже проблемно - за примерами бегать далеко не надо.

Цитата с доклада Яндекса на РОМИП-2006:

Для расчета похожести нам нужны какие-то теги – признаки до-кументов, по которым мы будем определять похожесть. Для РОМИПа мы использовали два набора тегов. Первый набор тегов – автоматическая классификация докумен-тов по темам Яндекс.Каталога. Для классификации мы использовали алгоритм Байеса в интерпретации Пола Грэма [3] Коллекция доку-ментов, на которой настраивался автомат, сформирована по прин-ципам, описанным в [4]. Каждому документу автомат приписывает одну тему.

Для прохода с тегами c классификацией по каталогу применялись коэффициенты в диапазоне от -0.3 до 0.25

Для коллег, которые не могут поверить в возможность классификации тематической документов, можно еще сослаться на Александра Садовского, который на последней оптимизаторской конференции это подтвердил. Насколько тематика документов задействована в поиске, конечно же, неизвестно, думаю, что вполне могут классифицировать документы на стадии индексирования, а в поиске документам по степени тематической близости с запросом на лету присваивать соответсвующие коэффициенты. Хотелось бы также напомнить о недавнем обсуждении тематики документов.

MiRaj:
4) Для документов есть термин релевантности ключу. Не факт, что релевантность расчитывается так же как и релевантность при ранжировании в СЕРПЕ. К примеру, могут не учитываться внешние факторы (только релевантность контента).

Честно говоря, не понял, зачем поисковику дважды рассчитывать релевантность по контенту, а м.б. и просто невнимательно просмотрел предыдущее обсуждение. Очень похоже, что релевантностью коллеги из Яндекса оперируют очень разносторонне, например, цитата Михаила Маслова:

К проданным ссылкам Яндекс относится в общем случае плохо, поскольку они как правило для пользователей нерелевантны.
Т.е. ведущий разработчик поисковика заявил, что могут оценить степень близости анкора и контента донора. :)
MiRaj:
1) Тематика (принадлежность разделу ЯК) определяется только для сайтов.
2) Тематику отдельного документа невозможно определить, тем более "на лету".
3) Тематика сайтов учитывается только при расчете тИЦ
4) Для документов есть термин релевантности ключу. Не факт, что релевантность расчитывается так же как и релевантность при ранжировании в СЕРПЕ. К примеру, могут не учитываться внешние факторы (только релевантность контента).

MiRaj, могли бы объяснить логику, на основании которой сформулированы эти тезисы?

Sim:
Главный критерий: создание сайта не не должно стоить дешевле $15k.

Актис, АДВ

nickspring:
pro-maker, резонный вопрос имеет встречный резонный вопрос ;): если тега noindex не существует по стандарту в отличие от rel="nofollow", то зачем его придумывать, не предоставляя при этом альтернативы?

Не заморачиваюсь глобальными проблемами. Смотрю на термометр, если на нем +10/-10 градусов Цельсия, и одеваюсь соответственно, а почему весенняя погода ползимы в Москве стоит меня мало интересует. Спросите у Платона лучше о ноуиндекс.

nickspring:
Запустил эксперимент, о результатах сообщу.

Еще и медом страничку помазать, чтобы быстроробот мимо не прошел, а то результаты долго ждать придется. :)

nickspring:
Вложенность соблюдается по правилам W3C, т.к. <noindex> в данном случае не тег, а просто текст (секция CDATA).

Если это не тег, зачем парсеру его обрабатывать?

Всего: 4277