Aleksey01

Рейтинг
114
Регистрация
29.10.2006

100% что может. Нет смысла проводить эксперимент.

Мне кажется здесь ключевое слово "в среднем":

We have used a statistical model to account for these effects and found that, on average, there is very little variation in conversion rates by position for the same ad.

По крайней мере мне встрачались тематики, где есть разница.

Кстати, где нибудь можно найти более точную информацию по директу? К кому вообще можно обращаться с такими вопросами?

Например, тоже самое число показов, после которого берется реальный CTR, а не прогнозный. Вроде секретов из этого никто не делает. По телефону два раза об этом спрашивал - дали разные ответы.

Я понимаю, например, почему могут не афишироваться тонкости работы прогноза - там действительно есть возможности для манипуляции.

Дмитрий:
Вот думаю, а если эти запросы в кавычки поставить, будет же только исключительно по этому слову показываться?

Да, будет показываться только по этому слову.

devzev:
В Евклидовом пространстве этот закон работает, а остальное неважно.

При чем здесь это? Евклидово пространство - конечномерное вещественное векторное пространство с введённым на нём скалярным произведением

Топик - жесть :)

di_max:
Кхм... Не ужели вы считаете, что все опубликованное Яндексом точ-в-точь истользуется в РАБОЧИХ алгоритмах?;)
Есди нет - то какова, по Вашему, степень приближения к реальности?

Важно общее представление что примерно они могут использовать. Не раз видел на этом форуме высказывания, что "Яндекс не определяет тематику, т.к. для этого надо много ресурсов". В приведенном документе описан способ, который реально воспроизвести на практике.

При этом, с одной стороны, маловероятно, что используют ресурсоемкие алгоритмы типа метода опорных векторов. С другой стороны и такой вариант исключать совсем нельзя лишь потому, что он кажется труднореализуемым.

Также нельзя исключать того, что для определения тематики могут быть использованы внешние ссылки. (В той статье есть ссылки где это посмотреть).

В целом доклады и книги очень полезны для построения аналитических моделей.

sokol_jack:
В последнее время идут бурные обсуждения - ТИЦ это таки тематический индекс или нет? А влияет ли тематика на что-то? А на что? :)

...
- Яндекс оценивает тематичность по "совпадению" основных текстовых составляющих страниц на
...

Мне кажется, вы сразу пытаетесь исследовать два вопроса:

-влияет ли тематика на ТИЦ?

-что такое тематика?

Вероятно, лучше сразу вопрос для исследования сформулировать так: "Влияет ни текстовая составляющая страниц [донора и акцептора] на ТИЦ?" Ну или еще как-нибудь, как вам больше нравится.

Что касается определения тематики, то рекомендую посмотреть этот документ:

Маслов М. Ю., Пяллинг А.А., Трифонов С.И. "Автоматическая классификация веб-сайтов".

В частности:

В связи с этим возникла потребность в создании
достаточно простого и устойчивого алгоритма,
способного классифицировать большие объемы
данных по большому числу тем. В результате был
построен классификатор байесовского типа,
который и описан в этой статье.
При построении классификатора использовались
следующие идеи:
1. Классификация строится по каждой теме
независимо друг от друга.
2. Тему документа можно определить по
списку встреченных слов (bag of words).
3. Для каждой темы есть слова, характерные
для темы, и слова, которые в теме не
встречаются.
4. Множество характерных для темы слов
можно разбить на 2 части:
a. Характеристические слова – множество
слов, без которых невозможно раскрыть
тему. Если в документе нет ни одного
слова из этого множества, то документ к
теме не относится.
b. Остальные слова, характерные для темы.
Мы не можем определить только по
наличию или отсутствию этих слов в
документе, в теме документ или нет.
5. Кроме характерных слов, классификатор
существенно использует слова,
нехарактерные для темы.

Если вы будете исследовать как Яндекс определяет тематику, то надо еще посмотреть не учитываются ли при этом ссылки.

Alexey Levin:
А вот интересынй пример

http://yandex.ru/yandsearch?text=%D0%BC%D0%B0%D1%82%D1%80%D0%B0%D1%81%D1%8B+url%3D%22www.matras4you.ru%22+|+url%3D%22www.oteli-pitera.ru%22&stpar2=%2Fh0%2Ftm17%2Fs1&stpar4=%2Fs1

На 1-м месте сайт - простой сателлит.
На втором топовый сайт тематики "матрасы"

А почему именно так?

А не, например, так:

http://yandex.ru/yandsearch?text=%D0%BC%D0%B0%D1%82%D1%80%D0%B0%D1%81%D1%8B%3C%3C(url%3D%22www.matras4you.ru%22+|+url%3D%22www.oteli-pitera.ru%22)&stpar2=%2Fh0%2Ftm37%2Fs1&stpar4=%2Fs1

( матрасы<<(url="www.matras4you.ru" | url="www.oteli-pitera.ru") )

Я общался с Александром по двум заказам: в первом случае он делал верстку, во втором нужна была правка верстки и я обсуждал такую возможность.

Что касается качества верстки - я, как не специалист, могу оценить ее по тому, что все показывается правильно в разных браузерах при разных разрешениях. У меня были также определенные требования к верстке, которые полностью были выполнены.

Также мне понравилась оперативность. Особенно важно это было при обсуждении правки верстки, т.к. вопрос надо было решить срочно.

IPO-BANK или IPOBROKERS

IPO-BANK нравится меньше, т.к. есть дефис.

Всего: 340