AiK

AiK
Рейтинг
257
Регистрация
27.10.2000
Должность
SEO consultant
Интересы
Astronomy

Vetra, идея хорошая, но в результате мы пришли к тому же: ссылка с морды searchengines.ru будет тематична для сайта торгующего кондиционерами. Пересечение всё через тот же Бизнес :)

+1 AiK и 10 греев :)

pro-maker, я в последнее время недогадливый :) Ничего из того, что ты сказал, не понял. Глядя вот на эту выдачу: http://www.yandex.ru/yandsearch?text=url%3D%22narod.yandex.ru%2Fcommunity%2F*%22&pag=u&surl=yandex.ru&

я не вижу ничего странного в наличии одной и той же рубрики у всех страниц подкаталога narod.yandex.ru/community/

minaton, ага, а так же там описаны все интернет-магазины, торгующие и книжками и софтом и музыкой, все издательства, все библиотеки и т.д. и т.п. И ты как-то ушёл от мысли, что одно и то же слово, вырванное из контекста, может принадлежать десяткам тематик (кстати, мы так и не дали понятие этого термина. Я под тематикой в данном случае подразумеваю рубрику в каталоге). А если оперировать не словами, а словосочетаниями, то мне даже трудно представить, скольким словосочетаниям придётся приписывать рубрику, чтобы была возможность по наличию этого словосочетания отнести страницу к той или иной рубрике...

itman, я согласен, что алгоритмы для Директа и поиска могут очень существенно отличаться. Примеры не единичны, только я форум на поддомен вынес на выходных, а потому там вся реклама сейчас не контекстная, а по рубрике Яндекса гонится.

Но и на этом форуме, в курилке, много очень любопытных примеров. Когда соседствуют объявления абсолютно разных тематик - встречаются сплошь и рядом. В общем, я максимум соглашусь на то, что для страницы определяется несколько тематик и никаких пересечений тематик не строится. Только объединение.

minaton, тематика сайта - это несуществующее понятие во многих случаях. Возьми, к примеру, сайт любого неспециализированного СМИ и попробуй автоматом определить ему тематику. В лучшем случае ты его автоматом припишешь ко всем тематикам. Это в случае, если ты тематику сайта определяешь как совокупность тематик всех страниц. А теперь представь, что для того же сайта СМИ тебе нужно определить тематику морды. При условии, что СМИ маленькое и в каталоге не описано. Никак не определишь, потому что при каждом заходе робота он будет читать анонсы публикаций на разные темы. И таких типов сайтов, с размытой тематикой, довольно много... Хотя, конечно, против "Садовский сказал" не попрёшь :)

Более, чем уверен, что тематика страницы Яндексом не определяется. Потому как первое, куда стоит пихать определение тематики - это контекстная реклама. Однако, мне в топике про листы в Exel'e постоянно пихают объявления по сталепрокату. Т.е. вроде бы листы, но совсем другие. Т.о. максимум что определяется, это то, что у страницы донора и страницы акцептора в списке наиболее значимых слов есть совпадения.

Мне могут возразить, мол лист в Excel пересекаетсяся c листом стали через рубрику бизнес: лист -> культура(Ф. Лист), бизнес(прайс-листы, металлургия),... excel->финансы, бизнес, ..., сталь->бизнес (металлургия)..., да и в директе и поиске могут использоваться ну совсем разные алгоритмы.

Отвечаю: здравый смысл в этом конечно есть. Да вот только есть несколько но:

1) распихать хотя бы 5-10 тысяч самых популярных слов по всевозможным тематикам задача не самая простая. А без этого начального распихивания тематику конкретной страницы не определить

2) пересечения множеств строятся гораздо дольше, чем объединения

3) при использовании крупных рубрик (бизнес, дом, hi-tech и т.п.) точность будет крайне невысокая (см. пример выше), а при использовании точных рубрик (металлургия, климатическое оборудование и т.п.) большинство ссылок просто перестанет учитываться, чего явно на сегодняшний день не наблюдается.

pauk:
Но вот мне почему-то кажется, что ищущие труд Платонова одно слово котлован вводить не будут. Скорее, котлован повесть или котлован Платонов.

Дык проверить можно только эксперементальным путём. Я правда более чем уверен, что школьники ищут котлован строго в единственном числе, а строители - строго во множественном. Яндекс, кстати, вполне справедливо, платоновские труды по запросу во множественном числе не выдаёт. К слову, Гугль с единственным числом справляется куда как лучше - Платонов на первых 5 местах.

Полагаю, что Ашмановцы могут лучше всех рынок оценить. Они недавно исследования проводили: http://www.rukv.ru/analytics.html

Однако, по приведённым табличкам и мы можем сделать очень грубые оценки. Делаем предположение: сайт, который оптимизировался хоть как-то имеет тИЦ от 160 (я не виноват, такое медианное значение :)), а PR от 4-х. Всего таких сайтов ~20000. Допустим, продвижение одного сайта в среднем по больнице стоит $6K (многие сайты продвигаются дороже, чем за $1K/месяц и гораздо дольше, чем 6 месяцев с заказчика лупится денежка, но ведь не меньше сайтов, которые таких показателей добились без каких либо затрат на оптимизацию, т.е. это скорее завышенная оценка будет). Итого это $120 миллионов. Одна беда, не за год, а за всё время.

Я же писал отмазку - мнение моё, а не алгоритма Яндекса :)

На указанной странице общее количество ссылок около 400-т штук. Т.е. тут и не пахнет заботой о пользователе.

Всего: 3256