upyrj

upyrj
Рейтинг
140
Регистрация
17.09.2005
Должность
SEO

Разработчик, попросту я тошноту уменьшил, убрав «тошнящих» бегемотов из некоторых пассажей.

Возможно, я и неправ, и в тех случаях, когда мне подобное помогало, срабатывало что-то другое.

Сорри, нет времени на более подробное обсуждение. 8(

john2007, нет, не присутствует; речь не об анкорах, а о собственно релевантности тела страницы.

Кстати то, что меню обычно бывают сквозными, позволяет не задумываться о том, что мы можем испортить релевантность внутенней страницы.

Лишние вхождения слова «бегемот» (без «аукциона» рядом) портят релевантность по «аукциону бегемотов».

Разработчик, совсем не про ссылки речь. А про тексты, релевантность которых портится из-за лишних ключевиков в навигации.

Давайте, что ли примеры морд про бегемотов сделаю:

(1) http://ivanov.in/mm/hipp1.html

(2) http://ivanov.in/mm/hipp2.html

Я полагаю, что вариант (2) будет значительно лучше, чем вариант (1).

PS продам ссылки со страниц про аукцион бегемотов. 8)

mr.Good:
или Яндекс ссылку то видит, но вес ей не придает??

Примерно об этом и топик. 8)

Какая разница, на каком языке делать? Я сделал на PHP, когда понадобилось, — других языков не знаю совсем.

Натуральная выдача — это то, что мы видим в браузере. XML-выдача — это то, чего не видим, но можем добыть программно с помощью Яндекс.XML.

Парсинг — это выковыривание той или иной информации из документа.

Алгоритм я привел, конкретный код приводить не буду, так как (1) долго, (2) я о нем невысокого мнения, и неправильно будет учиться на кривых примерах.

casperW, а нельзя просто выкачать все анкоры программкой Yazzle, а дальше уже мутить с анкорами все, что душе угодно?

Если нужно все автоматизировать, то натуральную выдачу можно хватать по 50 (&numdoc=50), а можно вообще сразу всю выкачивать из Яндекс.XML.

Дальше придется либо парсить сами документы, либо, что перспективнее, обрабатывать их сохраненные копии (кажется, это доступно только при парсинге натуральной выдаче).

При парсинге натуральной выдачи имейте в виду, что Яндекс может забанить IP сервера, если вы его сильно нагрузите.

Я тут недавно делал такую штуку. Алгоритм:

I. Cобираем урлы кешей.

1. Скачиваем страницу натуральной выдачи Яндекса.

2. Выдираем из нее ссылки на «сохраненные копии», складываем в кучку.

3. Выдираем из нее ссылку с текстом «следующая». Если нет такой — останавливаемся.

4. Пауза 1-3 секунды и повторяем с URL из пункта 3.

II. Парсим кеши.

1. Скачиваем «сохраненную копию».

2. Выковыриваем из нее ссылки на нужный адрес, складываем в кучку.

3. Пауза 1-3 секунды и повторяем со следующей «сохраненной копией».

mr.Good:
как вы определяете где ссылки, в быстророботе или в основной базе?

Знаю, не скажу. Не хотите — не верьте. 8)

mr.Good:
двигается по всем запросам, которые есть в качестве ссылок на главной, то есть двигаются не только пакеты.

Морда двигается или нутряк?

mr.Good:
что значит "я бы немножко подубрал из нее вхождения слова «пакеты»"
фраза немного мне не понятна.

Читаем про «тошноту». Я предлагаю ее уменьшить. 8)

pro-maker:
П.С. Написал "кэш" и вспомнил, что "кеш" Яндекс также подсветит.

Более того, он еще и при поиске вхождения слова «кеш» учтет. Тут, видимо, не глюк подсветки, а попросту такой словарь, где «кеш» = «кэш». 8/

robust, гоните. Одумайтесь. 8)

pro-maker, а примерчиков не подкинете?

Всего: 2001