SplashS

SplashS
Рейтинг
4
Регистрация
18.01.2010
root:
это передается специальному боту, ему важно только получить результат, взламывать там нечего.. имхо

Может быть вы и правы, но этот бот все равно не выполняет код как браузер.

Я просто хочу сказать топикстартеру, что метатеги изменяемые яваскриптом поисковики индексировать не будут. Для этого краулеру нужно строить DOM страницы, а это очень ресурсоемкая процедура.

Ну вообще похоже на то, что нужно подождать. А если хотите наверняка - сделайте разные robots.txt для ваших двух доменов и там где без www поставьте


User-Agent: *
Disallow: /

При этом site.com/robots.txt должен отдавать 200 статус. А все остальные страницы сайта по прежнему 301.

Да что вы все привязались к поисковикам. Дайте паре-тройке человек прочесть текст. Только чтобы такие, которые честно ответят - какашечный текст или нет и проанализируйте их ответы.

Пишите текст не для пузомерок или Яндекса, а для пользователей.

А если людям текст будет интересен, то и поисковики к вам потянуться :)

Trump:
По информации ещё от 2006 года, краулеры поисковиков (в т.ч. Google) могут исполнять (не парсить) JavaScript.

Из того что я прочитал по вашей ссылке следует только что боты умеют определять частные случаи редиректа типа

<script language=»JavaScript»>
document.location.href = «http://www.site.com/directory/1.html»;
</script>

Насколько я понимаю работу поисковиков - выполнять у себя в краулере код - смерти подобно. Ведь в этом случае существует вероятность взлома краулера изнутри.

А чего тут секретного. Есть три основные составляющие - текст, вес и тексты ссылок. К этому разные посковики подмешивают разные фильтры, меняют коэффициенты у этих составляющих. вот и вся разница. Базового никто ничего нового не придумал.

Archimedes:
Слышал, что у Яху самая большая поисковая база в мире.

Похоже они единственные в неупакованном виде индекс свой хранят :))

А если серьезно, то про яндекс я пару лет назад слышал, что объем индекса порядка 100 терабайт. Сейчас наверное 200-300.

Кашалот:
Для создания тезауруса нужна прога, которая умеет приводить слова (текст) к исходной форме

Я когда-то использовал вот этот ресурс: http://www.morphology.ru/

Делал к нему запросы POST-ом и кэшировал результаты.

Вообще если контент часто меняется, то страницы будут чаще переиндексироваться.

А так - важно, чтобы контент был не какашечным.

alex063:
лучше такой:

http://promayki.ru/cat/devyanosto_tri

Поддерживаю. Опять же по причине алгоритмов склейки. Краулеру по барабану какой урл.

Индексируются ли ссылки в и ?

Я думаю, что вы слишком запариваетесь :)

Яндекс и гугл конечно индексируют Flash. Но ролики размещены не у вас на сайте и соответственно не будут влиять на ранжирование вашего сайта.

С точки зрения алгоритма PageRank при передаче веса имхо учитываются только href ссылки.

В HTML не зря есть различие между атрибутами src и href.

Например, если вы разместили у себя картинку с другого сайта по абсолютной ссылке, то это не означает, что вы передаете тому сайту ссылочный вес.

Всего: 55