[Drupal] Модуль ajax загрузки блоков

[Удален]
#71
vandamme:
гугль сканил

какой бот именно?

vandamme
На сайте с 30.11.2008
Offline
675
#72

не знаю

картиночные и эти

66.249.72.50 - - [15/Jan/2012:04:23:18 +0400] "GET /atata1?rand=616147187 HTTP/1.1" 200 28154 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.115 - - [15/Jan/2012:04:25:20 +0400] "GET /atata2?rand=944663782 HTTP/1.1" 200 26465 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.71.152 - - [19/Jan/2012:15:11:25 +0400] "GET /atata3?rand=91355219 HTTP/1.1" 200 26731 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.66.117 - - [22/Jan/2012:06:49:15 +0400] "GET /atata4?rand=784533084 HTTP/1.1" 301 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
[Удален]
#73

vandamme, а в роботсе запрещено сам скрипт и папка куда он обращается?

vandamme
На сайте с 30.11.2008
Offline
675
#74

не знаю, скрипта как такового нету, который люстик использует на блоге, он вшит в модуль, в общем не знаю

гугль сканирует настоящие странички сайта с добавкой ?rand=616147187

суть в том, что при загрузке странички в исходном коде ?rand=616147187 каждый раз меняется, хотя ссылки на странице нет, но он запрашивает такие страницы

то есть каждый раз идентификатор меняется и он может тыщу раз сканировать одну и ту же страничку с разными ?rand=*********

=DEREK=
На сайте с 07.05.2009
Offline
130
#75

Прямое доказательство что Google выполняет не только javascript, но и ajax. Ссылок сайт/адрес-странички?rand=363363897 не то что в коде страницы нету, их нет даже в javascript коде в прямом виде, они собираются динамически. Можно попробовать как-то так: Disallow: /*rand=

Показываю фокусы с Drupal (/ru/forum/526565)
[Удален]
#76

=DEREK=, есть более красивые решения :)

www.allave.ru в верхнем меню "ссылка" календарь или под кнопкой поделиться Готовые решения от регистратора

---------- Добавлено 25.01.2012 в 12:25 ----------

=DEREK=:
Прямое доказательство что Google выполняет не только javascript, но и ajax. Ссылок сайт/адрес-странички?rand=363363897 не то что в коде страницы нету, их нет даже в javascript коде в прямом виде, они собираются динамически

собираются где в браузере?

js закрыт от индексации?

vandamme
На сайте с 30.11.2008
Offline
675
#77
=DEREK=:
Ссылок сайт/адрес-странички?rand=363363897 не то что в коде страницы нету

ну да в коде абсолютной ссылки нету

там есть просто упоминание странички

"ajax_block": { "path": "/index.html?rand=742874902", "ids": [ "block-menu-articles" ] } });

кстати точно также гугль индексирует таксонометрию по фидам, если не стоит globalredirect

---------- Добавлено 25.01.2012 в 12:31 ----------

burunduk:
собираются где в браузере?
js закрыт от индексации?

ну это как у seom.info подключением js который грузит маленький файл html с этой ссылкой?

http://seom.info/wp-content/themes/arclite/js/jqwery.js

http://seom.info/wp-content/themes/arclite/js/logotip.html

[Удален]
#78
vandamme:
"ajax_block": { "path": "/index.html?rand=742874902", "ids": [ "block-menu-articles" ] } });

если это есть в коде страницы или js не запрещён к индексации гугл будет переходить по данному адресу, если запрещён и нет в коде страницы, то только Google Web Preview

vandamme
На сайте с 30.11.2008
Offline
675
#79

так как поступить?

дописать

Disallow: /*rand=

?

[Удален]
#80
vandamme:
так как поступить?

я бы вообще написал

Disallow: /*?

тока из кода страницы строки, если они там есть, надо убрать во внешний js, который тоже необходимо закрыть от индексации, а еще лучше вызывать его из другого js - по принципу если есть элемент с class="какой-то класс для обработки" на странице, то подгружаем необходимый js для загрузки

"ajax_block": { "path": "/index.html?rand=742874902", "ids": [ "block-menu-articles" ] } });

например так http://www.allave.ru/calendar.html

js microform.js загрузится только в том случае если на странице будет найден элемент с class="vcard"

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий