Google индексирует ссылки форм?

Marshal
На сайте с 09.03.2007
Offline
102
670

Здравствуйте.

Такая у меня ситуация:

Есть большой сайт (свыше 100к страниц в индексе), раскруткой которого я занимаюсь.

Делал на нем формирование мета-тэгов в зависимости от перехода по определенным ссылкам. По моих подсчетам, все страницы, проиндексированные google должны были быть с уникальными мета-тэгами. Единственно, что я не учитывал - это страницы, формируемые при помощи форм.

<form method="get" action="http://site.su/>

<tr>

<td>Выберите критерий</td>

<td>

<select name="peremennaya">

<option value="">Переменная</option>

<option value="Переменная">Переменная</option>

<option value="Переменная">Переменная</option>

</select>

</td>

</tr>

</form>

Вот... И захожу потом в WMT и вижу, что у меня дублируются очень много мета-тэгов на разных страницах. Начал копаться - что именно. Оказывается Гугл показывает страницы, формируемые именно таким образом. Проверил в индексе ли они - действительно, многие из них в индексе.

Но, как Гугл смог проиндексировать подобные страницы? Мне казалось, что его краулер ходит только по ссылкам.

ЗЫ: да, и прошло несколько месяцев с тех пор, как внеслись изменения в форму вывода и в алгоритм формирования мета-тэгов, так что это не просто застоявшаяся информация в Гугле.

M
На сайте с 27.10.2006
Offline
111
#1
Specifically, when we encounter a <FORM> element on a high-quality site, we might choose to do a small number of queries using the form. For text boxes, our computers automatically choose words from the site that has the form; for select menus, check boxes, and radio buttons on the form, we choose from among the values of the HTML. Having chosen the values for each input, we generate and then try to crawl URLs that correspond to a possible query a user may have made. If we ascertain that the web page resulting from our query is valid, interesting, and includes content not in our index, we may include it in our index much as we would include any other web page.

.

Источник: http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html

Также виной тому могли быть и внешние сслылки.

Бесплатное хранилище данных (http://bit.ly/gJYy9Z) (5GB) с синхронизацией. По ссылке — бонус 500MB.
Alipapa
На сайте с 01.02.2008
Offline
234
#2

А то. У меня были страницы, единственный путь к которым был из раскрывающегося списка формы. Так вот, гугл не только их проиндексировал, некоторым даже ПР дал.

Биржа фриланса - простая и удобная (http://kwork.ru/ref/2541)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий