ссылка за пределами <html></html>

47

vl273

11 июля 2014, 08:54

1044

Видят ли поисковики ссылку за пределами тегов <html>

Например:

<html>...</html><a href=...>link</a>

Даже не так. Видеть они скорее всего видят, вопрос - учитывают ли?

K

20

Kerosene

11 июля 2014, 09:30

#1

А зачем такие ссылки, если не секрет?

Следуя логике вещей я думаю что учитывают. Если браузер ее видит и отображает - то что мешает поисковику ее не учитывать?

Не валидно? - Да

Учитывает? - Ничего не мешает учитывать.

104

vkusnoserver

11 июля 2014, 11:12

#2

vl273, для того чтобы ответить на этот вопрос, вам нужно понять как работает поисковый робот, будь то GoogleCrawl или робот Яндекса. Ну и узнать, что такое валидация и ее значение :) Хорошим примером здесь будет вот этот:

Или можно было вас отправить в FAQ Гугла по индексированию мультимедийных файлов :)

Но лучше все это подтвердить не нашими с вами догадками, а... Патентами Гугла! "Document segmentation based on visual gaps" можно перевести как "Сегментация документов на основе видимых промежутков", там нас интересуют следующие места:

“[0038] In situations in which document 500 is a web page, document 500 may be generated using a markup language, such as HTML. The particular HTML elements and style used to layout different web pages varies greatly. Although HTML is based on a hierarchical document object model (DOM), the hierarchy of the DOM is not necessarily indicative of the visual layout or visual segmentation of the document.” [emphasis added]

“[0039] Segmentation component 230 may generate a visual model of the candidate document (act 403). The visual model may be particularly based on visual gaps or separators, such as white space, in the document. In the context of HTML, for instance, different HTML elements may be assigned various weights (numerical values) that attempt to quantify the magnitude of the visual gap introduced into the rendered document. In one implementation, larger weights may indicate larger visual gaps. The weights may be determined in a number of ways. The weights may, for instance, be determined by subjective analysis of a number of HTML documents for HTML elements that tend to visually separate the documents. Based on this subjective analysis weights may be initially assigned and then modified (“tweaked”) until documents are acceptably segmented. Other techniques for generating appropriate weights may also be used, such as based on examination of the behavior or source code of Web browser software or using a labeled corpus of hand-segmented web pages to automatically set weights through a machine learning process.” [emphasis added]

По сути эти два абзаца и отвечают на ваш вопрос. Попробую перевести их:

[0038] В ситуациях, когда документ 500 является веб-страницей, он может быть создан с помощью языка разметки, например, HTML. Конкретные элементы и стили HTML, используемые для макета различных веб-страниц, могут значительно варьироваться. Несмотря на то, что HTML основан на иерархической объектной модели документа (DOM), иерархия DOM не обязательно свидетельствует о визуальном макете или визуальной сегментации документа.

[0039] Компонент сегментации 230 может создать визуальную модель кандидата (акт 403). Визуальная модель может быть основана на видимых промежутках или разделителях в документе, таких как пробелы. В контексте HTML различным его элементам могут быть назначены различные веса (их численные значения), которые определят количество разделителей для конечного документа. В одном случае, большие веса будут соответствовать большим разделителям. Веса могут быть определены различными способами. Например, в результате субъективного анализа элементов в HTML-документе, которые визуально разделяют документы. На основе этого субъективного анализа вес может быть назначен, а затем изменен (оптимизирован), пока документы не будут приемлимо сегментированы. Могут быть использованы и другие технологии генерации веса, на основе анализа поведения и исходного кода веб-браузеров или с использованием "ручного сегментирования" веб-страниц с последующей автоматической расстановкой весов через процесс машинного обучения.

А в целом советую прочитать замечательные статьи (правда они на английском): GoogleBot - это Хром, Как Гугл собирается проиндексировать весь мир? и "Насколько умны поисковые роботы?". Придет необходимое в нашей работе понимание, как и чего работает, чтобы не сделать ложных выводов.

Скидки на хостинг (/ru/forum/629944) | Конфигуратор (http://www.vkusnoserver.ru/link.php?id=31) | Администрирование (/ru/forum/871196) CEO собственной персоной - skype: vkusnoandy

Как повлияет HTML5 на Как поисковая машина может Google представил новую систему

Open AI тестирует память для ChatGPT

Все что нужно знать о DDоS-атаках грамотному менеджеру