== Индексация документов Word

12
P
На сайте с 03.03.2003
Offline
132
2495

По запросам на поисковиках выдаются ссылки на документы в формате Word. Интересно, как они индексируются? Что в них влияет на индексацию? Имеет ли значение служебная информация? В каких форматах кроме .doc может быть документ? И если есть вебстраница и документ Word с абсолютно идентичным содержимым, то они не будут восприниматься поисковиками как "зеркала"?

Если солдаты в армии заняты хозяйственными работами, значит именно для этого и нужна армия.
`
На сайте с 11.02.2005
Offline
102
#1

Panas,

И если есть вебстраница и документ Word с абсолютно идентичным содержимым, то они не будут восприниматься поисковиками как "зеркала"?

:) Нет конечно. Сравните код HTML и .doc (WORD)

East or West GOOGLE is the best!
P
На сайте с 03.03.2003
Offline
132
#2

Я говорю о контенте, а не о коде HTML.

Если исходить из вашего утверждения, то можно написать вебстраницы следующих видов:

1. Просто текст на странице. Например, "Привет"

2. И тот же текст (Привет) в виде кода "&#207 ;&#240 ;&#232 ;&#226 ;&#229 ;&#242 ;" (пришлось вставить пробелы, т.к. на форуме эта запись обрабатывается и конветируется в текст).

или как скрипт Java

<SCRIPT LANGUAGE="JAVASCRIPT">

// <!--

document.write("Привет");

// -->

</SCRIPT>

и по Вашему это будет индексировано по-разному? У меня есть сомнения в этом. Иначе можно очень легко и быстро наделать клонов вебстраниц для продвижения информации или сайтов . Есть чувство, что у некоторых поисковиков такие приемы не проходят.

N8
На сайте с 25.06.2004
Offline
27
#3

рядом с файлом есть ссылка "View as HTML" вот с ним он видимо и будет сравнивать по контенту.

а типы:

What file types are returned in a Google search?

There are 13 main file types searched by Google in addition to standard web formatted documents in HTML. The most common formats are PDF, PostScript, Microsoft Office formats:

Adobe Portable Document Format (pdf)

Adobe PostScript (ps)

Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)

Lotus WordPro (lwp)

MacWrite (mw)

Microsoft Excel (xls)

Microsoft PowerPoint (ppt)

Microsoft Word (doc)

Microsoft Works (wks, wps, wdb)

Microsoft Write (wri)

Rich Text Format (rtf)

Shockwave Flash (swf)

Text (ans, txt)

`
На сайте с 11.02.2005
Offline
102
#4

Или я конкретно не въезжаю, или вы что-то не допонимаете.

Чтоб страницы склеить нужно как текст так и код эдентичный иметь!!!

P
На сайте с 03.03.2003
Offline
132
#5

Значит вебстраницы можно легко клонировать? Достаточно один и тот же контент записать тремя вышеуказанными способами и поисковики это съедят так, как надо промоутеру? Чего-то я сильно сомневаюсь, что контенту и коду уделяется равное внимание. Впечатление, что код учитывается совсем мало.

`
На сайте с 11.02.2005
Offline
102
#6

Оглянитесь вокруг!!! Вы никогда не встречали одни и теже статьи на разных ресурсах, практически один в один! И нормуль!!!

Бессмысленный разговор начался

N8
На сайте с 25.06.2004
Offline
27
#7
Panas:
Значит вебстраницы можно легко клонировать? Достаточно один и тот же контент записать тремя вышеуказанными способами и поисковики это съедят так, как надо промоутеру? Чего-то я сильно сомневаюсь, что контенту и коду уделяется равное внимание. Впечатление, что код учитывается совсем мало.

Смена дизайна вот вам код и изменился.....

VB
На сайте с 23.02.2004
Offline
19
#8

Если дизайн поменять то не склеит, но ИМХО могут быть санкции за дублирование контента.

P
На сайте с 03.03.2003
Offline
132
#9
ViaBaton:
Если дизайн поменять то не склеит, но ИМХО могут быть санкции за дублирование контента.

Если Вы создали 10 страниц на разных хостингах с одинаковым контентом, но с разным кодом и, может быть, дизайном. То к кому будут применены санкции?

- если не к "основному" сайту, то за что? Человек скопировал контент, но может быть ему разрешил автор. И может быть он и не стремился попадать в поисковик, он сам его нашел. Так за что его банить? Админ-то не может знать что все владельцы на самом деле одно лицо.

- если к "основному" сайту (который собственно и продвигается), то за что? Получается, что так можно забанить любой раскрученный сайт? Копируете контент у конкурентов в 10 экземплярах и начинаете прописывать ... Так что-ли?

VB
На сайте с 23.02.2004
Offline
19
#10

Panas, точных ответов на эти вопросы никто не знает, но их уже неоднократно обсуждали.

По поводу санкций, был на практике случай.

Один владелец сайта X размещал на своем сайте контент с сайта Y, причем не просто воровал его, а платил за этот контент деньги. Так вот, где-то через 3-4 месяца на сайт Х были наложены санкции (проявились в виде резкого падения по запросам из приобретенного контента). Письма гуглу с объяснением ситуации ничего не дали.

Вот такая страшилка из жизни... :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий