Все вопросы по <noindex>...</noindex>

Megavolt
На сайте с 23.12.2005
Offline
179
#31
Segey:
Так как блок в <a> находится не должен

это где такое написанно?

Иногда лучше жевать.... (С)
nickspring
На сайте с 29.03.2006
Offline
228
#32
BigBrother:
4. Единственная немаловажная тонкость с NOINDEX - он должен быть корректно вписан в DOM-модель страницы. Иначе результат малопредсказуем.

И почему мне кажется, что бот ничего не знает о DOM ;)

Ёжик В Тумане
На сайте с 26.07.2006
Offline
16
#33
nickspring:
Получается такая:
Код HTML:

<a href="#"><noindex>текст</noindex></a>

конструкция неправильная?

Неужели я не могу написать вот так:


Это сайт: <a href="какой-то-URL">Настоящих героев нашего времени<noindex>:
Воров и взяточников</noindex></a>
😂 😂


Кстати, если б я вместо noindex, я поставил strong, тег логического ударения, то с точки зрения семантики, было б ясно мое отношение к сайту, а голосовой браузер (жаль в России нет не одного голосового браузера на русском, да и вообще:
"лучший валидатор голосовой браузер" (c) Junior) сделал бы ударение на выделенной фразе.

nickspring:

И почему мне кажется, что бот ничего не знает о DOM

:D :D :D , nickspring, ни Вам одному, так кажется.

Ушел в себя, забыл про форум.
Вернусь ли? Не знаю... Если нужен, пишите в аську...
BigBrother
На сайте с 16.06.2006
Offline
96
#34
Лев Павлович Градский:
Куда-то у Вас голова не туда работает. :)

Обьективнее некуда высказался ниже BigBrother.

Не понятно одно.

Допустим, владелец сайта размещает линкопомойку на главной странице. Закрывает ее в noindex.
Если правило "мы не баним за то, что не индексируем" работает, то сайты могут превращатся в помойки без опасений возможности бана?

Немаловажное условие - а что там еще кроме помойки есть? Пара статей с чужих сайтов?

So many kings, but few jokers!
BigBrother
На сайте с 16.06.2006
Offline
96
#35
Ёжик В Тумане:
BigBrother, пожалуйста, разъясните:
1. как не стандартный (читай не валидный тег), может вписываться в объектную модель HTML документа.
2. каким образом воспринимать структуру этого тега, т.е. является ли он блочным (% block), строчным (% inline) или строчно-блочный (% Inline ) элементом (изучите любой doctype и станет понятен смысл моего вопроса), а ведь есть и другие типы, например, списочные элементы, т.е.:
<a href="#"><div></div></a>

есть нарушение спецификации HTML (строка не может содержать блок), однако, хотелось бы узнать, как роботом Яндекса воспримется такое:
<a href="#"><noindex>текст</noindex></a>

и
<noindex><a href="#">текст</a></noindex>

Эти записи одинаковы или нет? Верны или какая-то ошибочна?
И в догонку :), а как робот Яндекса воспринимает текст расположенный внутри noscript (содержимое noscript одного из сайтов, показывалось в числе проиндексированного еще с сайта, а потом пропало).

Вопрос философский, на самом деле - что есть ссылка без анкора по сравнению с отсутствием ссылки... По-моему ответ тривиален.

Но спасибо - навели на интересную мысль. Правда, про другое.

HoSStiA
На сайте с 18.02.2004
Offline
144
#36
BigBrother:
Немаловажное условие - а что там еще кроме помойки есть? Пара статей с чужих сайтов?

Если "визуальное" определение авторских прав осуществляется по тому же принципу, что и отбор сайтов в ЯКу, то оригинальные источники еще долго будут считаться плагиаторами. 😂

Контр-вопрос: на сайте с собственными авторскими статьями я имею право размещать любое количество ссылок на других Васей Пупкиных, не задумываясь о существовании <noindex>? ;) Даже если статьи про жизнь на Марсе, а ссылки - на сайты погонщиков страусов или продавцов био-туалетов?

[Удален]
#37

Попробую ещё продолжить и изложить дополнительные соображения.

Итак, возможно, некоторая часть веб-страниц и веб-сайтов (а, может быть, и преобладающая) строится по следующей общей скелетной схеме:

1) левая колонка - поле: меню + (краткие) новости сайта;

2) основное, среднее поле-колонка: основной релевантный контент;

3) правая колонка - поле: какие-то дополнительные информационные вспомогательные разделы страницы.

Таким образом, стоит задача - "отвести" от индекса 1-е и 3-е поля.

Очевидно, также на большинстве страниц при чётком их табличном построении эти поля будут представлены вот так:

...

<td>

Первое поле

</td>

...

<td>

Второе поле

</td>

...

<td>

Третье поле

</td>

...

Всё это, разумеется, будет размещаться в "недрах" какой-то более общей табличной структуры. Попробую сделать вот так:

...

<td>

<noindex>

...

Первое многоструктурное поле

...

</noindex>

</td>

...

<td>

Второе, главное поле

</td>

...

<td>

<noindex>

...

Третье многоструктурное поле

...

</noindex>

</td>

...

Логично, на мой взгляд, будет предположить следующее. Если уж и есть какие-то DOM-правила у интерпретатора Яндекса относительно конструкции <noindex>...</noindex>, то они, вероятно, ничем не отличаются от общеустановленных правил html-интерпретации. Один из главных принципов - вложенность и структурность. Т.е., вышеуказанная конструкция представляется всё-таки жизнеспособной и предсказуемой: контент первой и третьей колонок будет выведен из-под индексации.

Далее. Структура моего сайта довольна проста. И специальная страница "Карта сайта" отсутствует. Значит, прозрачность структуры сайта для робота приходится обеспечивать другими внутренними средствами. А, следовательно, нельзя будет "выдернуть" меню абсолютно на всех страницах. Придётся "оставить" его или на какой-то одной, или на нескольких страницах. К вопросу - на каких страницах оставить - я подошёл следующим образом.

В составе сайта есть 4 страницы: "О проекте", "Этот день...", "Новости России" и "Главная". На первой из них - в общем-то, трескотня. И её релевантность меня не беспокоит. "Оставляем" меню. На второй - собственно, исторические имена и события. Всё равно по таким запросам ко мне на сайт пользователи не прийдут, а прийдут на более тематические и релевантные ресурсы. Также оставляем. Новости России - тоже мешанина, хотя и строго по теме. Лучше тоже оставить - дополнительной релевантности не словишь, тем более, строгая тематика сайта - отнюдь не новостная. Ну, а главная страница - это точно компот. Всё обо всём, главном и сопричастном. Так что тоже - оставляем.

А всего страниц в составе сайта на текущий момент - 54. Их них 5 - архивных, т.о., 49 - "пользовательских". Вот из них уже 4 вышеуказанные - оставляем нетронутыми относительно <noindex>...</noindex>, а на оставшихся 45 - вышеприведённую схему применяем по полной.

Соображения?🚬

И ещё вопрос: с какой страницы обычно робот начинает индексацию? С "index.html" или подобной? Или как-то "по алфавиту"?

The WishMaster
На сайте с 29.09.2005
Offline
2542
#38
Segey:
Отреагируют, за то что они видят и индексируют они банят

Ну в таком случае явно забанит... :)

Segey:
какой тут повод для бана?

Ну как какой. На время закрыл ее, например, на время переписки с Платоном. А потом опять открыл:)

Пешу текста дешыго! Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)
богоносец
На сайте с 30.01.2007
Offline
769
#39
(GoodWin): ещё вопрос: с какой страницы обычно робот начинает индексацию?

Видимо, с той, которую узнаёт первой.

Реально — важнее то, как он потом переиндексирует изменённые страницы.

По наблюдениям: Уже не происходят проверки (начиная с index.) закрытости ссылок. (Одна ссылка была в ноуиндексах, но страница на которую она вела — Не_была запрещена для индексации, но уже проиндексирована. Не_смог дождаться — когда он перестанет её переиндексировать... запретил в robots.txt; а с другой аналогичной страницей — тоже самое творил Rambler).

(GoodWin): а на оставшихся 45 - вышеприведённую схему применяем по полной.

Только всё-таки следует уточнить это самое «по полной»:

Приветствия, дружественность для пользователя … закрываем.

Важно приблизить слова вероятно искомых фраз:

<p>Раскрутка <noindex>входящих в быстротечную моду</noindex> сайтов — производится <noindex>посредством размещения их http:// на автобетономешалках, каруселях, на которые смотрят родители, асфальтоукладочных катках — на них смотрят дети. Последствия — пока не очевидны</noindex> в плане <noindex>их</noindex> эффективности.</p>

Тут закрыта точка, определяющая границу предложений (возможно — сниппетов). Теги <p> и <td> — тоже ограничат сниппет.

В действительности — эффективность повышаемой концентрации — “взвешивается” функцией (наверное) типа lg и переходит в насыщение, т.е. повысив концентрацию раз в 10 — вес слов документа повысишь только раза в 2, поэтому — точно составленный <title> так, чтобы из 5 слов возникали 4 поисковых фразы — может оказаться весомее — не по одному конкретному, а по нескольким запросам.

где ваши тухлые музы
вордстат.яндекс.ру — может подсказать “соседние” запросы,
а из “что ещё искали икавшие ...” — тоже можно выбирать ... что дописать в тексты внешних ссылок на сайт/страницу.
Это действительно ступенчатый процесс, с наблюдением промежуточных последствий в выдаче.

Навигационное меню — можно использовать для распределения долговременной тенденции роста вИЦ (чем больше внутренних/внешних ссылок на страницу — тем больше на неё перетекает и наоборот) — все открытые слова навигации — лучше подобрать соотв. теме соотв. страниц. Вес морды — легче повысить внешними ссылками.

Segey, может оставаться неизвестно что-то очень простое про роботов, но известно из первых рук:

The WishMaster: ...
_______________
Продаю ссылки. Много. Недорого. Внутренние тоже. Места под статьи.
[Удален]
#40

Да, да, да, со многим согласен. На счёт того, чтобы навигационное меню "представить в релевантность", тоже думал и это обмозгую. Но вот только какой толк от ссылки "Библиотека"? Не буду же я запихивать в описатель тэга целиком вот это - "Библиотека учебной литературы"...

В общем, надо пробовать. По-новому страницы прописал. Можно читать - где и как. Ну, и будем смотреть какой-нить результат.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий