В конце концов жизнь заставит ввести четкие правила. Это случится, когда количество стука и всяких хитрых штучек превысит все разумные пределы. :p
Да, было достаточно интересно. Первый день я не ходила, потому что там были азы интернета, зато второй день мне оч. понравился. + Автор дал свой диск, с кучей материалов. Вроде бы были разговоры о том, чтобы провести более подробные тренинги, уже непосредственно по методикам извлечения информации, но как-то это все затихло. Я почему пошла - я его перепутала с другим Кузнецовым, автором книги "Учебник по информационно-аналитической работе".
Александр, если я найду это пример в материалах семинара - обязательно приведу. Он меня поразил до глубины души, поскольку с трудом уместился на листе бумаги (куча синонимов, исключений и т.д.). Как Вы справедливо отметили, относился не к поиску, а к мониторингу информации - кажется, по югославской проблеме.
По контексту я так в конце концов и поступила - когда строки не хватило на исключение всяких ненужных слов, тогда просто набрала конкретных целевых словосочетаний (слово было - "пушкин" :) ).
Хорошо бы еще сначала понять - какие они, приоритеты :)
И почему просто не игнорировать такие гадости? Их элементарно подстроить, доказать невозможно, откуда ноги растут. Значит, надо просто не учитывать такие ссылки, вот и все. Игнорировать их. Если прекратят банить, а будут игнорировать - кому станет охота этим заниматься? А так... Можно вообще всю поляну... того... :(
Если очень узкий, очень малопредставленный запрос - можно и без ссылок, имхо. Из соображения - на безрыбье... На одном сайте был каталог изделий, яндекс его хорошо проиндексировал. Так вот, разделы каталога по редко встречающимся позициям попадали на первые места в выдаче и по ним приходили реальные посетители.
:)
Причем, насколько я понимаю, их тоже разных много. Как поисковая машина, кстати, определяет, в какой кодировке выдавать? Имхо, собственные настройки?
Эта кодировка называется, по-моему, "Числовая нотация" или "Q.P.". Способ семибитной кодировки, когда вместо русских букв передаются их шестнадцатеричные коды, записанные латиницей.
Ну да, если бы была возможность "технических принципов" - не было бы проблемы правил. Потому что тогда бы весь спам отсекался автоматически, или же, например, игнорировался.
Я бы зацитировала немного по=другому: "Все указанные ошибки не критичны для Яndex, он проиндексирует страницы в любом случае." и "В случаях злостного использования спама администрация Яndex может исключить такие страницы и сайты из базы". Поскольку спам отнесен в раздел "ошибок" это дает надежду на то, что сайт восстановят в результатах, если убрать невидимый текст (или сделать его видимым). Но по крайней мере, это возможность аппелляции.
Про текст "белым по белому" можно почитать непосредственно на яндексе . Возможно, стоит показать Вашему клиенту. Еще я думаю, что через некоторое время, если убрать этот невидимый текст, сайт восстановят в базе. Можно написать в саппорт покаянное письмо - типа осознали, больше не будем, по незнанию сделали (тем более, что это правда - ведь нет четко прописанных правил).
На семинаре "Конкурентная разведка в сети Интернет" нам приводили примеры запросов длиной до 1000 символов. И это было обоснованно, потому что приходилось учитывать все синонимы, близкие значения и т.д. Когда длины поискового запроса не хватает, можно разделить его на два или больше частей. Но в общем, это действительно редко когда надо делать. Я лично столкнулась с нехваткой места, когда подбирала ключевые слова для контекстных показов - слишком много надо было исключать, и места быстро перестало хватать. Пришлось действовать не методом исключения, а более точно подобрать словосочетания.