paul

Рейтинг
9
Регистрация
31.08.2001

Originally posted by Gray:
Ты на http://www.yahoo.com зайди

А еще лучше - на http://www.google.com . Сразу станеть понятно, в каких единицах там шкала откалибрована

Originally posted by jed:
угу, спасибо. про alt'ы я забыл. меня смущает то, что там ключевые слова только в тэгах заголовков и метатагах. в тексте самом их нет. не могут ли это сочти за спам?
зы: яндекс, собака, никак странице не проиндексирует .

Так чего же вы хотите - Яндекс считает страницу релевантной, если слова запроса встречаются как в мета тегах, так и в тексте. Да и вообще, наличие ключевых слов в тексте, желательно повыше - один из ключевых моментов дорвеев...

Согласно спецификации HTML эта строка указывает браузеру, что перед ним текстовой документ html типа, который использует описание языка (DTD) от W3C консорциума версии 4.0 в английской транскрипции. По правилам, это очень важная строка, но браузеры избаловали веб-мастеров тем, что часто не обращают на нее внимания, поэтому мало кто знает о ее значении - и так прокатит. В принципе это не так уж плохо, но если придется заниматься XML кодингом плюс XSL трансформацией, то этой строке придется уделять немало внимания.

А с точки зрения поисковиков трудно не согласиться с предудущим авторам - она им в подавляющем числе случаев по барабану...

Использование robots.txt позволяет скрыть от спайдера те файлы и каталоги, появление которых в поисковике нежелательно. Например, каталог со служебной графикой и пр. В этих случаях его использвание весьма оправдано.

С точки зрения прироста пользователей robots.txt позволяет закрыть каталоги очень большей степени вложенности и тем самым ускорить переиндексацию сайта. Хотя это имеет смысл, если на сайте несколько тысяч страниц

Примерно так (файл должен иметь расширение, которое обрабатывает php-парсер):

<?

header("Expires: Mon, 26 Jul 1997 05:00:00 GMT"); // Date in the past

header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT"); // always modified

?>

Таким образом в заголовок в поле Last Modified подсовывается текущая дата и время в формате GMT стандартной функцией gmdate().

Касательно первого пункта могу сказать, что мы производим ту информацию, которую яндекс продает. Он ведь всего - навсего промежуточное звено между сайтами и посетителями.

Вы, Александр, конечно помните, с чего вообще начинались поисковые системы - информации в сети стало настолько много, что самостоятельно ее найти стало невозможно. То есть именно сайты породили поисковые системы, а не наоборот. Я например, еще помню те времена, когда чтобы найти информацию, надо быдо зайти в какой-нибудь каталог какого-нибудь буржуйского университета. А поисковые системы появились потом, и воспринимались поначалу как нечто несерьезное.

А теперь они зажирели настолько, что думают, что именно они создают информацию, напрочь забывая о своей посреднической функции. Ну выкинут все сайты из яндекса, и что далее?

А по поводу второго пункта, то что вы описали напоминает тотальную слежку - кто куда пошел, что нажал, что не нажал. Тут для определения релевантности никакой робот, никакой морфологический анализ не нужен. То есть не нужны программеры, которые это все пишут. Нужны лишь спецы по контролю действий пользователя. И с этой точки зрения мы не нужны яндексу точно так же, как ему становится не нужен и Сегалович со товарищи. Забавно, не правда ли ?

Да господа, похоже нам всем можно собирать наши игрушки и отправляться баиньки .

А если серьезно, то это один из примеров того, как портит власть - некие обслуживающие (контролирующие) органы в какой-то момент начинают думать, что это не они для нас, а мы для них. Если так пойдет и дальше, то скоро яндекс начнет работать следующим образом - человек вводит запрос, а ему сотрудники яндекса, сообразуясь со своими пожеланиями, вручную составляют список сайтов.

А всех веб-мастеров обяжут письменно присылать заявки, на какие запросы они претендуют, а вот яндекс без всякого уведомления может эти заявки отклонить.

Ничего не напоминает? Примерно по таким критериям работают посольства - вы приносите заявку, а вам могут и отказать без указания причин.

Релевантность отныне - величина сугубо субъективная, поскольку есть степень удовлетворенности клиента. А вычислить эту степень можно только на детекторе лжи. А поскольку каждого клиента на детектор на затащишь, то релевантность есть степень удовлетворенности сотрудников яндекса.

Если же творчески развить ситуацию, то можно легко представить, что если применять эту лицензию буквально, то скоро яндекс лишиться всех сайтов, поскольку на сегодня в работе веб-мастера одно из главных умений - умение продвигать сайт (лично я без него обходился пять лет, а потом пришлось освоить). И с чем останется яндекс? Со старыми страницами, которые были созданы бог знает когда. И кому тогда этот яндекс будет нужет с его маленькой и замшелой базой? А нет сайтов - нет посетителей, нет посетителей - нет рекламодателей, нет рекламодателей - нет денег, нет денег - нет яндекса.

Так что это путь самоуничтожения. Неплохо бы об этом подумать.

Люди, которые открывали деление ядра, тоже не могли представить, что это кончиться созданием оружия массового уничтожения. Программисты, которые делают яндекс, выдумывая алгоритмы ранжирования и борятся с тем, что по их мнению является спамом, скорее всего тоже не думают или не могут представить себе всех последствий этой борьбы. Тут нужна сильная политическая воля, которой у программеров нет по определению - им платят деньги не за политику.

Чтобы подвести черту под моим словоблудием, хочется спросить у Ильи - а не проводили они у себя примерные прикидки количества сайтов, которые нужно будет выкинуть из базы на основе данной лицензии? И не получится ли так, что весь труд по написанию робота, разработки морфологического анализа страниц и всего прочего окажется спущенным в унитаз только потому, что все, что робот переиндексит, будет выброшено из базы? А робот, который ползает по сайтам без каких - либо результатов, уже похож на DoS атаку. И не признают ли тогда всю их компанию заурядными хакерами, которые мешают работе сети? Нет такого чувства?

Вот предыдущий автор как раз и может прояснить ситуацию.

Меня спросили, я ответил, а про удаление я ничего не говорил

Originally posted by wolf:
Com-сайт на русском языке? И посылал ли ты его на регистрацию? Если да, то редакторы яндекса могли его проверить вручную и разрешить к индексированию.

Ни слова на русском, на регистрацию не посылал.

Позволю себе не согласиться с предыдущими ораторами - Яндекс все-таки индексит буржуйские сайты. Я глянул на свой .com сайт, и Яндекс мне среди прочего выдал следующюю фразу - "еще с сервера не менее 40 документов". Очевидно, что фраза могла появиться только после индексации.

Когда я пошел по ссылке, то убедился, что это действительно документы с .com сайта, все без обмана...

А с русского сайта у меня подлинкована только главная страница .com сайта.

Всего: 64