Iggo

Рейтинг
81
Регистрация
04.06.2010
Интересы
Балет на льду, хоккей на траве (с) Ф.Раневская
kik84:
Именно так, это, например всем до завтрашнего утра, написать в роботс: фак ю, яша в виде User-agent: Yandex
Disallow: / # ??:)

Неееее, на информатике эту конструкцию не проходили :)

dlyanachalas:
Любой вебмастер - тоже коммерческая и негосударственная структура.

И только полный идиот будет писать "Спасибо тебе, Яндекс, что ты меня зобанил!"

;)

Как независимая структура вебмастер может в отместку запретить пользователям переходить на свой сайт с Яндекса. Яндекс, обезумевший от такого, завалит вебмастера кучей писем со "вкусными предложениями" :)

Все люди взрослые и должны понимать, что в мире коммерции для двух независимых игроков все должно быть обоюдовыгодно и обоюдоинтересно. Вот и стоит подумать, чем твой сайт должен стать интересен Яндексу (чем Яндекс интересен вебмастеру все понимаем).

mi9029253:
Ответ на ваш вопрос уважаемый, вы найдете в каждом моем сообщении, где я неоднократно подчеркиваю негативные стороны работы Яндекса. И о поисковом спаме я уже писал, читайте внимательно и не делайте из себя недопонимающего умника. Вы свои денежки в поте лица отрабатываете, или за свое теплое местечко боитесь, а я представляю интересы тысячи вебмастеров, и вы меня не скомпромитируете на бессмысленную ботовню о псевдо справедливости. Любую гадость можно представить как благо народное, мы это знаем, у нас и массовые убийства можно обосновать если на то пошло, но то с безграмотными людьми проделать можно, но отнюдь не с теми, кто видит вещи в их истинном свете. Так что суд мне тут устраивать не нужно, и лично вам я не на что отвечать не собираюсь и оправдываться перед вами, люди и сами поймут, насколько справедливы те или иные меры, важно только им суть вопроса как следует раскрыть, да сказать о том, что и как надо делать.

А не устраивает меня плохая индексация, когда во-первых она проходит раз в неделю, за это время даже пельмени тухнут, не говоря об информации, во-вторых все эти фильтры, когда из поиска выкидывают целые сайты и не индексируют их, я бы указал вам на пару примеров нормальных сайтов, но здесь это чревато послездствиями, не одной внешней ссылки, люди статьи читают по нескольку штук за раз, а страницы в поиске нет. Все эти АГС, просто издевательнство, так как речь идет еще раз повторю, не о каталоге, а о ПС, не нравится контент, понизь его в выдаче, хоть в самых зад убери, но не исключай их поиска как такового вообще, люди сами разберуться, что им интересно, а что нет. А что я предлагаю, так это поднять вопрос о таком вот отношении Яндекса к поиску, везде, на сайтах, форумах, соц сетях и так далее. Люди кормят Яндекс, именно они своим выбором, могут сбить его с понталык, но мы должны донести до них информацию о данной поисковой системе в ее истинном свете. Так что уважаемый представитель ПС, прошу вас донести до своего начальства, что надо иметь совесть и думать не о горстке зажравшихся сайтов, а обо всех вебмастерах, сколько можно выкидывать страницы из поиска, люди ночами статьи пишут, а вы их под нож пускаете своими фильтрами и не надо сказки рассказыывать про то, что все по делу, не все мы тут дети.

Создалось ощущение, что месье начинающий графоман. Не нравится выдача Яндекса - да ради бога, не пользуйся. Считаешь что Гугл более адекватен - велком. Считаешь, что не существует на свете ПС, отвечающей твоим изысканным вкусам - напиши свою (пример Linux первое время будет греть твою душу). Если окажется, что много-много-много человек так же как и тебя не устраивают существующие ПС, они мгновенно станут твоими поклонниками и почитателями.

Поймите, Яндекс - коммерческая (а в нашей стране ОЧЕНЬ важно указать, что и негосударственная) структура. Единственная задача ЛЮБОЙ коммерческой структуры - зарабатывание денег (в рамках дозволенного государством). Судя по открытым источникам, Яндекс с этой своей задачей справляется на ура. Как только у него начнется отток пользователей - значит он накосячил где-то и что-то будет менять. Других побудительных мотивов в сложившейся ситуации нет.

Вы же тоже рассматриваете Инет как место заработка. И навряд ли Вам понравится, когда люди с улицы начнут даже не давать советы, а требовать от Вас исполнения чуждых с Вашей точки зрения действий. Я даже примерно знаю пару мест, куда Вы отправите советчиков. Ну может в пять-шесть, если Вы неимоверно эрудированы :)

Закругляюсь - просто примите ситуацию как данность и попытайтесь ее использовать. Это то единственное, что нам остается - пользоваться тем, что есть. Сугубо ИМХО

rpex:
Я не пойму, что за расколбас такой?
Каждый Ф5 позиции как будто рендомно распределяет. Даже в режиме "инкогнито".
Давно так вообще? Может я от жизни отстал?

Так это обкатка нового алгоритма "Фортуна" :)

ivan-lev, вот нашел на просторах рекомендацию по обработке gzip в conf:

# ----------------------------------------------------------------------

# Gzip сжатие

# ----------------------------------------------------------------------

<IfModule mod_deflate.c>

# Включаем deflate для не стандартных заголовков:

# http://developer.yahoo.com/blogs/ydn...yond-gzipping/

<IfModule mod_setenvif.c>

<IfModule mod_headers.c>

SetEnvIfNoCase ^(Accept-EncodXng|X-cept-Encoding|X{15}|~{15}|-{15})$ ^((gzip|deflate)\s*,?\s*)+|[X~-]{4,13}$ HAVE_Accept-Encoding

RequestHeader append Accept-Encoding "gzip,deflate" env=HAVE_Accept-Encoding

</IfModule>

</IfModule>

<IfModule mod_filter.c>

AddOutputFilterByType DEFLATE text/html text/plain text/css \

application/json text/javascript application/javascript application/x-javascript text/x-js text/ecmascript application/ecmascript text/vbscript text/fluffscript \

text/xml application/xml text/x-component \

application/xhtml+xml application/rss+xml application/atom+xml \

image/x-icon image/svg+xml application/vnd.ms-fontobject application/x-font-ttf font/opentype

</IfModule>

</IfModule>

Что думаете - поможет?

ivan-lev, вот нашел на просторах рекомендацию по обработке gzip в conf:

# ----------------------------------------------------------------------

# Gzip сжатие

# ----------------------------------------------------------------------

<IfModule mod_deflate.c>

# Включаем deflate для не стандартных заголовков:

# http://developer.yahoo.com/blogs/ydn/posts/2010/12/pushing-beyond-gzipping/

<IfModule mod_setenvif.c>

<IfModule mod_headers.c>

SetEnvIfNoCase ^(Accept-EncodXng|X-cept-Encoding|X{15}|~{15}|-{15})$ ^((gzip|deflate)\s*,?\s*)+|[X~-]{4,13}$ HAVE_Accept-Encoding

RequestHeader append Accept-Encoding "gzip,deflate" env=HAVE_Accept-Encoding

</IfModule>

</IfModule>

<IfModule mod_filter.c>

AddOutputFilterByType DEFLATE text/html text/plain text/css \

application/json text/javascript application/javascript application/x-javascript text/x-js text/ecmascript application/ecmascript text/vbscript text/fluffscript \

text/xml application/xml text/x-component \

application/xhtml+xml application/rss+xml application/atom+xml \

image/x-icon image/svg+xml application/vnd.ms-fontobject application/x-font-ttf font/opentype

</IfModule>

</IfModule>

Что думаете - поможет?

Недоделанное мучит...

Поставил на некоторое время логирование заголовков от "удачно отработанных" запросов и вот первые результаты!!!

1. В ошибках:

--- 2013-10-04 01:24:58
Cache-Control: no-cache
Connection: Keep-Alive
Pragma: no-cache
Accept: */*
Accept-Encoding:
From: bingbot(at)microsoft.com
Host: www.reg1.site.ru
User-Agent: Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)

2. Без ошибок:

--- 2013-10-08 14:48:56
Cache-Control: no-cache
Connection: Keep-Alive
Pragma: no-cache
Accept: */*
Accept-Encoding: gzip, deflate
From: bingbot(at)microsoft.com
Host: www.reg1.site.ru
User-Agent: Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)

Как видно - ошибочно разбирается запрос с пустым значением Accept-Encoding. Сходу не скажете - встречаться доводилось?

---------- Добавлено 08.10.2013 в 15:38 ----------

ivan-lev:
Пишите в лог (перед 404/301) var_dump($_SERVER); var_dump($_GET); для "непонятных" ситуаций. Посмотрим, что там.
С поддоменами www.reg3 и www.reg4 такая же ситуация? Вроде они получали 404.. а с reg1 всё работало?
p.s. ИМХО, уместно использовать ServerAlias

ivan-lev, такая ситуация со всеми существующими поддоменами reg1, reg2, ... regN

В

ыше написал о Accept-Encoding.

ivan-lev:
А можно эту секцию увидеть?
В смысле, поддомен www для поддомена reg1 точно прописан?
Если ручками зайти на www.reg1 - что выведет? А то в примерах Ваших поддомен третьего уровня, а у bing-а - четвёртого..

Вот кусок:

<VirtualHost reg1.site.ru>
ServerAdmin admin@site.ru
DocumentRoot c:/www/allregion
ServerName reg1.site.ru
ErrorLog logs/localhost_error.log
CustomLog logs/localhost_access.log combined
ErrorDocument 404 /404.php
</VirtualHost>
<VirtualHost www.reg1.site.ru>
ServerAdmin admin@site.ru
DocumentRoot c:/www/allregion
ServerName www.reg1.site.ru
ErrorLog logs/localhost_error.log
CustomLog logs/localhost_access.log combined
ErrorDocument 404 /404.php
</VirtualHost>

В логах localhost_access.log вижу как удачные заходы на страницы reg1 (код 200), так и "неудачные" (код 404 или свеже прописанный код 301) от одного и того же бота BingBot

Понятно, что вопрос в неправильной реакции Апача - вопрос в том, где именно сбоит...

Раньше грешил на то, что BingBot пробивает сервер "корявыми" заголовками намеренно - сейчас думаю, что это вряд ли, т.к. ошибки зафиксированы в вебмастере бинга...

ivan-lev:
Не увидел REQUEST_URI .. К чему запрос происходит?
p.s. А зачем в конце делать редирект на index.php вместо внутреннего реврайта и возврата 404 после обработки, если страницы не существует?

ivan-lev, попробую кратко сформулировать суть вопроса без предыдущего обсуждения

BingBot периодически "направляется" Апачем в дефолтную директорию. При этом для страницы, которую он запрашивает, существует и поддомен и сама страница. Более того, в большинстве случаев тот же BingBot получает запрашиваемые страницы.

Ситуация ровно та же, что и описана постом выше. Сейчас с регулярностью страничка в полчаса BingBot получает 301 редирект. На выходных специально зарегился в Webmaster Bing. По их статистике - соответственно появились записи с 301 (раньше они кучковались в 404 ошибке).

izbushka, Sanches27, уважаемые, приведенная информация хоть на что-то наталкивает?

Всего: 156