богоносец

богоносец
Рейтинг
775
Регистрация
30.01.2007
Plazik:
Почему бы ему не индексировать эту страницу?

Она не для браузеров. В XML нельзя делать так, как на морде Яндекса, например. ПС по умолчанию много что считают за HTML 4 ... и его многие теги им просто не нужны. Какой HTML5? А в Я.ТП про индексацию XML — врут как маленькие дети, но упорно, как велит инструкция.

Вопрос надо ставить шире: Выйдут ли ПС за рамки прошлого века?.. это может повысить себестоимость индексации... почему так долго и JS не разбирали.

babilonking:
А инфа полезная

Там он только мнемоники в примерах позабывал, правильные в могильничке. И совсем разжёванные примеры в индексе.

Plazik:
Поддержка новых тегов

HTML5 не существует. Он находится в стадии разработки!

Plazik:
понимать разницу между <header> и <footer>

Вы требуете от них таких тонкостей, а они не понимают разницы между XML и HTML // всемогущий Гугл индексит то, что браузер отказывается показывать.

ЗахарOFF:
в Яндексе появляются в индексе по две страницы обычная и с таким хвостиком

А можно пример такого?

Ogneyar:
я-то наивно думал, что поисковики порнуху в выдачу не пропускают

Говорят... что стараются так делать — по приличным запросам:

Примечание Ильи Сегаловича: Отдельно хочу отметить, что, когда мы строим выдачу и анализируем запрос (и найденные документы ответа и историю поискового поведения по данному запросу), мы решаем попутно задачу повышения качества ответа в целом, качества представления всей страницы.

В частности, в нашей системе оценок есть оценка «явная глупость» - когда ответ не просто нерелевантен, он вызывает у пользователя отторжение и удивление по поводу работы поисковой системы.

Такие оценки получают ссылки, содержащие неудачное синонимическое расширение слова запроса или какую-нибудь морфологическую форму, которая несет совершенно другой смысл, чем слово в запросе, иными словами, эту оценку получает текст, диаметрально иного смысла, чем смысл заданного запроса.

Ровно в этих рамках (борьба с «глупостью») мы относительно недавно реализовали алгоритм определения запросов и ответов, которые можно трактовать двояко: и как поиск эротического и порнографического содержания, и как невинный информационный запрос. Например, запрос [девочки] может быть поиском повести Людмилы Улицкой, а вовсе не «девочек по вызову». Для человека, ищущего Улицкую, ответ с порнографией не просто нерелевантен, он «явная глупость».

Опираясь на классификаторы запросов и сайтов по порнографическому и непорнографическому содержанию, и построив соответствующие метрики, отражающие долю резко нерелевантного поведения нашей системы по «двояким» запросам, мы смогли реализовать механизм понижения в выдаче сайтов порнографического содержания.

При этом, важно заметить, что никакой модификации не подвергается ответ на запрос, у которого по нашему мнению (выраженному в алгоритмической оценке поисковой системы) нет иной интерпретации, кроме порнографии.

Жадные ПС не хотя терять траф...

... если в запросе есть нечто, включающее классификатор порнуха... не надейтесь, что есть классификатор развлекуха, погуглите лучше.

Ну это повторяющийся блок текста (хотя так тоже делать не хорошо)... на страницах, которые отличаются. И не во фрейме.

6666:
получаются двойные стандарты

Почему этого вопроса не было в списке?

sabotage:
Продажные ссылки - нарушение лицензии в части спама.

А их давний учёт, ставший причиной сапостроя — это не нарушение.

Flobus:
302

Вот 302 в выдаче.

В хелпе это описано.

Ну мало ли... чего им там в голову взбредёт, а спрятать — не запрещено.

sigri:
заметил одну, смущающую меня, деталь

Значит этих деталей там столько... что ПС достанутся дубли. А */товар1 ... может отфильроваться.

ps Кто сможет показать дубли на сайте самого битрикса?.. минут за 5 не нашёл.

belyi05:
ну почему опять столько порно в выдаче? кто ее туда засовывает по таким запросам-то?

садовский рвёт жопу с классификаторами

Есть некоторые словосочетания, при наличии которых в запросе — Яндекс на 100% уверен, что надо ограничить поиск порнухой.

Всего: 13653