богоносец

богоносец
Рейтинг
779
Регистрация
30.01.2007

И помните, что всё закрытое в роботсе, может успешно искаться, если кто-то вдруг поставит ссылку. Не нравится, не отвечайте 200

Cell:
Какие, на ваш взгляд?

Те, по которым написано про регистрозависимость всего, что после Disallow: /

а то была уже тема Яндекс нашел MegaIndex.

XPraptor:
но стыдно было

Нет ли таблеток от совести?

Zlodey-:
Не стоит думать то что ПС,такие тупы и генеренку не распознать не могут.

Распознать могут не генерёнку, а её признаки.

Да и то, использовать это могут не само по себе, а в совокупности с чем-то другим:

покойничек:
могут сыграть роль ссылки, которые на нем стоят, ссылки, которые на него ведут, дублированность контента, признаки сгенерированности текста, его неестественность – у нас много критериев. Мы считаем определенную сумму баллов, и когда сумма баллов превышает некий порог, мы сайт выбрасываем

А на прямое применение очень умных олгоритмов на мильярдах документов... может не хватать железа.

sidorka:
На этом генераторе по другой тематике третий месяц в яшке сидят и не жужжат. Но там текста около 30 метров на входе было. На смешариках только 500к смог найти.

При каком объёме “обучающего” текста (1M или 2 абзаца) в генерёнке выше вероятность появления несуществующих в нормальном языке наборов слов? (во фразе/предложении/тексте)

Тема не о языке запросов.



Только не надо дежурных песен про персонализацию, и якобы кликнутые сцылки. Этому скрину уже месяца 3 http://roem.ru/2013/09/16/addednews80677/

http://yandex.ru/yandsearch?text=%D1%81%D0%B0%D0%B4%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B9+%D1%80%D0%B2%D1%91%D1%82+%D0%B6%D0%BE%D0%BF%D1%83+%D1%81+%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%82%D0%BE%D1%80%D0%B0%D0%BC%D0%B8

На эту тему над яндексоидами проводился эксперимент...

А в какой реальности автор изречения:

Стимулирование пользователя к активным действиям – клики, движения мышью, заполнение веб-форм и т.д. На мой взгляд, на данный момент для коммерческих сайтов это самое перспективное направление работы с внутрисайтовыми поведенческими факторами. Здесь полезен любой интерактивный функционал, который можно применить к тематике конкретного сайта – поиск, различные режимы сортировки, калькуляторы, онлайн-консультации и т.п.

Кто готов вести серьезную работу с сайтами в этом направлении, тот и будет в ближайшей перспективе определять лицо поисковой выдачи по коммерческим запросам.
с учётом того, на что стучать бес/полезно.

ps Вопрос был проще: Что же такое «реальность» (в которой т.н. «все» {доносчики|стукачи|мрази})? Ну и как/кем она формируется? И зачем?

А что такое «все»?

И что такое «реальность»?

Вот Cell верует, что яндексоиды набожные...

Они как, в другой реальности?

Для ПС это разные урлы.

amica:
Считаются ли дублями страницы со слеш и без слеш вконце?

Создатели ПС вам не скажут реальных признаков, по которым они фильтруют дубли. Иногда они этого не умеют

http://yandex.ru/yandsearch?text=url:www.yandex.ru/m

или не умеют правильно

https://www.google.ru/search?q=site%3Awww.yandex.ru%2Fm

Вот и попробуйте догадаться про методы.

И ещё заранее угадайте — какую страницу они выкинут.

Дубли — это по одинаковому контенту, а не по урлу | урлу/

Можно сделать экзотичнее... но с разным контентом.

J No:
[Делайте сайт для людей и рвитесь в топ. Не можете?

А если в 70 раз быстрее/выгоднее нагенерить уника... который не редко оказывается в ТОП20 по НК и даже выше? А идейности, как у пользователя Cell, на всех не хватает...

А по теме: у Яндекса нет каких-то денежных стимулов... вот он ничего и не делает.

Эта тема не про АГС.

(к сведению бесплатным защитникам святаго Яндекса)

Cell:
Чисто не там, где убирают, а там, где не мусорят?

Грязно там, где срать выгоднее. Ибо Яндекс...

( это ответ, если чего: )

Просто в большинстве случаев Яндекс хочет, чтобы ему просто не мешали загребать бабло, этим циникам откровенно насрать на последствия в окружающей среде.

- мы (Яндекс) - циники (это буквальная цитата);
- формально лицензия есть - нам достаточно;
- решим ваши вопросы, а потом клиенты "Директа" начнут "стучать" друг на друга, а "стучать" нехорошо.
- мы что должны нанять 1000 сотрудников чтобы обрабатывать заявки "стукачей"?

интересы описаны последней фразой.

А чтобы отмазать засравшийся имидж... иногда пиарит свои недотехнологии. Тупой пиар просто выгоднее... а реальных технологий (на данной стадии недоразвитости человечества) и быть-то не может (ну или вложения в них не окупятся никогда).

Поэтому... предсказуемы/наблюдаемы печальные последствия наличия ПС/СКР.

awasome:
Сомневаюсь, что у я. хватит человекоресурсов даже на 10% выдачи

Несколько лет назад озвучивалось что-то типа 100К оцененных запросов (это за всё время работы асессоров), это малая часть того количества, которое обрабатывается за день.

Re@L:
[однозначно и с полной уверенностью вам могу сказать, что нередко они смотрят именно старую версию сайта

Да они вообще редко чего-то смотрят перед ответом.

Пример переписки с ботом /ru/forum/comment/8000024 (по нейтральной теме). В первом письме не было даже урла, а ссылки на поиск — только в Гугле.

Вот так плохо написан Бот Щукин... что уж говорить обо всём остальном и АГС в т.ч.

Всего: 13684