Ну да, Ваш подход известен, может и нужно исключать из списка лежачих. Хотя может и не все так просто, Вас же еще не напрягал Сеопульт... ;)
Это пока не очевидно. Если ранжирование будет учитывать семантический анализ текста, то оптимизаторам придется с этим считаться. :)
Подозрений в среднем не вызывают, да. Для фильтрации копирайтного сео-текста семантический анализ не нужен. Достаточно оценивать веса группы самых частотных слов документа. :)
Это фантастика. :)
Никто Ингейту не будет сливать свою базу свободных страниц. А если по каждому полученному от биржи донору запрашивать свободные места на этом доноре у других бирж, то все биржи лягут навсегда. :)
Не могло такого быть в Реакторе, разве что при одновременном получении от разных бирж для одного акцептора урлов с того же донора по разной цене выбиралась минимальная.
Идея правильная, вопрос в реинжиниринге текущих алгоритмов разработчиками Рук.
Там очень приличная разработка, с большим вложением интеллекта и огромным трудом. Потому что не все можно автоматизировать при создании таких систем. Чем грозит оптимизаторам - не понятно пока. Применения могут быть и в авторстве (начнутся с Яндекс.Новостей) и в предварительной обработке текстов (для поиска более релевантных), и в ранжировании. Смогут ли применить такие технологии в поиске автора среди дубликатов по всему индексу - скорее всего нет, в общем случае не выйдет (имхо), да и по ресурсам пока трудно просчитать, во что такая задача выливается.
Я думаю, что ГС со временем и без таких ухищрений станут четко определять. :)
Что Вы имеете ввиду под "стоп словом"? Веса типа IDF или ICF у дефиса нет. Но выдача с дефисом будет отличаться, сравните "шкаф купе", "шкаф-купе" и "шкаф - купе". По этим запросам поиск скорее всего отдает ранжированию один и тот же набор страниц, но ранжирование разное, оно зависит от прямых вхождений в текст документа и в анкор-файл.
Как вариант - у Яндекса есть словарь для транслитов. Собаку в этот словарь забыли пригласить. :)
Исследователям выделенных слов в сниппетах я хотел бы заметить, что алгоритм аннотирования не особо завязан с алгоритмами поиска и ранжирования найденного. Т.е. тот факт, что что-то там выделили в сниппете, не говорит о том, что при ранжировании выделяется так же.
intraweb, извините, но дискутировать о потоковом продвижении нулевок в топ желания нет. :)
Т.е. вы сделаете еще один многостраничный ГС и считаете, что он должен попасть в топ? Я тут солидарен с Платоном - делайте интересные для людей сайты и будет вам щастя. :D
Два раза продлевал маленькую кучку давно купленного. Каждый раз искал, как это сделать, минут 10-15. Или интерфейс неудачный, или я такой тормознутый. :)
С 2003 до 2009 доходили руки да сайта. К 2017-му дойдут руки, чтобы на этом сайте прописать тайтлы, да?
Не, Леха, ты не понимаешь в исследованиях вордстата... :D
Московский клиент по металлическим дверям вводит для начала "двери стальные портье" и "металлическая дверь пермь". И если в обоих выдачах ты в топе, то респект, уважуха и конверсия 100%.
То, что по LI эти запросы пустые - дык это временно... :D