Ну вот, дубли атакуют...
Это еще почему?
Ну, не мне вам рассказывать, что "http://"="//", да и шифрование никто не отменял...
Короче, в аську :) Поговорить нам точно есть о чем ;)
Ну, вобщем-то рефспам никогда к хсс отношения не имел, это точно.
Вот только была одна версия вебалайзера, в которой хсс таки было ;)
Мне только один достойный придумался: не учитывать(не передавать нифига) со страниц сайта, на которые нет ни одной внутренней ссылки (с этого же сайта).
Всякие "а давайте шифровать в UTF-8" и подобное автоматом отсеется.
Спалите в личку остальные 4, до которых я не додумался. 🍻
Точно! И я где-то такое видел ;)
Вы бы поточнее указали, что у вас на входе есть и что получить надо.
Может вам и WPT подойдет...
🍻
Очень интересно было бы на исходники поглядеть, так как балуюсь подобным ;)
"По моему разумению" - а немного подробнее можно узнать? Какие части речи отсекаются и т.д.
Как считается вероятность смысловой связи между словами?
Потому как результаты выдает отличные для словосочетаний.
И сейчас результаты приятно удивляют :)
Именно. И баловатся эвристиками для отбрасывания "незначимого" текста на странице намного сложнее, чем сравнить "на просвет" десяток страниц с сайта...
Респект. 🍻
Хм. У меня с морфи никаких проблем не возникает :)
Повесить на поддомене Яндекса (или кого другого, потрастовее) все эти страницы :)
Думается, он имеет ввиду "внутреннюю" ссылку вида go.php?id=akjdhaksjdhaksjdh, которая 301 редиректом куда-то ;) идет.
Только она ИМХО все-равно внешней посчитается.
Поддержу товарищей - старт завышен. УРЛ в личку, плиз.