А потом хакером прослывет)
В гугле оно лучше работает. ИМХО, там нужно вхождение точных фраз (с учетом языка). В Я-се не так обязательно наличие большого числа точных вхождение всей фразы целиком (вхождений по словам бывает достаточно, если конкуренция не высокая).
Разделяйте вхождение фраз, отдельных слов из них. И в каком типе контента они находятся.
Скорее это. Но оно работает плохо, если сам сайт "плохой" (дорвеи, сайт- псевдомагазин без коммерческих факторов.). "Хорошие" сайты в Я-се могут вполне быть в ТОП-е без вхождения отдельных слов (не говоря о точном вхождении фразы), даже если есть "плохие" сайты с текстами с точными вхождениями.
Посмотрите ТОП ;) И не будет казаться.
Ну и в целом не то что отменили TF-IDF, скорее стали по другому учитывать+ появились другие факторы.
Довольно большие. По % отдельных слов в зависимости от контента (это важно, контент- не только статья) до 15% (максимальное вхождение слова из поискового запроса) доходило.
БМ25 был более или менее актуален наверное лет 10 назад. По некоммерческой выдаче были небольшие корреляции.
В целом в Гугле тупой подсчет вхождений работает лучше, чем в Я-се.
Что значит мусорные?
Если мало по ним показов- то и шут с ним. Если про несоответствии нормам написания, то это не мусор. Почитайте:
http://romip.ru/romip2006/03_yandex.pdf
Алгоритм текстового ранжирования Яндекса на РОМИП-2006
http://www.altertrader.com/publications21.html
Моделирование алгоритма текстового ранжирования Яндекса при помощи MatrixNet.
Но это тоже древнее)
Это примерная стоимость получаса работы сотрудника (и то на самом деле не очень большая) для юрика ( с учетом всех расходов, включая налоги, рекламу, аренду и прочее).
Монетке с кодами выпускались.)
А так какой только чеканки/литья монет не существуют. 25 рублевки олимпийские вон отливать начали...
Ну как спекуляции?
Многие уже зафиксировались (хотя-бы частично)?
Тоже самое и с "уником".
Страница с копипастом из разных источников представляет собой уникальную подачу информации.
Можно и легально копировать. Не весь текст является "авторским".
О, в свободном доступе есть?
Ну стремление к перфекционизму. Это как грамматические ошибки и разное форматирование текста в коммерческом предложении.
Оценивать потенциальное поведение аудитории через себя довольно.. специфично.
Некоторые на серче воротят нос от Пятерочки какой-нибудь. Но это не значит, что этот магазин закроется. Просто аудитории разные.
Это заработок на биткойнах.