Вывод получился верный, хотя ошиблись везде. :)
1. Ni никогда не присутствовало в вычислении IDF, вычисления ведутся по коллекции документов, а не по всей базе.
2. База Райцина парсилась давно, когда это было возможно, IDF тогда был не логарифмом.
3. К базе Яндекса с того времени приклеилось немеряно англоязычных доков.
Сейчас IDF - логарифм, почти наверняка. Это показывают мои исследования. База Райцина устарела, тогда например стоп-слова вообще не учитывались, а сейчас это не так. Т.е. для получения нормальной базы IDF нужно делать свою коллекцию или брать чью-то готовую, например в ромипе.
ЯПБ тоже наверное перешел на логарифмы, т.к. закрыли выдачу IDF. :(
ЗЫ. Я пока пользуюсь базой Михаила, других нет.
Ну сделайте свою формулу релевантности, впихнув туда все те данные, что вы накопали. Какая проблема? Эта формула будет как-то ранжировать сайты. А то, что ваша выдача не совпадет ни с какими поисковиками, дык и ладно. :D
Забейте на такие исследования, а то отжиг получается. Заодно и время сэкономите.
Я не думаю, а знаю, что термин "хороший оптимизатор" не зависит от методов наращивания внешнего ссылочного. :)
С чего вы взяли, что меня что-то пугает? :D
Скорее всего система фильтров у Анмедии покруче будет. Но, независимо от того, записались вы в Сеопульт или нет, если вы продвигаете проект закупкой на биржах и вышли в ТОП-10, то продвинутый заказчик спокойно может зарегистрироваться в сервисе и пропалить вашу себестоимость от и до. :D
Олег Тёплый, не совсем понятно - траф у Вас уже есть, но он не дает конверсии, или все же трафа нет?
Если проверять еще на склейку по info:url, то выход примерно 10%, а не 20. Потому что в Гугле идут постоянные доапы и Сапа не успевает, или не хочет проверять. Для ручной закупки это наверное еще терпимо, с использованием своих скриптов, но при авто - процесс тормозится неподеццки, да.
wolf, а вас это радует чтоле? Ваш комплексный интернет-маркетинг больше не зависит от внешнего ссылочного, или ваши доноры навечно попали в список Яндекс-супер-траст? ;)
Так было и вот так стало. Разница - наверное лет пять...:D
Отмыв - это превращение грязных денег (черного нала) в чистые, обложенные налогами и бумагами. В данном случае например так: в магазине торгует ООО без прибыли, поставщики обуви - ИП, близкие к хозяину схемы. Обувь продаем сами себе, занося в кассу грязные деньги, получаем в итоге чистые за минусом аренды и других расходов на магазин и за минусом налогов на ИП(например 6%). В итоге можно без проблем намывать несколько МИО уе в год, но схема глупая. Нормальных схем через магазин сейчас нет. :)
Если отмыв имеется ввиду по нашим местечковым понятиям, т.е. выход в черный нал из белых денег, то тоже только дебильные схемы можно придумать. Например - в этом магазе централизованно закупает обувь крупная бизнес или гос-структура, наценка 1000%, а для ее оправдания нужны золотые перила. Схема тупая, а нормальных схем нет. :)
Нормальный вариант - это обычный дорогой бутик, который может быть и достаточно прибыльным и слегка убыточным, как подарок или игрушка для жены/любовницы/бойфренда. :)
Конкретно мне - пофигу. Т.к. на все сторонние продвигаемые сайты я даю партнерам гостевой доступ в Сапу. :D
Я в общем-то считаю, что все это определение стоимости - полная фигня, не будет там адеквата. Лучше бы выдавали стоимость всех купленных на биржах ссылок на чужие сайты, еще лучше - сразу с урлами и анкорами. :)
Главное достоинство Сеопульта - автоматизация быстрой массовой закупки. Если заработает - будет гуд. А то в последние недели затрахали не проиндексированные страницы, по фильтрам их до 90% приходит, это уже ни в какие ворота не лезет...