да, уровни страниц действительно сложно определить на глаз - все кажимые, т.е. формальные характеристики это такая ярунда по сравнению с тем что находиться в индексе поисковика - все девять страниц действительно могут различаться.
но, ссылки, с ними всё по-другому, их много. к примеру, когда проводят социальные и стат опросы не опрашивают же всё население страны конкретных категорий граждан, то проводят только опрос из крошечной доли граждан, а экстраполируют на всё население принадлежащей данной категории граждан (конечно, сообщая чему же равна доля стат. погрешности - при правильном подходе).
точно так же мы с сылками поступаем - срез страниц с пр=1, сайтов с тиц=10..50, не состоящих в яке, зарегиных в дмозе, с 6 внешними ссылками на странице - все эти страницы обладают некой трастовостью (или возможность создать добавочную релевантность у акцептора, грубо говоря все эти страницы обладают одинаковой силой).... мы выбираем только сотню из всей этой массы следовательно мы ожидаем, что в массе своей они стремятся к мат.ожиданию силы из всей возможной массы страниц этой категории. это статистика - мы нивелировали уникальные различия тем, что взяли сотню, да если бы мы взяли по одной ссылке - это была бы профанация, одна страница - донор не есть представитель всей категории, а сотня это еще какой представитель!
гы. прикольно - репу опустили
pavelp добавил 21.03.2009 в 05:39
против хищьных авторитетов не пойдёш... если сам не хищьник
топикстартер так держать! не слушайте про чистоту эксперимента. как я понял у вас 3 фразы и 3 сайта соответственно, следовательно если все три дали одинаковый результат можно говорить об том, что выводы истины или вероятность их истинности более 80 процентов. если бы вы на одном сайте проделали такое и выложили, то это было бы крайне смешно - одно измерение не делает эксперимент.
в данном эксперименте не делается попытка измерить действие одной ссылки - но делается возможномть измерить действие 60 ссылок (100 при 60% проиндексированных) мы исходим из того что в этих 60 есть ссылки "хорошие" есть ссылки "плохие", и их соотношение примерно одинаково для этих 9 наборов
далее по самим страницам - предполагается что это страницы равноудаленные от главной. ибо поисковик предпочтет главную (даже если на главная будет НПС), и мы исходим из того, что более связанные с главной будут более предпочтительны, чем менее связанные с главной.
чистота эксперимента гарантирована прежде всего множественнстью измерений (или измерением над множеством обьектов)
пс. да простит же меня сео-комьюнити в универе не был специальных предметов по теме "проведение экспериментов, обеспечение чистоты экспериментов", но я не вижу внешнего неучтенного влияния которое бы не устранил экспериментатор. если бы один из сайтов повел по-другому нежели остальные 2, то можно сказать либо внешнее неучтенное влияние повлияло на 2 остальных сайта, либо 2 не тронуло, а затронуло только один - отличающийся.
интересно почему в тестовом наборе некоторые строки начинаются с "-1" они должны просто состоять из пар признак:значение... а на камент после знака # можно не обращаить внимания это чисто идентификатор запроса, чисто справочное значение
что то в нетпромотером сложно как то - ассоциации (из "машины" выудить "авто", "автомобили", "тачки") и операции расширения по маске (из "машины" выудить "новые машины", "машины бу")
нужна прога которая позволяет постоянно углубляться - в список слов:
задаем начальные слова. прога для каждого выбирает ассоциации. человек фильтрует, далее операции расширения по маске... легче самому написать вобщем нежели искать и описывать
хотелось бы как нибуть автоматизировать этот процесс потому как про wordstat.yandex и статистику рамблера наслышан,
очень не плохая прога site-auditor, а есть ли ей аналоги в этом нелегком труде?
у михалкова морда хитрая и наглая - то что происходит по ящику - цирк. лучше читать книги, а не смотреть говноящик
(сори не читал ветку)
на какой рост тиц можно расчитывать сейчас, понимаю что это нельзя гарантировать, но всё же
зарегился на е-маил pavelpg@gmail.com
обучение яндекса на основе пользовательских запросов понимать что хочет пользователя.
бюджет 3000 р. максимум, сроки сам понимаю Ап тиц бывает довольно редко, не каждый месяц.