Хм. А как быть с теми сайтами, у которых тематика немного "размыта"?
Да и грубо говоря берем любой сайт в качестве примера (беру свой СДЛ) - есть раздел "Психология", есть раздел "Здоровье детей", есть раздел "Отдыхаем в выходной". Тематика каждого из разделов "немного" отличается, ИМХО. И насколько тематичным будет считатся сайт например магазина детских товаров? Почему?
А почему именно первая ссылка? А если она "мигнула"?
По-хорошему, надо брать сайт, размещать на него 1000 ссылок по 2-3 на каждый сайт (морда, 2-3ув, просто "хорошая" страница) и потом снимать периодически один "тип" ссылок и смотреть на результат. Вот только параметры доноров еще меняются со временем, и результат может очень сильно зависеть от этого. Так что надо брать 1000 сайтов :)
Ну, знаете... Уж что-что, а "морда" зачастую это просто "Новые поступления:....".
Посмотрел. Свойства коэф. b - не согласен. Свойства коэф. s - тут я так понимаю вобще не важно, сколько у меня страниц на сайте 😮 - что с одной 200 ссылок, что с 200к - всего 200 ссылок, а "s(200) = 0.9 (если с сайта - донора двести ссылок, то s=0.9)"?
Ну, и как вы прокоментируете в рамках своей теории несколько моих сайтов, которые за этот ап получили от 100 ТИЦ? Никаких дырок Яндекса, ковровых бомбардировок и прочего не использовалось. 90% доноров - 0 ТИЦ, куча внешних. Это не "тема" matr, о которой он писал (за его сайтом наблюдаю не первый месяц, кстати ;) ).
[ЧЕРНЫЙ, ГРЯЗНЫЙ, НЕЧИСТЫЙ, ЧЕРНОМАЗЫЙ, ТЕМНЫЙ, ЧУМАЗЫЙ] [ТУШЬ, ТУШИТЬ, ТУШ, ТУША, ТРУП, ЧЕРНИЛО]. ОНИ [БЫЛЬ, БЫТЬ] [КРУГОМ, КРУГ, ВОКРУГ, ВЕЗДЕ, ПОВСЮДУ]...
[ЧЕРНЫЙ, ГРЯЗНЫЙ, НЕЧИСТЫЙ, ЧЕРНОМАЗЫЙ, ТЕМНЫЙ, ЧУМАЗЫЙ] [ТУШЬ, ТУШИТЬ, ТУШ, ТУША, ТРУП, ЧЕРНИЛО]. ЭТО [ПРОГАР, ПРОВАЛ]...
Ну, в этой части несомненно похожи :)
Но если еще учитывать длинну всего текста (что вобщем-то правильно), то вот чем дальше, тем меньше совпадений.
Да уж. Что думаете про использование статистики встречаемости "рядом" слов для отсеивания "неподходящих по смыслу" синонимов?
Да, доски не рулят. :) Посмотрим, что по этому поводу думают тезаурусы.
Именно это и подразумевалось :)
С++ - не самый быстрый язык "by default". Просто есть очень хорошие и умные компиляторы у него, с заточкой под конкретное железо. Один Интеловский чего стоит. И точно так же у хаскела очень продвинутый компилятор - иногда такое получается в асме - диву даешся.
Вобщем-то, я категорически за то, чтобы человек занимался реализацией основной задачи при написании кода, а не делал разные "хаки" - ага, тут можно один такт сэкономить, тут килобайт памяти пожалеем... Компиляторы давно делают то, что большинству разработчиков и не снилось. Есть конечно гуру, которые на асме пишут не хуже, чем компилятор - вот только времени на это тратят "немного" (подумаешь, на порядки!) больше.
К тому, что проблем вида
Лучше всего - пример предложения(ий), где подобное может случится.
А что с досками не так? 😕
Думаете, стоит списаться с Яндексом и попросить результаты их трудов? "Так мол и так, возможности посадить 100 низкооплачиваемых рабочих для уточнения контекстно-смыслового значения слов (омонимов) в тексте сейчас нет, поделитесь результатами, плиз"? :)
sokol_jack добавил 28.01.2009 в 11:08
Ну, вот для выдачи тематичность не уверен что влияет сильно... Скорее просто текстовая составляющая страницы-акцептора, "вес" страницы-донора + коэф. "хорошести" донора и акцептора. Хотя возможно, эта "хорошесть" и зависит от совпадения тематики. Вобщем, все сложно опять :)
А насчет одинакового анкор-листа - да, часть экспериментальных сайтов точно будет с одинаковым.
Однако есть еще всякие Haskell ;)
pseudo_root: БЕР base form = БЕРЕЧЬ
pseudo_root: ЛЮБОВ ЛЮБ base form = ЛЮБОВЬ
pseudo_root: ЛЮБ base form = ЛЮБОВЬ
pseudo_root: ЦЕРК base form = ЦЕРКОВЬ
pseudo_root: base form = РЕБЕНОК
pseudo_root: КАМ base form = КАМЕНЬ
pseudo_root: СВИН base form = СВИНЕЦ
pseudo_root: ГОРОШ base form = ГОРОШЕК
pseudo_root: ПЕТУШ base form = ПЕТУШОК
pseudo_root: КОГ base form = КОГОТЬ
pseudo_root: КОГ base form = КОГОТЬ, КОГТИТЬ
pseudo_root: ОГ base form = ОГОНЬ
pseudo_root: ПА base form = ПАЕК, ПАЙКА
pseudo_root: БУ base form = БУЕК
pseudo_root: СЛАСТ СЛА base form = СЛАСТЬ, СЛАСТИТЬ
pseudo_root: СЛАСТ base form = СЛАСТЬ
pseudo_root: БУС base form = БУСЫ
pseudo_root: БАГ base form = БАГОР
pseudo_root: ЗЕМ base form = ЗЕМЛЯ
pseudo_root: АРМИ base form = АРМИЯ
pseudo_root: СПАЛ base form = СПАЛЬНЯ
pseudo_root: СПАЛ base form = СПАЛЬНЫЙ, СПАЛЬНЯ, СПАЛИТЬ
pseudo_root: БЕГЛЕЦ base form = БЕГЛЕЦ
pseudo_root: В base form = ВОШЬ
all forms = ВОШЬ, ВШИ, ВОШЬЮ, ВШЕЙ, ВШАМ, ВШАМИ, ВШАХ
pseudo_root: ТУШ base form = ТУШЬ, ТУШИТЬ, ТУШ, ТУША
all forms = ТУШЬ, ТУШИ, ТУШЬЮ, ТУШЕЙ, ТУШАМ, ТУШАМИ, ТУШАХ, ТУШИТЬ, ТУШУ, ТУШИМ, ТУШИШЬ, ТУШИТЕ, ТУШИТ, ТУШАТ, ТУШИЛ, ТУШИЛА, ТУШИЛО, ТУШИЛИ, ТУША, ТУШИВ, ТУШИВШИ, ТУШАЩИЙ, ТУШАЩЕГО, ТУШАЩЕМУ, ТУШАЩИМ, ТУШАЩЕМ, ТУШАЩАЯ, ТУШАЩЕЙ, ТУШАЩУЮ, ТУШАЩЕЮ, ТУШАЩЕЕ, ТУШАЩИЕ, ТУШАЩИХ, ТУШАЩИМИ, ТУШИВШИЙ, ТУШИВШЕГО, ТУШИВШЕМУ, ТУШИВШИМ, ТУШИВШЕМ, ТУШИВШАЯ, ТУШИВШЕЙ, ТУШИВШУЮ, ТУШИВШЕЮ, ТУШИВШЕЕ, ТУШИВШИЕ, ТУШИВШИХ, ТУШИВШИМИ, ТУШИМЫЙ, ТУШИМОГО, ТУШИМОМУ, ТУШИМЫМ, ТУШИМОМ, ТУШИМАЯ, ТУШИМОЙ, ТУШИМУЮ, ТУШИМОЮ, ТУШИМА, ТУШИМОЕ, ТУШИМО, ТУШИМЫЕ, ТУШИМЫХ, ТУШИМЫМИ, ТУШИМЫ, ТУШЕННЫЙ, ТУШЕННОГО, ТУШЕННОМУ, ТУШЕННЫМ, ТУШЕННОМ, ТУШЕН, ТУШЕННАЯ, ТУШЕННОЙ, ТУШЕННУЮ, ТУШЕННОЮ, ТУШЕНА, ТУШЕННОЕ, ТУШЕНО, ТУШЕННЫЕ, ТУШЕННЫХ, ТУШЕННЫМИ, ТУШЕНЫ, ТУШ, ТУШЕМ, ТУШЕ, ТУШЕЮ
pseudo_root: ДЕ Д base form = ДЕТЬ, ДЕНЬ
all forms = ДЕТЬ, ДЕЛ, ДЕЛА, ДЕЛО, ДЕЛИ, ДЕНУ, ДЕНЕМ, ДЕНЕШЬ, ДЕНЕТЕ, ДЕНЕТ, ДЕНУТ, ДЕВ, ДЕВШИ, ДЕНЕМТЕ, ДЕНЬ, ДЕНЬТЕ, ДЕВШИЙ, ДЕВШЕГО, ДЕВШЕМУ, ДЕВШИМ, ДЕВШЕМ, ДЕВШАЯ, ДЕВШЕЙ, ДЕВШУЮ, ДЕВШЕЮ, ДЕВШЕЕ, ДЕВШИЕ, ДЕВШИХ, ДЕВШИМИ, ДЕТЫЙ, ДЕТОГО, ДЕТОМУ, ДЕТЫМ, ДЕТОМ, ДЕТ, ДЕТАЯ, ДЕТОЙ, ДЕТУЮ, ДЕТОЮ, ДЕТА, ДЕТОЕ, ДЕТО, ДЕТЫЕ, ДЕТЫХ, ДЕТЫМИ, ДЕТЫ, ДНЯ, ДНЮ, ДНЕМ, ДНЕ, ДНИ, ДНЕЙ, ДНЯМ, ДНЯМИ, ДНЯХ
С чего вдруг? 🚬
Ну вот. Я теперь не усну от мысли, что человек не уснет от мыслей о домене...
Сбросить что-ли ему в личку? А вдруг обидится - мол "нужен мне этот домен с ТИЦ 10 как зайцу стоп-сигнал! Издеваешься, да?! ТИЦ 100 зажал?!" 😕 ;)
Придумал! Сброшу ему занятый, забаненый домен с тиц 0! 😂
😂
Вот так человек не захотел себе свободный домен с ТИЦ 10 в индексе Яшки.
Мне бы его силу воли 😂
Я же писал вот тут - /ru/forum/comment/4268001
Это мы еще посмотрим ;)
Ага, но от публичных извинений и домена вы не отказываетесь? ;)