minaton, каким же образом. С лету, кроме как делать экпериментальные странички, ничего в голову не приходит. Но этот путь весьма не быстрый. И кажется мне, что если толком поставить ентот эксперимент под эту, с первого взгляда, простую задачу, то и набредешь на алкоритм самого яндекса...чую.
Большое спасибо всем за обсуждение.
bondarev.pp.ru, почитай про матричную модель. Думаю все алгоритмы с нее пляшут.
Склоняюсь к этому мнению.
Но вот по поводу <br> - сомнение.
Ну, мужики, вы даете. На Этоv и основан алгоритм анализа текста. По этому и вопрос такой - что считает предложением поисковик? Или только точка принимается за конец предложения или еще и тэги разметки?
Вопрос именно в том, что считают поисковики за предложение? Т.е. за единицу текста?
Параграф может не заканчиваться точкой, в тексте может не быть ни одной точки. В этом случае поисковик должен "разметить" текст на блоки по параграфам (или он этого не делает, или у него есть приоритеты, или он тупо считает </p> концом предложения и "ставит точку").
То же самое касается </h> и </td>.
Пардон. Это, коенечно надо убрать.
Каталог временно закрыт. Обнаружена дыра.
Все старые ссылки крякнуты...но есть дубликат базы.
В форуме дам сообщение о возобновлении.
А каталогов-то прибавилось! Прибавится ли смысла... 🚬
ну и? есть эффект?
Да, осталные, вроде, то'ж пускают - грешен 🙄
По поводу спама в заголовках - может быть обшибочка(буфер обмена), да и что считать спамом...это другая тема.
Я понимаю так, лубое сообшение в форуме, может рассматриваться лишь к сведению, а не призыв к действию и выкидывать, конечно, без нужды не стоит.
на http://www.thai.ru - форму прошел, будем смотреть дальше.