ну вроде похоже на правду :) увеличили отступ от линка теперь нормально?
информация перед словом байт. мы её выделим. может там стояла цифра 60 или 40 - это и есть точное совпадение. у некоторых это 12-20 байт, у некоторых 55000. На самом деле это именно информация о весе слов в контенте на странице. Как таковых сайтов нет, мы ведем речь только о страницах отдельно. Вообще база собирается из разных файлов, самое главное для нас это содержательность, пусть даже и графическая. В таких графически наполненных файлах контента немного, вот и результат. Но в целом мы очень жестко подходим к отбору информации, так как база создана для использования нами самими , а нам времени жалко много тратить на поиск.
таблица там временно, вообще все разруливаем на div
не понял про байты.
снипеты - это контент, в котором отсутствуют пока! знаки препинания. Выделения сделаем, они у нас были в первом варианте и это не сложно.
Радует , когда люди дело советуют, спасибо
над кодом работаем, снипеты приведем в порядок. эти страницы просто мы накопили в результате работы , не копаться же в аксессе :) а добавлять сайт целиком мы не можем - не хватит ресурсов. Поэтому мы индексируем только интересные страницы
собственно сабж http://capel.ru
алгоритм да, согласен. но принципы - они на то и принципы что их никак не скрыть. как вижу я перспективу для себя: составляется ряд словарей для создания фильтров, затем при закачке контента в базу происходит определение направленности сайта. Результаты направляются людям-модераторам, которые и ставят штамп на сайте. Гораздо сложнее с интуитивным определением пользователя - тут айпишник не помощник, а логониться в поисковик никто не будет ( по крайней мере сейчас). Ну это лирика. вы правы. Подождем.....
ни на одном форуме никто дать не может. это разве табу какое нибудь? не хочется руководствоваться только рассуждениями типа "если этот метатег, то вроде так, а вот так сделаешь - вроде ранг повысится"
у меня на морде кнопка LI иногда захожу. там банерок висит этих товарищей. Конечно все здорово, молодцы ребята, да только по моему это не более чем трюк для продажи услуг по раскрутке. Ради прикола посмотрите на действия их калькулятора. За хост зенона 1500 зелени :) ГЫ
Я и не говорю о том, чтобы все делать самому. Если сам не можешь - купи у программиста услугу. А если скачал шаравару на каком нибудь нонейме - будь готов ,что автор через свой же лючок откроет прогу и фигу покажет. ПХП - язык вовсе не сложный, а книжки почитать не вредно.