Нашли.com

Рейтинг
3
Регистрация
29.07.2005

При формировании дерева разделов максимально близкие группы объединялись с целью повышения читаемости и облегчения поиска человеком, чтобы можно было все разделы вынести на главную страницу. Так например в разделе "Спорт" можно выделить пол сотни разных видов спорта, но это только осложнит навигацию. А "интернет-магазины" и "доски объявлений" представляют собой предложения товаров и услуг в сети, так что это вполне логичное объединение.

join.kadafi:
За месяц 32 662 сайтов зарегистрировали ?

Нет конечно, не за месяц. На этом сайте добавлено около 1000 новых записей, остальное формировалось на другом проекте более года. Правда пришлось подчищать устаревшие ссылки, и пересортировывать, так-как поменялась структура каталога.

Каталог пока действительно достаточно "простой". Работает всего месяц, и многие задумки ещё просто не реализованы. Вчера ночью, например, был доделан механизм поиска по каталогу, так что работа движется. С доработкой поиска незначительно увеличилось и количество просмотреных страниц одним посетителем. Будут и другие улучшения для посетителей. Сортировки по странам и городам скорее всего не будет, так как в Интернете это не столь важный параметр. Хотя ещё посмотрю. А вот сортировку по рейтингу, голосам посетителей, и ещё чего-нибудь сделал бы...

По поводу Google, то понятно. Каталог новый (не месяц, а полторы-две недели), и поисковики только недавно начали индексирование. Яндекс ещё не индексировал, только ИЦ обновил (уже 60).

Сайтов действительно ровно столько в каталоге, сколько показывает на главной странице. Было больше, но в течении нескольких дней робот проверял ссылки, и выбросил 3254 нерабочих. Были и другие зачистки (по размеру описания, стоп-словам и тд.), и будут ещё. Мне самому как бельмо в глазу всякий мусор в каталоге. Нужно только разработать правильные алгоритмы его "утилизации", и жизнь наладится. :)

По поводу организации каталога в Яндексе, то мне, например, не нравится что во первых не видно какие подразделы есть в разделах (показывается несколько штук из примерно десятка), во вторых, количество уровней в разделах колеблется, в третьих, чтоб добраться до списка сайтов, нужно загрузить лишних 2-5 страниц навигации по разделам. Хотя может кому-то так и удобнее...

Категорий больше делать не буду, так-как преследовалась цель отображения всех разделов/подразделов на главной странице (для удобства навигации). А когда разделов слишком много, то можно в них потеряться. Напиши пожалуйста тематику, которую ты не нашёл среди разделов. Возможно что-то переименую, возможно и добавлю, если действительно что-то пропустил.

Статики не будет. Это пережиток, от которого поисковики должны избавляться. Тем более, что им мешает отказывать от индексации огромного количества "статических" страниц, которые явно формируются на лету. Это очень легко определить. А вот у меня в каталоге сейчас списки сайтов сортируются по дате добавления. Таким образом сайт всегда расположен на одной и той же странице в списке + у сайта есть своя персональная страница. Благодяря этому его легче найти поисковиком.

По названиям нет абсолютно никакого смысла сортировать, так-как сайт может называться: "каталог сайтов Нашли.com", "Нашли.com - каталог сайтов", "Супер каталог Нашли.com" и тд. Так что эта затея не очень хорошая, а вот по ссылке ещё может есть смысл делать сортировку (отбрасывая http, www). В ближайшее время сделаю некоторые виды сортировок, но сначала форму поиска добавлю. Это будет полезнее для пользователей.

Со стороны может пока и похоже на линкопомойку, но я каждай день пересматриваю добавленные сайты, и подчищаю мусор. Кроме того, часть мусора отваливается ещё на этапе внесения в базу. Так например, не принимаются сайты, которые уже есть в базе, с короткими описаниями, с описаниями, в которых слишком мало русских букв, или много в верхнем регистре, если название и описание совпадает и тд.

Всё ещё в переди. Спасибо за советы и замечания.

Закончена проверка работоспособности ссылок каталога. Как и предпологалось, вылетело 10%. Теперь в нашем каталоге только существующие сайты.

Выкинул из базы все записи, где пытались выводить html код. Его вывести всё-равно не получится - эта возможность заблокирована в целях безопасности, но всякий мусор в тексте из-за этого появлялся.

В данный момент работает робот, проверяющий существование внесённых сайтов. Ещё полтора дня, и в базе не останется "мёртвых" ссылок. По предварительным наблюдениям, будет удалено 10% записей. Напомню, что при добавлении сайта, уже сразу происходит такая проверка, и в каталог попадают только "живые" ссылки.

Позже будут удалены дубликаты, а также перенесены сайты, размещённые не в том разделе (на основе анализа ключевых и стоп-слов).

Поменял сортировку сайтов в каталоге. Теперь новые отображаются в конце списка. Так страницы будут "более статическими", что должно повлиять на индексацию. Что вы об этом думаете?

ЗЫ: Прочитал, что Рамблер обходит динамические сайты быстрее, если их рейтинг выше в топ100. И не обходит вообще, если в топ100 сайта нет.

Приношу извинения, не работала страничка добавления сайтов где-то часов 5. Уже всё нормально.

Слалал вам счастье - поставил ссылку на названии сайта. Только убрал title из старой ссылки, а то много названий на странице получается.

Приятной работы!

1 234
Всего: 40