Отдам в хорошие руки программку для посроения сайтмепов

S
На сайте с 15.07.2008
Offline
30
9383

Возникла необходимость построить sitemap для сайта >100К страниц и начал перебор вариантов.

Маленькая и шустрая софтинка VIGOS Gsitemap 0.97a, которой я всегда пользовался, при 10К страницах в очереди жрёт где-то под полтора гига оперативки и ещё столько же свопа. Дальше начинает пачками вываливать overflow exceptions и кончает жизнь самоубийством.

Ни один онлайн сервис такой объём не переварит. Что очень логично, ибо иметь гигабайты входящего трафика, загруженный сервер, и не брать ни с кого деньги - сие есть бред.

Прощупал несколько триал-версий платных софтинок. Красиво, много кнопок, но мало толку. Что-то опять таки жрёт память, что-то просто немыслимо тормозит.

В результате карта сайта была построена с помощью VIGOS Gsitemap 0.97a + набор хитрых regexp-фильтров, чтобы разбить сайт на подразделы и для каждого подраздела создать свою относительно небольшую карту.

После всех этих танцев с бубном было принято волевое решение сделать генератор сайтмепов под себя. Потрачено ровно четыре дня и сейчас софтинка индексирует (тьфу-тьфу-тьфу) сайт в 5 потоков, в очереди 20 000 ссылок и жрёт она памяти 42 Мб (при этом, со старта - 30 Мб, ибо .Net).

Что есть: парсинг в 1-9 потоков, regexp-фильтры, показ карты сайта с отчётом по кажому узлу, возобновление парсинга после остановки, сохранение/загрузка конфигурационных файлов.

Что будет в ближайшее время: работа с деревом сайта и оптимизация под большое количество узлов.

Забрать это добро можно здесь: SitemapGenerator

Там же будут и обновления.

Если будет проявлен интерес к программке и будет собрано достаточно отзывов, то разработка получит своё продолжение и в функционале появятся проверка на валидность, архивирование, разбиение карты на несколько файлов, кое-какие оптимизационные вещи, которые лично мне не нужны, но сделать можно было бы, и доработки по пожеланиям.

Скриншоты можно посмотреть здесь:

screen_1.jpg

screen_2.jpg

screen_3.jpg

jpg screen_1.jpg
Банки Украины (http://www.bankstore.com.ua) Генератор сайтмепов (/ru/forum/272468) Ода Гугльботу (/ru/forum/285758)
SM
На сайте с 02.07.2007
Offline
131
#1

а язл не справляется с генерацией сайтмапа? сколько не пользовался нарицаний не было..

найди путь для использования мира под свои нужды продается завод пищевой промышленности в Свердловской области!
S2
На сайте с 07.01.2008
Offline
611
#2

А без Net варианта у вас нет?

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
S
На сайте с 15.07.2008
Offline
30
#3
sasha_mtrx:
а язл не справляется с генерацией сайтмапа? сколько не пользовался нарицаний не было..

Для того, чтобы это проверить, мне надо его купить. В демо-версии практически вся доп. функциональность закрыта. Ну или найти кряк. Мне не то чтобы жалко 130 баксов, но я не хочу их отдавать:

1. за неизвестно как работающий картостроитель

2. за пачку другой функциональности, которая мне 100 лет не нужна

Santyago добавил 03.10.2008 в 13:21

Str256:
А без Net варианта у вас нет?

Неа. Надо было максимально быстро решить задачу. Решил её на .Net.

А вообще, первая мысль была сделать серверный скрипт на С++, но леньки стало молодость вспоминать... :D

Dreammaker
На сайте с 20.04.2006
Offline
570
#4

SOFTPlus GSiteCrawler

Я этой штукой пользуюсь, долговато работает, но в районе 100К одолевает без проблем, главное в интерфейс въехать :)

S
На сайте с 15.07.2008
Offline
30
#5
Dreammaker:
SOFTPlus GSiteCrawler

Я этой штукой пользуюсь, долговато работает, но в районе 100К одолевает без проблем, главное в интерфейс въехать :)

Ага. Пробовал. Она у меня и сейчас стоит. Надо будет удалить. И на десктопе (Виндовс ХП), и на ноуте (Виндовс Виста) выдаёт ошибку отсутствия файла tabctl32.ocx. В принципе, думаю, я бы мог вручном режиме решить эту проблему. Но это как-то не серьёзно... :)

DI
На сайте с 03.01.2007
Offline
123
#6

могу предложить домен sitemap.su, который не помню уже зачем валяется без дела:)

Высказывание идиотского утверждения требует на порядок меньше усилий, чем его последовательное и обоснованное опровержение и более того, иногда это опровержение вообще невозможно. © (http://zhurnal.lib.ru/s/shapiro_m_a/raspidiota.shtml)
C
На сайте с 18.09.2008
Offline
9
#7

На скрине лабельки "Дата модификации" и "Приоритет" перепутаны.

S
На сайте с 15.07.2008
Offline
30
#8
Chili:
На скрине лабельки "Дата модификации" и "Приоритет" перепутаны.

Точно! Лейбы местами перепутал! :) Спасибо, сейчас выправлю.

newseditor
На сайте с 13.11.2006
Offline
123
#9

ТС, респект, только вчера перебирал, ничего не нашел подобного уровня)

S
На сайте с 15.07.2008
Offline
30
#10
newseditor:
ТС, респект, только вчера перебирал, ничего не нашел подобного уровня)

Пожалуйста. Буду ждать отзывов и пожеланий!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий