- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Возникла необходимость построить sitemap для сайта >100К страниц и начал перебор вариантов.
Маленькая и шустрая софтинка VIGOS Gsitemap 0.97a, которой я всегда пользовался, при 10К страницах в очереди жрёт где-то под полтора гига оперативки и ещё столько же свопа. Дальше начинает пачками вываливать overflow exceptions и кончает жизнь самоубийством.
Ни один онлайн сервис такой объём не переварит. Что очень логично, ибо иметь гигабайты входящего трафика, загруженный сервер, и не брать ни с кого деньги - сие есть бред.
Прощупал несколько триал-версий платных софтинок. Красиво, много кнопок, но мало толку. Что-то опять таки жрёт память, что-то просто немыслимо тормозит.
В результате карта сайта была построена с помощью VIGOS Gsitemap 0.97a + набор хитрых regexp-фильтров, чтобы разбить сайт на подразделы и для каждого подраздела создать свою относительно небольшую карту.
После всех этих танцев с бубном было принято волевое решение сделать генератор сайтмепов под себя. Потрачено ровно четыре дня и сейчас софтинка индексирует (тьфу-тьфу-тьфу) сайт в 5 потоков, в очереди 20 000 ссылок и жрёт она памяти 42 Мб (при этом, со старта - 30 Мб, ибо .Net).
Что есть: парсинг в 1-9 потоков, regexp-фильтры, показ карты сайта с отчётом по кажому узлу, возобновление парсинга после остановки, сохранение/загрузка конфигурационных файлов.
Что будет в ближайшее время: работа с деревом сайта и оптимизация под большое количество узлов.
Забрать это добро можно здесь: SitemapGenerator
Там же будут и обновления.
Если будет проявлен интерес к программке и будет собрано достаточно отзывов, то разработка получит своё продолжение и в функционале появятся проверка на валидность, архивирование, разбиение карты на несколько файлов, кое-какие оптимизационные вещи, которые лично мне не нужны, но сделать можно было бы, и доработки по пожеланиям.
Скриншоты можно посмотреть здесь:
screen_1.jpg
screen_2.jpg
screen_3.jpg
а язл не справляется с генерацией сайтмапа? сколько не пользовался нарицаний не было..
А без Net варианта у вас нет?
а язл не справляется с генерацией сайтмапа? сколько не пользовался нарицаний не было..
Для того, чтобы это проверить, мне надо его купить. В демо-версии практически вся доп. функциональность закрыта. Ну или найти кряк. Мне не то чтобы жалко 130 баксов, но я не хочу их отдавать:
1. за неизвестно как работающий картостроитель
2. за пачку другой функциональности, которая мне 100 лет не нужна
Santyago добавил 03.10.2008 в 13:21
А без Net варианта у вас нет?
Неа. Надо было максимально быстро решить задачу. Решил её на .Net.
А вообще, первая мысль была сделать серверный скрипт на С++, но леньки стало молодость вспоминать... :D
SOFTPlus GSiteCrawler
Я этой штукой пользуюсь, долговато работает, но в районе 100К одолевает без проблем, главное в интерфейс въехать :)
SOFTPlus GSiteCrawler
Я этой штукой пользуюсь, долговато работает, но в районе 100К одолевает без проблем, главное в интерфейс въехать :)
Ага. Пробовал. Она у меня и сейчас стоит. Надо будет удалить. И на десктопе (Виндовс ХП), и на ноуте (Виндовс Виста) выдаёт ошибку отсутствия файла tabctl32.ocx. В принципе, думаю, я бы мог вручном режиме решить эту проблему. Но это как-то не серьёзно... :)
могу предложить домен sitemap.su, который не помню уже зачем валяется без дела:)
На скрине лабельки "Дата модификации" и "Приоритет" перепутаны.
На скрине лабельки "Дата модификации" и "Приоритет" перепутаны.
Точно! Лейбы местами перепутал! :) Спасибо, сейчас выправлю.
ТС, респект, только вчера перебирал, ничего не нашел подобного уровня)
ТС, респект, только вчера перебирал, ничего не нашел подобного уровня)
Пожалуйста. Буду ждать отзывов и пожеланий!