Обновление. База сайтов Яндекс каталога (Декабрь, 2014)
Изменения, по сравнению с предыдущим обновлением базы:
Основная категория - количество уникальных URL адресов:
Hi-Tech - 10844 (+385)
Работа - 1032 (+58)
Учёба - 10907 (+104)
Дом - 32802 (+953)
Общество - 5748 (+403)
Развлечения - 5491 (+343)
Отдых - 9578 (+141)
Культура - 16889 (+322)
Спорт - 6835 (+735)
СМИ - 4305 (+556)
Бизнес - 48997 (+2586)
Справки - 4065 (+337)
Авто - 5703 (+182)
Порталы - 804 (+19)
Универсальное - 1000 (+95)
Дополнительная выборка:
Новые сайты - 1000 (+150)
Мобильный ЯК - 1412 (+144)
Всего (URL адресов): основной ЯК - 165000 (+7219), мобильный ЯК - 1412 (+144).
Стоимость базы: 12 WMZ
Купить на Плати.ру (http://www.plati.ru/asp/pay.asp?id_d=1847284)
В свое время много подобных программ пересмотрел, на мой взгляд, это лучшее что есть: http://anton-pribora.ru/projects/recoder/ :)
Продается, свежая база сайтов Яндекс каталога (Август, 2014)
Что вы получите:
База предоставляется в виде одного .xls файла разбитого на листы/категории.
Hi-Tech - 10621 (+349)
Работа - 766 (-171)
Учёба - 10811 (-21)
Дом - 32021 (+1018)
Общество - 5698 (+47)
Развлечения - 5159 (+206)
Отдых - 9748 (-23)
Культура - 16601 (-550)
Спорт - 7110 (-42)
СМИ - 4336 (-23)
Бизнес - 48356 (+910)
Справки - 3971 (-48)
Авто - 5666 (-110)
Порталы - 812 (-9)
Универсальное - 1000
Новые сайты - 1000
Мобильный ЯК - 1371 (-119)
Всего (URL адресов): основной ЯК - 162 676 (+1533), мобильный ЯК - 1371 (-119).
В скобках указаны изменения, по сравнению с предыдущим обновлением базы.
Описание полей в таблице:
1. Название категории в Яндекс каталоге, вида: категория/подкатегория/субкатегория/... полный уровень вложенности
2. Количество сайтов присутствующих в данной категории на момент парсинга
3. URL адрес категории в ЯК
4. URL адрес сайта
5. ТИц сайта (по яндекс бару)
6. Google PageRank сайта
7. Присвоенный регион (по яндекс бару)
8. Присвоенная тематика (по яндекс бару)
9. Название сайта в каталоге
10. Описание сайта в каталоге
11. Ссылка на скриншот сайта в каталоге
12. Ссылка на Whois данные сайта (для поддоменов и различных экзотических доменных зон ссылка может быть некорректна)
Особенности:
- С целью уменьшения количества дублей в процессе парсинга были исключены ссылки на категории, содержащие в себе /synt2/ и /geo/
- База почищена на дубли (по полному совпадению URL адреса). Дубли вычищаются в пределах основной категории (например, Hi-Tech) начиная от самых маленьких и заканчивая самыми крупными категориями/подкатегориями. Размер категории определяется по количеству сайтов присутствующих в данной категории на момент парсинга.
- Дополнительно предоставляется нечищеный на дубли вариант базы в формате .txt Помимо наличия дублей в таком варианте отсутствуют следующие параметры: ТИц, PageRank, Присвоенный регион, Присвоенная тематика, Ссылка на Whois.
Обновление базы:
Обновление раз в три месяца или чаще. Обновление платное – всем ранее купившим базу скидка 50% от стоимости базы на момент обновления.
Купить на Плати.ру (http://www.plati.ru/asp/pay.asp?id_d=1778042)
Желающие приобрести базу со скидкой 25% - поторопитесь.
Действие промокодов заканчивается 04.03.2014.
Где можно ознакомиться с третьей версией? Или она пока доступна только для участников тестирования?
Почистить браузер от посторонних плагинов можете этой программой: http://toolbarcleaner.com/
Попробуйте, STGrabber.
Vitiai, попробуйте такой вариант.
RewriteCond %{REQUEST_URI} ^/buronabivnyje-svai$ [NC] RewriteRule ^(.*)$ http://www.drilling-msk.ru/ [QSA,R=301,L]
Заказывал у Александра небольшой скрипт. Все было выполнено максимально быстро и точно по ТЗ.
Работой ТС остался очень доволен, обязательно буду обращаться ещё. :)
Можете и с чужими сборками ознакомиться и свою на обсуждение выставить. http://forum.3dnews.ru/forumdisplay.php?f=60