База сайтов Яндекс Каталога

1 234
artcrazy
На сайте с 20.03.2010
Offline
81
#31

Пришло обновление базы + добавились новые столбцы и параметры сканирования. По мне так очень удобно, спасибо ТСу.

C
На сайте с 27.12.2007
Offline
100
#32

Появились свежие базы (начало февраля 2014) ЯК, русский DMOZ, катаог Mail.ru

1) База сайтов, находящихся в Яндекс каталоге.

файл excel (xlsx), поля:

- домен вида (домен.ру)

- домен в кодировке Punycode

- ТИЦ

- регион

- рубрика каталога вида: Рубрика / Подрубрика 1ув / Подрубрика 2ув / Подрубрика 3ув и т.д.

Поддерживается полный уровень вложенности подрубрик. Полные дубли (домен + рубрика) удалены.

Также удалены "промежуточные" значения, полученные при парсинге. Т.е. если после парсинга было:

домен1.ру | Рубрика / Подрубрика 1ув

домен1.ру | Рубрика / Подрубрика 1ув / Подрубрика 2ув

домен1.ру | Рубрика / Подрубрика 1ув / Подрубрика 2ув / Подрубрика 3ув

То в итоге останется:

домен1.ру | Рубрика / Подрубрика 1ув / Подрубрика 2ув / Подрубрика 3ув

Т.е. можно делать максимально полную выборку по любой рубрике, подрубрике любого уровня вложенности.

Дублирующиеся домены подсвечены, легко можно отсортировать и почистить стандартными средствами excel.

Всего уникальных доменов (без дублей) - 125023 шт.

Цена: 40$

2) База сайтов, находящихся в русском Дмозе (http://www.dmoz.org/World/Russian/)

файл excel (xlsx), поля:

- домен вида (домен.ру)

- домен в кодировке Punycode

- ТИЦ

- рубрика каталога вида: Рубрика: Подрубрика 1ув: Подрубрика 2ув: Подрубрика 3ув и т.д.

Поддерживается полный уровень вложенности подрубрик. Полные дубли (домен + рубрика) удалены.

Также удалены "промежуточные" значения, полученные при парсинге. Т.е. если после парсинга было:

домен1.ру | Рубрика: Подрубрика 1ув

домен1.ру | Рубрика: Подрубрика 1ув: Подрубрика 2ув

домен1.ру | Рубрика: Подрубрика 1ув: Подрубрика 2ув: Подрубрика 3ув

То в итоге останется:

домен1.ру | Рубрика: Подрубрика 1ув: Подрубрика 2ув: Подрубрика 3ув

Дублирующиеся домены подсвечены, легко можно отсортировать и почистить стандартными средствами excel.

Всего уникальных доменов (без дублей) - 95456 шт.

Цена: 30$

3) База сайтов, находящихся в каталоге list.mail.ru

файл excel (xlsx), поля:

- домен вида (домен.ру)

- домен в кодировке Punycode

- основная рубрика каталога

- ТИЦ

Внутри каждой рубрики дублей нет. Некоторые домены могут присутствовать в нескольких рубриках каталога - поэтому дублируются в общей базе.

Дублирующиеся домены подсвечены, легко можно отсортировать и почистить стандартными средствами excel.

Всего уникальных доменов (без дублей) - 92287 шт.

Цена: 30$

Покупавшим базы ранее - скидка на обновление - 50%.

"Оптовикам" - тоже скидки.

Юрий
На сайте с 04.01.2004
Offline
126
#33

Купил все 3 базы, ТС сделал приятную скидку за опт :). Базы получил, все как описано - сайты, урлы, разделы каталогов.

Интернет - маркетолог ( http://www.webfanatic.ru ) DigitalFixer.ru ( https://digitalfixer.ru )
1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий