продавцам и владельцам баз (проверяем проиндексированность каталогов)

Ylich
На сайте с 24.04.2006
Offline
123
1164

Сейчас с баней каталогов Яндексом частенько встречаешь вопросы "Сколько у вас в базе каталогов с количеством проиндексированных страниц равных 0" Недавно общался с продавцом задал ему такой же вопрос ответ был такой – «это долго времени нет надо все домены обрезать да и сейчас готовлю новую версию ПРО». К счастью ко мне обратился знакомый у которого была эта база и мы ее проверили, смешно как то база на 2000 каталогов в которой 500 с лишним каталогов имеют 0 проиндексированных страниц – это ваше время и соответственно деньги, я не вижу даже смысла прогонять сайт по таким каталгам.

Так вот сейчас Вам объясню как сделать все это относительно быстро, для этого понадобится (как делаю я) Excel, блокнот, PHP Expert Editor – самый лучший редактор скачиваем и регистрируем тут http://www.ankord.com/, программа checkidx скачиваем тут http://getya.nm.ru/ - респект автору за программу, потом еще нужен скрипт yacheck не помню где взял но также спасибо автору (код скрипта приведу в конце) и последнее что нам понадобится немного трафика.

Для примера я возьму небольшой кусочек своей базы и тех что у меня валяются в сторонке после проверки

1. итак экспортируем вашу базу в xml , открывем эксель нажимаем – файл >> открыть и открываем Ваш xml файл с базой, получаем все урлы ваших каталогов

2. создаем блокнот на рабочем столе, и открываем его в программе PHP Expert Editor и скидываем туда все ваши урлы

далее нам надо привести все каталоги к виду http://site.ru или http://www.site.ru,

3. открыли свой блокнот с урлами и нажимаем поиск >> заменить

Вбиваем искать текст – «http://www.» Заменить на «www.» - вбивайте без кавычек далее заменить все

Показано на рисунке 1

Подымаем курсор наверх и делаем то же самое только

Вбиваем искать текст – «http://» Заменить на «www.» - вбивайте без кавычек далее заменить все

Рисунок не прилагаю сами разберетесь надеюсь

(так мы привели все урлы к одинаковому началу)

4. далее нам надо откинуть все что находится после знака / получить только домены

нажимаем поиск >> заменить

Вбиваем искать текст – «/» Заменить на « штук 200 пробелов » - вбивайте без кавычек

Лишнее откинулось но оно находится все там же только за пробелами, сохраняем блокнот

5 далее открываем эксель, нажимаем файл >> открыть, выбираем тип открываемых файлов все файлы (как показано на рисунке 2) выбираем наш блокнот нажимаем открыть

В появившемся окне выбираем фиксированной ширины – (показано на рисунке 3) нажимаем далее

Выставляем в следующем окне стрелку на значении 100 – 120 кликом мышки на значении (показано на рисунке 4) и жмем готово

У нас получилось в экселе что у нас в первой колонке находятся адреса доменов а в других то что к ним прилагалось, выделяем все это добро и скидываем обратно в свой блокнот, так мы имеем все урлы доменов наших каталгов (смотрите на рисунке 5)

6. скачиваем программу checkidx тут http://getya.nm.ru/ открываем ее вставляем в окно все свои домены из текстового документа и нажимаем проверить (рисунок 6)

7. После того как проверка закончилась копируем урлы со значениями обратно в свой блокнот все в той же программе PHP Expert Editor, и все так же нажимаем поиск >> заменить, меняем « » (2 пробела) на « » (20 пробелов),

сохраняем открываем блокнот в экселе, выбираем «фиксированной ширины» выставляем поле на 70 – 80 после открытия у вас должно получиться в экселе 2 колонки первая с урлами, вторая – количество проиндексированных страниц, выделяем колонку с числовыми значениями и выполняем сортировку ( рисунок 7 )

8. все ваши сайты с нулевыми значениями оказываются сверху, но это еще не все, мы только проверили сайты типа http://www.site.ru надо теперь домены типа http://site.ru

9. из предыдущего нашего экселя копируем обратно в наш насущный блокнот все урлы с нулевым значением (стоит зацепить сайты с количеством страниц от 0 до 100)

нажимаем поиск >> заменить

Вбиваем искать текст – «www.» Заменить на «http://» - вбивайте без кавычек далее заменить все

Теперь вы получили все ваши домены каталогов вида http://site.ru и повторяем пункты 6 и 7 снова с данными урлами

После чего вы получите нулевые каталоги :)

Далее создаете базу в аллсабмиттере вставляете в отдельную категорию свои нулевые а в другую категорию свою базу и в вашей базе теперь каталоги без нулевых

Еще совет все ваши получившиеся нулевые каталоги перепроверьте еще раз Yandex может подглючивать в этом отношении, но не удивляйтесь если у вас их будет много, я в своей коллекции уже насобирал 1200 штук

в прикрепленных файлах вы также найдете скрипт для проверки проиндексированных каталогов (для пущей проверки можете потом нулевые каталоги проверить через него)

атакже в приложении картинки к инструкции

zip yacheck.zip
jpg pic1.jpg
jpg pic2.jpg
jpg pic3.jpg
jpg pic4.jpg
С Уважением...
Ylich
На сайте с 24.04.2006
Offline
123
#1

и в данном посте оставшиеся картинки, в первый все не влезли

если будут вопросы спрашивайте отвечу

jpg pic5.jpg
jpg pic6.jpg
jpg pic7.jpg
Егор
На сайте с 28.02.2006
Offline
231
#2

Ylich, на счет того, чтобы очистить все то, что после слеша, т.е. оставить только домен. Я себе сделал такую вещь, может кому полезна будет :)

http://www.581.ru/domens_c(Егор).zip

Shakes.pro (http://Shakes.pro/) & Leadbit.com (http://Leadbit.com/) - товарка по всему миру С уважением, Егор
Ylich
На сайте с 24.04.2006
Offline
123
#3
Егор:
Ylich, на счет того, чтобы очистить все то, что после слеша, т.е. оставить только домен. Я себе сделал такую вещь, может кому полезна будет :)

http://www.581.ru/domens_c(Егор).zip

удобно, просто класс, только одно но, окна сделай шире, т.к. если у тебя урл не вмещается в одну строчку то получается софтна считает из ха 2 урла

для примера проверь 2 этих урла

http://www.wwsu.net/katalogm/index.php?adds=1

http://www.rosturizm.ru/linkexchange/links_ex.php?dir=4

Ylich
На сайте с 24.04.2006
Offline
123
#4

операция с откидыванием / таким способом как я описал занимает 2-3 минуты, я не программер других способов не знал, хотя можно тот же макрос в экселе или верде написать

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий