- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева

Переиграть и победить: как анализировать конкурентов для продвижения сайта
С помощью Ahrefs
Александр Шестаков
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Искал, но что-то не особо понял, хотя возможно искал не по тем ключевым словам...
Задача в следующем:
1. Есть сайт. Условно 2000 страниц, из них 1000 страниц с индексе Яндекса.
2. Как получить список страниц сайта, которых нет в индексе? Такое реально автоматически сделать?
P.S. Интересующие меня страницы находятся в одной рубрике и имееют структуру: сайт.ру/rubric/ID/
где ID - числовой идентификатор.
В теории это возможно.
1)Получить список страниц которые в индексе.
2)через регулярки спарсить сами урлы(айди, которая за рубрикой), удовлетворяющие условию. Можно записать в файл в формате (1, 3, 10, 123), чтобы применить для IN(во множестве) мускульного.
3)Сделать по этому ИН выборку, только с отрицанием(то есть "выбери мне все айдишники, которых нет в этом множестве").
Я решение Вашей задачи вижу как-то так. МейБи уже велосипед изобретен:)
Что мешает вычесть из списка всех урлов список проиндексированных? или наоборот...
Чтобы все подряд урлы спарсить есть куча решений начиная от teleport pro и т.п. софта, и заканчивая Page Weight от разработчика с этого форума. Далее, в том же Excel'е просто вычитаем урлы из всего списка. Как-то так.
пхп:
магическим способом получаем список всех урлов и записываем в переменную $all
магическим способом получаем список проиндексированных урлов и записываем в переменную $indexed
делаем $noindex = array_diff($all, $indexed)
в $noindex у нас есть НЕпроиндексированные урлы
---------- Добавлено 22.06.2012 в 15:22 ----------
список проиндексированных страниц можно взять на http://webmaster.yandex.ua/check.xml