- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Здравствуйте, существует ли готовое программное решение, позволяющее просканировать сайт и вывести список всех страниц сайта. Для того чтобы в дальнейшем указать страницы не предназначенные для индексации ПС и по заданному фильтру сгенерировать robots.txt. Есть ряд сайтов, на которых довольно большое количество страниц, индексацию которых необходимо закрыть. Вручную это делать довольно геморно.
Здравствуйте.
да http://sbfactory.ru/cd/?p=3
Здравствуйте.
да http://sbfactory.ru/cd/?p=3
Спасибо за ссылку, но это немного не то. Мне нужен не сколько сам парсер, а генератор robots.txt по результатам парсинга. Чтобы вручную не забивать в robots.txt исключенные для индексации страницы.
Если вам нужно дописать в начало каждой ссылки disallow, то там тоже есть такая функция...
Если вам нужно дописать в начало каждой ссылки disallow, то там тоже есть такая функция...
Проблема в том, что не каждой ссылке нужно дописать disallow, а только к конкретным, которые разбросаны по всему сайту, во всех разделах и категориях. И я хотел чтобы указанные ссылки, но не все сгенерировались потом в файл с директивой disallow. Который в дальнейшим можно было бы внести в robots.txt
Pageweight
Проблема в том, что не каждой ссылке нужно дописать disallow, а только к конкретным, которые разбросаны по всему сайту, во всех разделах и категориях. И я хотел чтобы указанные ссылки, но не все сгенерировались потом в файл с директивой disallow. Который в дальнейшим можно было бы внести в robots.txt
Соберите только "конкретные" ссылки сканером, в чем проблема не пойму...
Соберите только "конкретные" ссылки сканером, в чем проблема не пойму...
Таких ссылок несколько тысяч может быть, проблема в том, что в ручную их в robots.txt заносить затруднительно.
Таких ссылок несколько тысяч может быть, проблема в том, что в ручную их в robots.txt заносить затруднительно.
Ну если вы не троллите, то обучитесь работе с экселем и каким-нибудь текстовым редактором. Сделать из:
[url1]
[url2]
[url3]
список директив
User-Agent: *
Disallow: [url1]
Disallow: [url2]
Disallow: [url3]
элементарно.
Спасибо всем, мы решили проблему.