- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Получаю код страницы с помощью
// инициализация сеанса
$ch = curl_init();
// установка URL и других необходимых параметров
curl_setopt($ch, CURLOPT_URL, "https://tumix.ru");
curl_setopt($ch, CURLOPT_HEADER, 0);
// загрузка страницы и выдача её браузеру
curl_exec($ch);
// завершение сеанса и освобождение ресурсов
curl_close($ch);
?>
В результате получаю кривую страницу без стилей и скриптов т.к. пути к файлам не содержат доменного имени .../css/
Можно как-то это исправить?
Спасибо!
---------- Добавлено 19.06.2017 в 11:59 ----------
Разобрался, добавил <base href="https://tumix.ru/">
Но появился вопрос сложнее, можно ли самому задать title и description? Как?
Добавить свой код перед закрывающим body
Спасибо!
Получаю код страницы с помощью
Цитата:
а хозяин страницы вам разрешил ее код получать?
Но появился вопрос сложнее, можно ли самому задать title и description? Как?
Добавить свой код перед закрывающим body
с помощью регулярных выражений различной степени сложности
например, так
а хозяин страницы вам разрешил ее код получать?
Естественно!
с помощью регулярных выражений различной степени сложности
например, так
Видимо сначала нужно сохранить результат в переменную и потом править?
Я не знаю как сохранять :(
Просто вставил ваш код после curl_exec($ch);
title не изменился.
Нашел готовый код но там задачи другие, пытаюсь на его основе что-нибудь изобрести
// Адрес, на который отправляем запрос
$URI = "http://www.test1.ru/home.php";
// Ссылка, которую ищем (указывать только текст ссылки)
$link = "ТРОЛОЛО";
// Инициализируем сеанс CURL
$main = curl_init( $URI );
// Если сеанс инициализирован
if( $main )
{
// Устанавливаем дополнительные опции
// Опция указывает, что результат будет записан в переменную
curl_setopt($main, CURLOPT_RETURNTRANSFER, 1);
// Выполняем запрос
$html = curl_exec( $main );
// ============================================
// ВНИМАНИЕ! ЕСЛИ КОДИРОВКА САЙТА, НА КОТОРЫЙ
// ВЫПОЛНЯЕТСЯ ЗАПРОС ОТЛИЧАЕТСЯ ОТ КОДИРОВКИ
// ДАННОГО ФАЙЛА, ПРОПУСТИТЕ ПЕРЕМЕННУЮ $html
// ЧЕРЕЗ ФУНКЦИЮ iconv()
// ============================================
// Регулярное выражение для поиска ссылки
// ============================================
// ВНИМАНИЕ! ЕСЛИ ВЫ ИСПОЛЬЗУЕТЕ КОДИРОВКУ UTF-8
// В КОНЦЕ РЕГУЛЯРНОГО ВЫРАЖЕНИЯ, ПОСЛЕ БУКВЫ "i"
// ВПИШИТЕ БУКВУ "u"
// ============================================
$link = trim( $link );
preg_match('/<a(.*)href\s*=\s*"\s*([a-z\-\_\/\.\:]*)s*"(.*)>\s*'.$link.'\s*<\s*\/\s*a>/i', $html, $found);
// Ссылка, найденная в файле
$link_found = $found[2];
// Переходим по полученной ссылке
$transition = curl_init( $link_found );
// Опция указывает, что результат будет записан в переменную
curl_setopt( $transition, CURLOPT_RETURNTRANSFER, 1 );
// Выполняем запрос
if( curl_exec( $transition ) )
{
echo "Клик по ссылке успешно выполнен";
}
// Закрываем сейчас клика по ссылке
curl_close( $transition );
}
else
{
echo "Не удалось инициализировать сеанс CURL. Возможно у вас не установлена данная библиотека.";
}
// Завершаем сеанс CURL
curl_close( $main );
?>
вот так
$page_source = curl_exec($ch);
а потом уже регулярками правишь $page_source, как нужно
Нет, так и не могу изменить tilte, body
и в поисковиках не знаю, что искать...
---------- Добавлено 19.06.2017 в 14:38 ----------
Сделал так
// инициализация сеанса
$ch = curl_init();
// установка URL и других необходимых параметров
curl_setopt($ch, CURLOPT_URL, "https://tumix.ru");
// загрузка страницы и выдача её браузеру
// curl_exec($ch);
$page_source = curl_exec($ch);
$new_title = preg_replace('/\<title\>(.*?)\<\/title\>/si', '<title>Мотороллер не мой, я просто спарсил</title>', $page_source);
// завершение сеанса и освобождение ресурсов
curl_close($ch);
?>
Title не изменился
Smirnof, вы если в php не умеете, чего добиться хотите?
я ж пример привел, а не руководство к действию
Нет, так и не могу изменить tilte, body
и в поисковиках не знаю, что искать...
---------- Добавлено 19.06.2017 в 14:38 ----------
Сделал так
Title не изменился
Опцию CURLOPT_RETURNTRANSFER не забывайте
// Опция указывает, что результат будет записан в переменную
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
Опцию CURLOPT_RETURNTRANSFER не забывайте
Сделал так
<?php
// инициализация сеанса
$ch = curl_init();
// установка URL и других необходимых параметров
curl_setopt($ch, CURLOPT_URL, "https://tumix.ru");
// загрузка страницы и выдача её браузеру
// curl_exec($ch);
$page_source = curl_exec($ch);
// Опция указывает, что результат будет записан в переменную
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$page_source = preg_replace('/\<title\>(.*?)\<\/title\>/si', '<title>Мотороллер не мой, я просто спарсил</title>', $page_source);
// завершение сеанса и освобождение ресурсов
curl_close($ch);
?>
Title не меняется, пробовал изменить preg_replace('/\<title\>(.*?)\<\/title\>/si'........ тоже не помогло
Все curl_setopt() должны быть перед curl_exec()
И в конце, после замен preg_replace() нужно вывести результат:
echo $page_source;
Сделал так
<?php
// инициализация сеанса
$ch = curl_init();
// установка URL и других необходимых параметров
curl_setopt($ch, CURLOPT_URL, "https://tumix.ru");
// Опция указывает, что результат будет записан в переменную
curl_setopt($page, CURLOPT_RETURNTRANSFER, 1);
// загрузка страницы и выдача её браузеру
$page_source = curl_exec($ch);
$page_source = preg_replace('/\<title\>(.*?)\<\/title\>/si', '<title>Мотороллер не мой, я просто спарсил</title>', $page_source);
echo $page_source;
// завершение сеанса и освобождение ресурсов
curl_close($ch);
?>
title не изменился :(