- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
С недавнего времени заметил что не принимают сайты, у которых не все страницы проиндексированы в Яндексе.
У меня есть несколько каталогов, у которых страниц больше 10000, Яндекс же видит всего 2-3 тысячи страниц сайтов, долго ломал себе голову и придумал написать код, который не даст sape вносить в базу страницы, которых нет в Яндекс, вроде помогло, поэтому хочу поделиться со всеми:
Код только на PHP, так как другими не владею:
<?
$url = $HTTP_SERVER_VARS["HTTP_HOST"].$HTTP_SERVER_VARS["REQUEST_URI"];
$e = explode("/",$url);
if(!$e[1]) $url = str_replace("/","",$url); //убираем слэш в конце главной страницы
$url_www = rawurlencode("www.".$url);
$url = rawurlencode($url);
$ya = "http://www.yandex.ru/yandsearch?rpt=rad&text=url%3D%22".$url_www."%22+%7C+url%3D%22".$url."%22";
$file=@file_get_contents($ya);
if(preg_match("!Результат поиска: страниц — <b>(.*?)</b>!si",$file,$ok)) $is = $ok[1];
if($is)
{
// ЗДЕСЬ ДОЛЖЕН БЫТЬ КОД САПЕ
}
?>
после того как Sape закончит индексацию, можно удалить этот код и заменить только кодом системы Sape.
Артур почему я все узнаю на форумах? все нужно в одном офисе работать.
Артур почему я все узнаю на форумах? все нужно в одном офисе работать.
Работа это одно, а форум другое, здесь я просто общаюсь :)
Art-Host, бан по айпи через 1000 запросов. Хотя вариант неплохой.
Да, забыл, если переменная $url в конце содержит слэш, например site.ru/links/, то слэш нужно убрать, так как страница не будет найдена в Яндекс.
Art-Host, бан по айпи через 1000 запросов.
Откуда такая информация?
Запросы же не к XML, а на обычные страницы с поиском
Откуда такая информация?
Запросы же не к XML, а на обычные страницы с поиском
Сделайте так, чтоб парсер "засыпал" на рандомное время, и всё будет ок :)
Сделайте так, чтоб парсер "засыпал" на рандомное время, и всё будет ок :)
типа такого sleep(mt_rand(1,100)) ?
Это не "откуда", это жизнь такая.
Откуда такая информация?
Запросы же не к XML, а на обычные страницы с поиском
тожек блочат, когда слишком много запросов в единицу времени привалит с одного айпишника.
типа такого sleep(mt_rand(1,100)) ?
Я так думаю от 10мс до 1-2с хватит...