А страница доступна без ЧПУ? Какой код сервер возвращает при обращении на страницу без ЧПУ? Если 200 ОК, то из индекса не ЧПУ будет вылазить очень долго. Я бы 301 сделал.. пусть склеят их поисковики.
aryanatha, а как вы себе представляете реализацию такого инструмента? Если я вас правильно понял, у вас есть список сайтов и список ссылок. Вы хотите проверить нет ли на этих сайтах таких ссылок? То есть для этого необходимо обойти все страницы сайта, собрать с них все ссылки, и потом, сравнить с вашим списком. Обход всего сайта технически очень сложен, попробуйте хотя бы воспользоваться инструментом "Карта сайта", поставив четвертый уровень вложенности...
Поэтому, я могу предложить только один способ решения вашей задачи: с помощью основного анализа CS Yazzle вы собираете все внешние ссылки на список сайтов ваших клиентов, а потом фильтром проверяете нет ли ссылок с интересующих вас сайтов.
mexboy, Яндекс вместо файла отдает "500 Internal Server Error", так что это не ошибка программы.
ilyaha, спасибо за отзыв :)
Имеется ввиду индексация ссылок в Яндексе? Через что проверяете: прямая выдача, XML запросы или SeoBudget? А как проверяете вручную? Свяжитесь лучше со мной через ICQ для быстрого решения вашего вопроса.
В данный момент мы существенно переделываем инструмент "Определение позиций". По срокам ничего сказать не могу, но, когда выйдет новая версия, в ней будет добавлена возможность ведения любого количества проектов, наблюдение за динамикой позиций и стабильная работа всего инструмента в целом.
1). Исправим в будущем.
2). В инструменте есть возможность включить опцию "Статистика по точно указанным фразам"
3). Даже 200 - это уже много. Не один живой человек никогда не дойдет до 20 страницы выдачи ПС. Наличие сайта или страницы в выдаче поисковой системы вы можете узнать, проверив их на индексацию. Какую полезную информацию вы, как оптимизатор, извлечете из того, что будете знать: ваш сайт на 100500 месте в выдаче?
ParserYa добавил 09.03.2011 в 11:05
CS Yazzle 4.8.1.2800 доступен для скачивания. В новой версии:
Кроме поисковиков там и другие настройки: глубина, вывести только позиции сайта.. Повторю, напишите мне в ICQ. Так будет удобнее и вам, и мне.
В каком формате сохраняете? Какие параметры у вас выбраны для анализа. Можете написать мне в ICQ 271-963-864 для быстрого решения вашей проблемы.
$str = 'текст1[HEADER]текст2[CUT]текст3';preg_match_all('#(.*)\[HEADER\](.*)\[CUT\](.*)#is',$str,$result);print_r($result);
Соответственно, в массиве $result будут все лежать нужные вам тексты.
Выложил исправленные источники. Если у вас отключено автоматическое обновление, вы можете открыть Сервис->Параметры->Источники и нажать "Обновить источники".
Еще, стоит учесть, что объем HTML кода страницы Яндекса увеличился. Убедитесь, что в Сервис->Параметры->Сеть максимальный размер загружаемой страницы выставлен минимум 300 Кб.
Добавим в следующей версии.