franplas

Рейтинг
33
Регистрация
20.05.2006
zangzezi:
версия программы 1.07.4pre
при попытке загрузить данные с яндекса выдает вот такую ошибку

System.Net.WebException: Время ожидания операции истекло в System.Net.HttpWebRequest.GetResponse()

Проблем с интернетом и входом в панель вебмастера в тот момент не наблюдалось

В корне, при ошибке создается файл Ошибка Яндекса.log. Попробуйте выйти из яндекса.

В настройках есть чек «укороченное подключение к яндексу» попробуйте с ним.

Теперь о главном.

Выложил обновление v1.08.

Исправил ошибки в урл яндекса c &.

Ошибки с первым сайтом быть не должно, первым показывается «Все», тестил на хр sp3.

Основные изменения в парсере.

На всякий случай добавил кодировку ISO-8859-5. Декодировки анкоров типа &#dddd;, улучшил механизм сохранения. Добавлена возможность перепроверки данных, кликните правой кнопкой и выберите перепроверить, на анкоре будет возможность изменить кодировку, если анкор не читаем поиграйте кодировками. Корявые данные возможны, так как программа сначала определяет кодировку сервера, при отсутствии смотрит в мета.

Версия с инсталлятором, файлы программы.

думаю:
Как дела у прогги?

Все ОК. Скоро будет обновление. Появятся дополнительные функции у парсера и исправятся ошибки.

sabotage:
Обращаю внимание! Возможно, вы неправильно обновляете программу.
Во всяком случае неправильно обновлял ее я.

В текущей версии есть две доп. библиотеки - xmlutil.DLL и WindowsFormsDataGridViev.DLL. Лучше всего скачать версию с инсталятором, установить и далее по желанию (напр., скопировать на флешку).

Траблы:
1. Слабая фильтрация анкоров (скрин)
2. Для первого сайта нет истории (оба exe'шника пробовал - последний предложенный и в инсталяторе)
3. Сохранненые результаты парсинга (dataparser.xml): в урлах, содержащих & вот такой косяк:

<url>http://www.site.ru/index.php?go=p1&amp;amp;to=p2&amp;amp;name=p3</url>

4. Не смог получить ссылки с сапы - "Ошибка открытия файла проекта".

В обновлении могут быть ошибки, так как ведется работа, некоторые изменения не всегда совместимы с предыдущими версиями, для установок лучше использовать инсталлятор, сейчас о работает корректно, не создает дублей программы в панели управления а заменяет новые файлы.

1. При получении анкоров ориентируюсь на кодировку сервера, если ее нет то мета страницы, бывают они противоположны. С &# думаю справлюсь.

2. Странно, у меня в хр с новым работает. Первым в списке сайтов должно стоять «все» у вас так? В файле project\имя проекта\sites.xml все данные, <Host> и <Name> не пустые?

3. Это отдача яндекса. Спасибо, сразу не заметил, поправлю.

4. Сейчас парсер, кроме кодировки, нормально работает, при повторном просмотре?

6simvolov:
Сайты все отображаются. Не отображаются данные первого сайта в проекте.
при "Получить данные" получаются данные для всех проектов кроме первого (судя по статусу под фразой "Обработка").
Пробовал и в XP и в vista

Вообще странно для висты, на ней у меня все идет корректно, по этому и выкладываю рабочие версии. Установил вертуал студио с XP. В XP вижу ошибку, видимо они net по разному обрабатывают. Выложил yal.exe с исправленной ошибкой первого сайта. Погонял на XP все пашет и парсер тоже, данные сохраняет и выводит. Стоит XPsp3 net устанавливала программа(3), т.е. все с нуля.

Если проверить наличие из в панели вебмастера можно YAL.

Обновил программу. Основное изменение коснулось проблем возникших на ХР.

Изменил хранение данных в парсере и сайтах проекта. У кого ХР напишите, возникают ли проблемы с отображением сайтов проекта, все ли всегда отражаются и в парсере, при повторном открытии данных все сохраненный данные отображаются.

Парсер отображает в данных по анкорам все возникшие ошибки, при повторном прогоне, если отмечен чек (в настройках) проверять ошибки программа повторно получает данные для исправления ошибок.

Теперь все сортируется кликая по заголовкам в обоих направлениях.

Версия с инсталлятором, файлы программы.

SeM.seo:
у меня просто вылетает с ошибкой при запуске.

xp sp2

Стоит ли Net и какая ошибка?

sabotage:
2. сейчас скину
3. да, все есть. имхо, что-то с алгоритмом.

Со всем понятно, кроме отображения только первого анкора.

1. Если все данные в dataparser заполнены, при повторном открытие отображаются данные на всей строке(анкор, pr Тиц…)?

2. Что написанно в остальных страках?

3.При установки «Задердки» в 0 отображается сразу все или медленно(получает из сети)?

4.Если после получения кликнуть (дважды) на другую дату, а потом на туже самую и «получить данные» парсера, что отображается?

sabotage:
Начал работу с нуля. Создал проект, получил сайты. Обновить беки нельзя, кнопка неактивна и только что созданный проект не показан в окне проектов. Появляется после перезапуска.

Запустил парсилку. Анкоры остались кривые (см. скрин). После перезапуска и эти анкоры пропали, остался только первый, остальные - пустое поле. Также очистилась остальная информация (pr, тиц), но она есть в файле dataparser.xml.

Вобщем, есть над чем работать ;)

1. Проблема та же, что и с черным экранов при закрытии- ХР не поддерживает, поправлю.

2. Кодировка анкора чикается из meta charset, а отображается windows-1251, посмотрите есть ли charset у этих страниц. Так как читается поток определить кодировку можно либо из заголовка ответа сервера либо из html. Скиньте урл кривых страниц, посмотрю.

3. dataparser.xml содержит все данные?

sabotage:
franplas, апнули незаметно. Сейчас попробуем. ;)

К сожалению форум объединил с предыдущим постом.

Всего: 150