Хм... надо подумать такого я не ожидал...
stardg добавил 04.03.2009 в 08:08
Да это косяк в следующем релизе будет исправлен - конечно же 37 млн. страниц
stardg добавил 04.03.2009 в 08:13
А можно узнать страничку откуда сей пассаж был взят? Может фраза в на страничке выглядет цельной, а реально там разметка какая?
stardg добавил 04.03.2009 в 08:19
По поводу IP.... загружаешь список проксей в программу и она случайным образом отправляет каждый запрос через прокси....
Пишите если можно примеры "странных" пассажей и в каких поисковиках это проявляется (а лучше страницы из которых берутся пассажи)... Дело в том что я во время разработки не мог проверить весь интернет.... потому работал в основном по самым своим знакомым страничкам....
т.е. 2-3...
stardg добавил 04.03.2009 в 08:20
Ого... Гугл чтоли тоже стал роботов гонять? Раньше только яндекс это любил вроде....
stardg добавил 04.03.2009 в 08:23
Я категорически сомневаюсь что имею хоть какое то отношение к данной тормознутости....
У вас ОСь 64 битная чтоле (судя по процу 64)... я незнаю как это будет на 64 биной системе работать - даже проверить неначем....
stardg добавил 04.03.2009 в 08:26
Уважаемые пользователи работы ведутся! Спасибо всем кто присылал результаты тестирования!
Просто некоторые ошибки весьма неоднозначны и на их выявление надо много времени. Но ожидания будут вознаграждены!!!
Йа уже тут!!
🙅
И жду результатов тестирования от Вас!
Пишите будем править вместе!
stardg добавил 25.02.2009 в 19:12
Непонимаю суть проблемы... можно подробнее - на личных примерах?
P.S. Дублируйте свои замечания на stardg@mail.ru задачи более оперативно в таск-лист упадут!
Сейчас готовится новая версия сего продукта. Все вышеуказанные косяки и хотелки будут учтены. Есть такой вопрос .... может кто по интерфейсу чтонибудь дельное предложит? как было бы удобнее, быстрее и интуитивнее? А то пишем тут пишем GUIню всякую, а необходимо и достаточно например в консоле прогу запускать.....
Сам не раскрутчик... потому незнаю 😕
P.S. Кстати о прокси.... в новой версии реализую работу не через браузер, а через голое HTTP, туда проксю навесить несложно, а вот в текущей версии если у вас Internet Explorer ходит в инет через проксю, то и прога должна делать также.... ибо она полностью использует все настройки IE.
Ну почему же нельзя.....
Способ 1:
На страничке "Источник" - "вставить текст" .... вставить только тот кусок текста какой вам надо.... и плясать уже от него.
Способ 2:
На страничке "Запрос" в окошке "Исходные данные для запроса" удалить всё что на ваш взгляд лишнее...
Способ 3:
На страничке "Запрос", выбрали поисковики выбрали метод (пассажи или шинглы), нажали кнопку "Выполнить запрос", появилось окошечко "Процесс выполнения запросов"... в нем нажимаем не "Начать", а "Отмена" - окошко "Процесс выполнения запросов" закрывается....
И мы видим перед собой текстовое окошечко "Пассажи или шинглы" - где весь контент уже представлен разбитый на пассажи или шинглы.... Грохаем там всё что кажется лишним и тыцкаем на кнопку "Выполнить запрос" снова.... Кстати в хелпе описано.
stardg добавил 20.08.2008 в 11:08
Ответы:
Yandex.XML - так называется потому что у него выдача в XML-формате, что собственно вы и видите при нажатии на результат запроса.
1) В данный момент Нет! Надо посоветоваться с Praide может стоит сделать парсер XML-контента, но как тут всем угодить? Комуто может именно XML-контент и нужен 😕
2) Ну значит в гугле такого контента нету.... когда нажимаете на "нолик" в результатах то должны увидиеть что отправлялось в гугль и как он ответил.... если выдача действительно пуста, то на нет и суда нет.
3) Нет. Достаточно один раз зарегать свой IP-шник в яндексе.XML. Он приходящие запросы будет по этому IP-шнику унифицировать а не по логину паролю....
4) Нет. Регистрация IP действует только на XML-сервис. Обычный Яндекс, через какоето время начнёт "отстрел роботов".
Любой каприз за ваши деньги 🚬
Всем доброго времени суток!
Как разработчик программы, постараюсь прокомментировать некоторые замечания и ответить на некоторые вопросы.
По поводу низкой скорости относительно ВЕБ-версии. Действительно в программе после каждого запроса делается задержка от 0,3 до 1 секунды, иначе поисковики (Особенно Яндекс.неXML) банят IP.
По поводу того, что сайты открываются только в IE. Тут к сожалению сказалось отсутствие нормальных табличных компонентов (не БДшных), потому пришлось строить табличку результатов в окошке IE. Подумаю, может что в руки попадет сделаю качественнее, а пока если проблемма с открытием мозилой стоит остро, могу посоветовать щелкнуть на табличке правой кнопкой мыши, открыть исходник странички, сохранить его как ХТМЛ-файл куданить на жесткий диск, а потом открыть его Мозилой.
По поводу, нечитаемого хелпа - переделаю.
Жду ещё замечаний ☝