Программка определения позиций сайта

P0
На сайте с 22.08.2008
Offline
43
#171

victim, уже сделал запрос авторизации ;)

Теперь надо собрать в кучу то, что есть:

- тИЦ, PR, количество проиндексированных страниц в обоих поисковиках... (БУДЕТ)

- прокси с авторизацией (БУДЕТ)

- сортировка по алфавиту и обратно, без сохранения, может быть с сохранением, но база данных будет другая или делать патч (БУДЕТ)

- загрузка популярности ключевиков (НЕ БУДЕТ)

Что забыл, comments are wellcome.

Platon007 добавил 27.11.2008 в 19:57

mr.mixer:
сделайте возможность поиска в Яндексе по регионам

Эта возможность реализована не будет ввиду отсутствия возможности в текущей архитектуре программы.

SESpider - бесплатная порграмма для определения позиций сайта (http://sespider.ru/) Полезные SEO курсы (http://www.academir.ru/)
victim
На сайте с 12.02.2006
Offline
189
#172
Platon007:
victim, уже сделал запрос авторизации

Вероятно не дошел. А может и дошел, вы для проверки какое нибудь сообщение отправьте.

Platon007:
тИЦ, PR, количество проиндексированных страниц в обоих поисковиках... (БУДЕТ)

Ок, хорошо. В обоих это в каких? Давай сделаем Яндекс, Рамблер, Гугл, Яху

Platon007:
- прокси с авторизацией (БУДЕТ)

Полезно, но лично я не юзаю.

Platon007:
- сортировка по алфавиту и обратно, без сохранения, может быть с сохранением, но база данных будет другая или делать патч (БУДЕТ)

Сортировка - обязательная вещь. Сохранение/несохранение это ты о чем? Сохранение сортировки? Тогда не надо, это же только для более удобного восприятия глазом, так что не думаю что будет сложным тыкнуть один лишний раз мышкой на заголовок столбца, а в размерах БД сэкономим.

Platon007:
- загрузка популярности ключевиков (НЕ БУДЕТ)

Не столь важно. Так что нормально.

Ждемс релиза ;)

CheckTrust.Ru (https://checktrust.ru/) - новый сервис для проверки ТРАСТа и заСПАМленности сайтов.
P0
На сайте с 22.08.2008
Offline
43
#173

Сортировку добавил.

Platon007 добавил 28.11.2008 в 15:20

victim:
Сохранение/несохранение это ты о чем?

Дело в том, что ключевые фразы идут на проверку в той очереди, в которой они находятся в списке. А если список составлен и необходимо добавить важную фразу, и чтоб ее в самом начале анализа обрабатывало. Это я имел ввиду.

Platon007 добавил 28.11.2008 в 18:23

Прокси с авторизацией готова.

victim
На сайте с 12.02.2006
Offline
189
#174
Platon007:
Дело в том, что ключевые фразы идут на проверку в той очереди, в которой они находятся в списке. А если список составлен и необходимо добавить важную фразу, и чтоб ее в самом начале анализа обрабатывало. Это я имел ввиду.

Я про сортировку уже после сбора результатов. Вот!

PS Купил Yazzle, но там проверка позиций занимает мильен лет...так что генерацией идей для этой проги буду заниматься все равно. И пользоваться тоже буду!

P0
На сайте с 22.08.2008
Offline
43
#175

☝ Остается найти мат помощь!

victim
На сайте с 12.02.2006
Offline
189
#176
Platon007:
Остается найти мат помощь!

В виде мотивации? Ну я думаю что если реализовать все качественно, то что запланировано и добавить что то "эдакое" то можно сделать символическую плату например в 5-10$ за копию.

Но платного дофига уже есть...а вот бесплатных хороших программ меньше.

Так что остается работать преследуя идею а не деньги ;)

memphis
На сайте с 16.03.2008
Offline
71
#177

Программа пригодилась, давно искал нечто подобное. Огромное спасибо автору!

Get the best, fuck the rest.
SeOzon
На сайте с 21.07.2007
Offline
44
#178

Автору паука мегаблагодарность! То, что доктор прописал☝

SeOzon добавил 02.12.2008 в 09:21

Platon007:
☝ Остается найти мат помощь!

ps Помощь в путиии ))

Создание web сайтов. Оптимизация и продвижение web проектов.Копирайтинг. Контекстная реклама.
P0
На сайте с 22.08.2008
Offline
43
#179

Всем добра утро.

Поступили жалобы на то, что невозможно скопировать списки ключевиков и прочего в беффер.

Также был проявлен интерес к возможностям программы использовать настраиваемые движки поисковых систем.

В итоге, что в новом релизе:

+++ У программы появилась иконка, чему я несказанно рад. Осталось только титульник придумать.

+ Появилась новая версия конфирурируемого парсера результатов запросов ПС (ниже подробней)

+ копировать данные можно из всех списков, копировать данные из таблиц и вставлять, скажем в Excel, все данные будут раскинуты по нужным ячейкам.

- найдено отсутствие менеджера паузы между запросами в конфигурируемом парсере. Устранено.

О новой версии конфигурируемого парсера.

Давно меня попросили сделать конфигурируемый парсер. Я сделал. Но он не мог конкурировать с некоторыми другими настраиваемыми парсерами.

Тогда я решил написать более удобную версию. Что получилось:

файл инсталяции подкладываем в корень программы.

install.xml


<seinstall>
<item>
<name>TUT.by</name>
<id-name>tut.by</id-name>
<class-name>ru.vingrad.platon.sespider.ConfigurableSpider2</class-name>
<requests-per-period>1</requests-per-period>
<period>4000</period>
</item>
</seinstall>

Файл настройки поисковика conf_spiders2/tut.by.cfg

conf_spiders2 - это папка!!!


query=http://search.tut.by/?status=1&encoding=1&page={POSITION}&how=rlv&query={QUERY}
regexp=<li>\\s*<h3>\\s*<a href="{SITE}">.*?</a>\\s*<a href=".+?" target="_blank">{TITLE}</a>.*?</h3>{DESCRIPTION}<br>
items-per-page=15
query.encoding=windows-1251
query.units=PAGE
content.encoding=windows-1251

Как видим, число переменных слегка уменьшилось.

По порядку:

query - строка запроса, как она написана в браузере. В ней есть 2 настраиваемых переменных:

{POSITION} - позиция (страница или абсолютная позиция) с которой начинается выдача

{QUERY} - фраза-запрос поисковику

regexp - регулярное выражение, которое подходит одной позиции выдачи.

Переменные:

{SITE} - ссылка на страницу сайта.

{TITLE} - заголовок страницы сайта.

{DESCRIPTION} - наиболее релевантная часть страницы сайта.

items-per-page - количество позиций на странице (по умолчанию 10)

query.encoding - кодировка, в которой отправляется запрос. (для русскоязычных чаще всего windows-1251)

query.units - Единицы, в которых измеряется переменная {POSITION} в строке запроса query. Bvttn 2 значения: PAGE и ABSOLUTE.

Пример:

google.ru просит работать в терминах аболютных значений (ABSOLUTE), т.е. первая страница - 0, вторая - 10, третья - 20 и т.д...

rambler.ru просит работать в терминах страничных (PAGE). т.е. первая страница = 0, вторая = 1, третья 2 и т.д...

content.encoding - кодировка текста страницы. Поле крайне необязательное, если сервер шлет в заголовках кодировку сайта, что чаще всего бывает. но вот tut.by предлагает работать с meta тегами, эти случаи надо вбивать эту переменную.

Обратите внимание на регэксп!!! Символы экранирования также экранируются!!! Специфика Java Properties файлов.

[Удален]
#180

Platon007, обновы так и не выложили!

на сайте все еще 14-я версия

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий