Как правильно напарсить базу гест

Dmytro
На сайте с 04.06.2008
Offline
89
3801

Только учусь парсить гугл на гесты, юзаю AGRESS Parser и Hkey Free. Пока юзаю для парсинга запросы однотипных гест: inurl:"gbook.php?a=sign", inurl:"guestbook.php?a=sign", для улучшения качества выдачи использую -"error", "error 404", -"warning" и т.п. Сейчас вот прочел о поиске новых гест:

Где искать новые типы гестов? Обычно я использовал два метода :
1) В интернете часто распостраняются готовые гостевые книги, а раз они распостраняются значит они массовые, т.е. для всех, то есть многие их себе устанавливают на разные сайты и т.д. Просто качаешь эти гесты заливаешь на фришник и смотришь на что они оканчиваются, а потом это окончание смотришь в гугле, если большая выдача значит имеет место ее собирать, небольшая - значит эти книги не пользуются популярностью и собирать их нет особого смысла.
2)Можно искать новые типы гестов в бэках у конкурентов, все может и говорят типо некрасиво и т.д., но очень и очень многие так делают, хотя имхо лучше комбинировать первый и второй способы.

Стоит ли искать новые типы гест для парсинга или можно ограничиться стандартными ? Как часто нужно обновлять базу ? Стоит ли парсить яху, мсн, альтависту и т.п., или можно ограничиться гуглом ?

Далее, по качеству самой базы. Как её нужно фильтровать, помимо чека на дубли ? Массовый чек на ПР и выбирать пиаристые, или есть ещё какие-то варианты фильтра ? Какого объема базы стоит добиваться для нормального выведения доров в топ ? Если найдется кто-то, кого не затруднит составить небольшую табличку соотношения количества гест в базе и их PR, чтобы вывести примерно одинаковую эффективность большего кол-ва гест с меньшим PR и меньшего кол-ва гест с большим PR, например, так:

200к гест PR 1-2

100к гест PR 3-4

30к гест PR 5-6

ну и т.д., надеюсь, мысль изложил ясно. Заранее благодарю за ответы :)

S
На сайте с 13.07.2007
Offline
56
#1

Гммм.

а) ну из фильтров - ноуиндекс, ноуфоллоу.

б) ну и не надо забывать про скорость прироста бэков.

А на табличку никто заморачиваться не будет (на достоверную).

Dmytro
На сайте с 04.06.2008
Offline
89
#2

Спасибо, буду разбираться с фильтрами. Насчёт скорости прироста не совсем понял, уточните, пожалуйста. Табличку дали на другом форуме:

p.s. люди, вы бы хоть написали, чем же моя тема не угодила. Вроде бы ничего криминального не написал . . . 😕

dino_spomoni
На сайте с 09.06.2007
Offline
624
#3

Табличка старая, сейчас по-моему по другому подсчет идет. По крайней мере у меня для PR3 одной ссылки с сайта PR5 явно не хватает.

#1 ФАРМ партнёрка, API, 80%+ АПРУВ! Мега крутой конверт, льем всю фарму! -> https://bit.ly/3EvLxX8 | Лей фарму на Zombie Team - будет много $$$! -> https://bit.ly/42u3nE6 | PharmEmpire - ТОП Конверт фарма трафика!!! -> https://clck.ru/QrgKx | TOП ФИН/ТРЕЙДИНГ офферы!!! -> https://bit.ly/3ULkfEE
cBooM
На сайте с 03.11.2006
Offline
31
#4

меня тоже интересует эта тема и хочется спросить:

solnikolay:

а) ну из фильтров - ноуиндекс, ноуфоллоу.

ведь ноуиндекс и ноуфоллоу прописаны в коде, а не в тексте ... разве обычный -"noindex" поможет ?

Высококачественный кастомайзинг (редизайн + русификация) тем для WordPress. Смешная цена. (/ru/forum/comment/4374174).
jonn22_v2
На сайте с 29.08.2007
Offline
22
#5
Успешный старт в АНГЛ дорах. (http://www.jonn22.com/sp/index.php?productID=189)
ciber
На сайте с 04.01.2008
Offline
215
#6

Достал ты уже своим спамом.

П.С. Я у тебя покупал регер. Он не пашет, обещали переделать, но уже пару месяцов нет результата...

jonn22_v2
На сайте с 29.08.2007
Offline
22
#7

2ciber

Достал ты уже своим спамом.

По моему на этом форуме я вообще редко появляюсь, не то что спамлю.

Во первых зачем тут не по делу?

Во вторых стукни в аську, софт регулярно обновляется.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий