Автогенератор каталога ссылок/сайтов

12
Continental
На сайте с 23.07.2005
Offline
48
899

подскажите плиз, какие виды бывают и как и на чем это делается. Суть в том, что переодически нахожу ссылки на свой сайт с каких-то каталого/помоек, где много сайтов, причем, даже ссылок на внутренние страницы. Есть заголовки и описания, выдернутые непойми откуда, но иногда цивильно. Это робот делает? Как? У меня кое-что идет по rss с сайте, но я не уверен, что это делается имеено так... Самое интересное, что посещаемость таких сайтов резко возрастает за счет этого каталога. Собственно, я хочу нечто вроде замутить - чтобы быстро и эффектно. в к-ве предета разгора кину ссылку с примером сайта (который используе то, о чем я пишу), а мне хотелось бы узнать как он (Сайт) это делает... =) теориии плиз, и практики.

Continental.
Avelon
На сайте с 05.07.2004
Offline
319
#1

такие сайты банятся по первому стуку

Continental
На сайте с 23.07.2005
Offline
48
#2

хм... тогда себе не буду ставить... и все-таки за что?

я тут посмотрел: сайту чуть больше месяца, но у него больше 1000 уников, несколько десятков тысяч страниц, и это уже не первый сайт это фирмы. =)

как это называется и почему за это банят? если собирать главные страницы сайтов, то это нормально, а если внутренние то это бан? если главные тоже бан?

P
На сайте с 08.07.2004
Offline
80
#3

Avelon, за что банить то?

есть красивый диз, структура, информация... а как она собрана - это не так уж и важно... Они ж не воруют ничего.

- Работать негры, солнце еще высоко! - Это не солнце - это луна... - А мне по!
Continental
На сайте с 23.07.2005
Offline
48
#4
Paninaro:
Avelon, за что банить то?
есть красивый диз, структура, информация... а как она собрана - это не так уж и важно... Они ж не воруют ничего.

лично меня напрягает сворованное название статьи, и так же абзац текста из нее. это как называется? еще меня напрягает уже около 5 ссылок с подобных сайтов, три из которых используются одинх и тот же скрипт ворования... 😂

P
На сайте с 08.07.2004
Offline
80
#5

Continental, если контент выдается по RSS, то они ничего не воруют. Ты сам предоставил им возможность взять его, к тому же ссылка то идет к тебе на сайт.

Можно в личку хотя бы один сайт. Просто интересно что же это за скрипт ворования :-)

Continental
На сайте с 23.07.2005
Offline
48
#6
Paninaro:
Continental, если контент выдается по RSS, то они ничего не воруют. Ты сам предоставил им возможность взять его, к тому же ссылка то идет к тебе на сайт.
Можно в личку хотя бы один сайт. Просто интересно что же это за скрипт ворования :-)

так если бы он как RSS выдавался, а выдается совсем не то, что выдает rss, а куски несвязанного текста... RSS - это когда название, адженда (или как там ее точно не знаю), и ссылка на источник. просто я пока не могу понять принцип, поэтому и спрашиваю каковы технологии этой весчи.

p.s. пример сайта отпавил, я таких еще тучу нашел...

P
На сайте с 08.07.2004
Offline
80
#7

Continental, ну скрипт, то скорее всего какой нить каталог.

а вот в базу они складируют наверное чем то самописным.

Скрипт берет титл и дескрипшн и все это складирует в базу. Вряд ли в открытом доступе такое код есть, но написать несложно. Сложней заставить его ходить по нужным сайтам.

Скорее всего идет по поиску в Яндексе подряд :-)

ЗЫ: на бегуне чуваки рубят немеряно стопроцентов :-)

ЗЗЫ: Самое интересное что буквально неделю назад я сам о таком задумался :-) правда немного для дургих целей.

ЗЗЗЫ: Сайты бегуна меня в последнее время просто убивают. Они вообще не фильтруют источник трафа :-( лишь бы количество хостов нужным было!

Continental
На сайте с 23.07.2005
Offline
48
#8

да не какой он не самописный, если на нем десятки сайтов работают... интерфейс везде одинаковый, внешний вид тока чуток различается, но самое главное, что содержимое каталого везде одинаковое как вы сказали - тайтл, дескрипшн (с большой вероятностью).

вот тут говорит, баннят, а оказывается, такие сайты бегун берет!

подскажите, что за скрипт и какие нехорошим словом это называется?

P
На сайте с 08.07.2004
Offline
80
#9

Прверьте кому домены принадлежат. Скорее всего на одно лицо зарегены.

Если содержание одинаковое, то наверное одна база используется.

Сам скрипт то вывода - ессно какой то скрипт каталога, я уже написал. А вот граббер - неизвестно какой, имхо самописный.

Соберите все в кучу и в суппорт Яши - забанить должны! Ибо если таких сайтов море - наглеж млин.

Continental
На сайте с 23.07.2005
Offline
48
#10

тема интересная, т.к. на каталоге ссылок в к-ве приложения к сайту (не обмменник, а почти что белый каталог) можно тучу уников, единственное, что надо тучу времени, чтобы эти сайты найти, и вручную добавить... т.к. пускать на самотек - это долго, а запускать граббер, о котором Вы пишите, теперь я понял, что это две разные вещи: каталог и его наполнение =)) - так вот второе по крайней мере неэтично. посмотрю подробнее сайты, баннить - пусть другие этим занимаются, мне тока плюс - лишние ссылки. =) я недавно видел предложения одного перца который "делал сайты" подобного рода (ну, он думаю, ручками вбивал, но ОЧЕНЬ быстро и ОЧЕНЬ некачественно описания... и тайтлы, туда и смотрел наверна), а потом их продавал как "сайт такого=то тематики, стока то сотен баксов". =)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий