sokol_jack

Рейтинг
78
Регистрация
16.03.2008
ossadchy:
Все проще, в принципе не такая уж проблема получить список всех площадок сапы(при желании и наличии соотв. тех. возможностей)...

У меня есть желание и тех возможности. А вот список всех площадок (в том числе тех, которые временно не принимают ссылки, с закрытыми урлами...) получить не удается. Ну, закрытые урлы еще ладно, влили 10к и разослали заявки, дождались подтверждения, забросили в базу ID=URL. А вот остальные? Ы? ;)

LEOnidUKG:
Парни Вы ближе к вечеру, что курите а? :)

Похоже этот вопрос - вам.

По теме, боты не создают сессию и куки тоже не принимают. Они им просто не нужны :)

Боты сессию не создают. Более того, юзер тоже сессию не создает.

Сессию создает сервер (ваше приложение на сервере, сайт). Создается она при обработке страницы. Поисковый бот запрашивает страницу? Запрашивает. Если у вас в коде есть session_start (или автоматом), то почему вдруг сессия не создастся?

Другой вопрос, как ведут себя боты, если не поддерживают куки (даже сессионные, что редкость, кстати). Ну, это при условии того, что cookiуless-sessions отключены.

bimcom:
Вот скажите - что с ваших сайтов сайтов "тырить" чтобы аж в 1000 потоков утаскивать ваши 500 страничек? Ну ладно 5000 страниц самописного уника? Это все в 1н поток уведется.
А вот в 10 - 100 - 1000 потоков парсится выдача яндекса, вордстат, статистика рамблера - т.к. тут уже количество материала измеряется десятками миллионов страниц и если тащить с 1го IP то пару лет можно прождать. Такчто будьте спакойны за свои сервера и молитесь чтобы их боты яндекса и гугла с рамблером не завалили.

Вот тут - полностью поддержу. 🍻

Кричат о "ай, нас положили парсеры" обычно владельцы ГС на 50 страниц на говнохостингах в оправдание перед самим собой за то, что ГС вылетел из индекса :)

sokol_jack добавил 20.03.2009 в 10:58

bimcom:
Там где многопоточности нет - приходится её придумывать :( Надеюсь скоро это изменится.

А чего надеятся? Просто юзать что-то "более другое", чем php ;)

eLS:
Артем, Вы ВОР - так оно и есть! А то что вы еще продаете и затем перепродаете краденое - это в двойне хуже.

Молодой человек, а зачем вы в этом посте /ru/forum/comment/4540760 своровали кучу моего контента?

Прямо начиная со слов "Ужас"... Не стыдно? 😆

eLS:
Ну а хрена тогда разводить народ!??? Покупают ведь - верят!

Вот блин, я старался, писал, а никто читать не хочет.

В чем именно состоит "развод"?

А че не ТС ВОР - ворюга? вор - что ни на есть самый настоящий!

Расскажите тогда, что же он своровал? И почитайте мой пост насчет произведений полученых компоновкой.

А, и насчет ЯКи почитайте. Про ДМОЗ вобще молчу :)

eLS:
Вы обманываете так:
1. Покупатель верит, в то что он может извлечь прибыль
2. Вы обманываете в запросах - так как по такой же технологии создаются сайты (пример видели, за контактами не обращайтесь). Т.е. за 1 бакс мне предлагали такой же ГС
3. По сути вы являетесь Вором контента.

Ужас :)

1. Покупатель верит в то, во что хочет верить. Верят люди, что сат за 200 у.е. с копирайченым контентом, дизом хорошим и т.д. будет жить долго и счастливо и принесет 100к у.е. на сапе 😂 - и пусть себе верят. Как и покупатели "сайтов" на ******** 10 штук на у.е....

ТС же не заявляет (гарантирует), что 100% такой сайт попадет в индекс и принесет вам минимум 100 .у.е?

2. В каких запросах обман? Нифига не понятно. Можете такие сайты за 1у.е. производить - отлично. Производите. Или продавайте за 2... Мне например проще самому подобное написать (нашару) :)

3. О как. Тайтлы да дескрипшены ворует? :))

Почитайте кстати насчет авторских прав на произведения, полученные упорядочиванием и компоновкой.

Да, кстати, Яшка-то - ворюга! У него в ЯКе мало того, что тайтл да дескрипшн моего сайта, так еще (не поверите!) и url своровал! :D

Вот не пойму о чем все спорят? Не нравится продукт - не покупайте. Можете сделать дешевле - делайте... Или вам надо за 14у.е. еще и гарантии вида "полный манибек, если хоть 1 страница не попадет в индекс в течении 3 дней"? :))

Постучался в аську.

Аедрей:
Создает ли сессии поисковый робот яндекса и прочие боты
Т.е. когда бот открывает страницы сайта... сессионные переменные работают?

Палю тему - сессии создает ваш сайт. У себя. На сервере. Продолжать?

aalexeev:
не все так однозначно...

господам отписавшимся выше известно что под googole.com
чистый html например ранжируется выше CMSного?

А что такое чистый html и как его от CMSного отличить? Неужто по расширениям файлов? :)

Константинович:
А почему бы не использовать для сателлитов чисто html? Можно их сделать с php include. Для СДЛ использую именно html + php include. Для сателлитов самое то :).

Научите как реализовать на html + php include "постепенное добавление" контента (распланировал на год вперед по странице в неделю, залил и забыл) - буду юзать :)

sokol_jack добавил 19.03.2009 в 11:57

FOXI.BY:
Но согласись, это, мягко говоря извращение...

Извращение - это когда СДЛьность сайта по CMS (или ее отсутствию) определяют.

Всего: 1527