digwnews

Рейтинг
79
Регистрация
09.07.2009
maxwell:
ТС, хочешь осложнить задачу - делай весь проект на JS фреймворке, да еще чтобы куча либ грузилась хрен знает откуда и зачем. Пропарсить будет крайне сложно и 99% любителей парсить забьют на это дело.

А потом появляются вопросы - почему сайт выпал из индекса и почему мой сайт грузится полчаса?

chemax:
я вставляю в каждую пятую строчку ссылку на статью. кто то режет, кто то нет. но ссылочное подросло)

Ну тут варианта два: если убрали ссылки, то убрали все, если не убрали, то не убрали ничего. Я всегда спарсенный контент прогоняю через strip_tags(), пока что я не видел ни одного сайта, на который у меня осталась бы ссылка. А на каждой пятой строчке ссылка - это жёстко.

Редирект можно многими способами сделать.

Напимер, с помощью header():

header(Location: page.htm)

От любого человека, знающего регулярки - никак нельзя защититься.

"Усложнить жизнь юзеру" не катит.

А капча против автопостинга. И можно эту проблему решить, наняв модератора, который будет просматривать весь добавленный контент.

Выложите сюда кусок sql где эта ошибка.

firefox19:
LEOnidUKG, подозреваю что Вы еще не отошли от полемики с предыдущим оппонентом.
Можно спокойно и более развернуто объяснить почему идея не сработает?

Я как-то особо не погружался в неё, но поймите - всё, что можно сделать с помощью браузера - может сделать и робот в авторежиме.

Вы опишите по-нормальному что нужно.

Из вашего первого поста я понял, что вам нужен парсер цен хостингов. Это так?

netwind:
у некоторых особо рьяных хостеров, установивших php5.3 его уже нет.
там же прям в документации сноска http://ru.php.net/manual/en/function.ereg.php
This function has been DEPRECATED as of PHP 5.3.0. Relying on this feature is highly discouraged.

А по-моему в php5.3 ещё работает.

firefox19:
структура товара:

при выводе можно с рандомной частотой подставлять в ссылки:

ссылку на страницу/картинку с информацией об источнике. Возможно даже структурировать как страницу "о товаре", чтобы для парсера был не отличим.
+ в особо "замороченных" случаях (если бояться сравнительного анализа и отсечения) можно сделать "о товаре" страницу-полиморф либо картинку с различными размерами

Не вижу проблем для парсера😂

Я тупо напишу регулярку, которая будет дёргать эти значения и всё.

firefox19:
кстати про парсеры, пришла такая идея:
есть к примеру каталог товаров (видео, ссылок и пр.), ссылки на которые идентичны по структуре (хоть md5-хэш id страницы в БД), но некоторые из них будут вести на страницу информации о сайте. Тогда при парсинге придется либо проверять все стопицот ссылок, либо некоторые из них будут вести на сайт-источник.
То же самое можно делать и с картинками: превью любое "настоящее", а некоторые ссылки с превью ведут на картинку с копирайтами или информацией о сайте-источнике.

Но это всего лишь сиюминутная идея, может кто-то ее разовьет и получит хорошую защиту от грабителей.

Мало что понял. Раскройте поподробнее...

Всего: 798