LEOnidUKG

LEOnidUKG
Рейтинг
1776
Регистрация
25.11.2006
Должность
PHP
Интересы
Программирование
beginerx:
ай-пи не хватает потому банить, замучаются новые покупать...

Смешно 😂

юни:
Да хоть раз в столетие. Задача стоит именно так - создать "кодонезависимый" парсер (выдача - лишь одно из прикладных применений).

Чудес не бывает. Я понимаю, что хочется помечтать, но жизнь диктует свои правила.

Хочу трубы, которые не прорывали!

Хочу дерево, которое не ломалось!

Хочу одежду, которая не снашивалась!

и т.п.

юни:

А что с интерпертацией js? Решаемо?

Смотря какой, если можно разобрать по кусочкам то не вопрос. Я очень редко вижу, ту информацию, которую не возможно взять, в основном все беспокоятся, чтобы инфа была в ПС, поэтому всё доступно в HTML так или иначе.

---------- Добавлено 30.09.2012 в 01:18 ----------

юни:
Сколько времени уйдёт на расклад по полочкам функционала скрипта mc.yandex.ru/metrika/watch.js?

У меня она заблокирована, поэтому в платный раздел или на фриланс, может кто займётся.

---------- Добавлено 30.09.2012 в 01:19 ----------

p.s. пока этим заниматься мне лично некогда, я тут как консультант с опытом работы :)

И вообще, без регулярок, пжалста.

А брать информацию он будет с помощью магического шара! Потрёшь его, скажешь запрос и вся информацию лежит уже на столе.

В чё там вёрстка то меняется часто? По-моему 1 раз в год.

---------- Добавлено 30.09.2012 в 01:12 ----------

Хотя кстати можно, подрубить API от ПС и работать с ними.

Dash:


Все клики по ссылке "купить" и указанием цены.
Почему не покупают?

Обложка понравилось или название вспомнили, тыкнули, описание почитали и потом скачают с торрента.

Спарсю с любой защитой :D

Обращайтесь.

---------- Добавлено 30.09.2012 в 01:05 ----------

vandamme:
видал в магазах на разных страницах товара идет разная html разметка, естественно парсить их будет сложно

Ой ну сколько там?

Ozone у каждого отдела своя вёрстка, 20 костылей и всё ок.

Ebay чуть по-меньше 7 мь костылей.

---------- Добавлено 30.09.2012 в 01:06 ----------

ivan-lev:
Любой десктопный (delphi, c++ builder/.net и тд) парсер, в котором используется компонент "веб-браузер" (или аналогичный) выполнит любой js,ajax-запрос и может даже мышкой поводить. :)
Кроме того, есть скрипты для браузеров (вроде обезьянки для файрфокса) и для ОС (AutoIt, к примеру). Да, часть парсеров на такой проверке отвалится... Однако, если "ну очень надо будет" - разобраться с логикой ajax-запроса (в любом случае, код доступен) и curl-ом отправить можно и из консольки/скрипта...

Я вас умоляю 🍿

Зачем такие сложности? Открываем сохранённую копию из гугла и парсим в своё удовольствие.

xegen:
хотелось бы узнать как скоро после прогона будет виден результат ? И у кого нибудь после такого прогона повысился тиц? или PR ?

Индексация проходит в течении 1,5 - 2 месяца. Тиц и PR я не гарантирую, поэтому смысла о нём писать нет.

Через безопастник снеси дрова на видюху, возможно они что-то начали сбоить.

Потом видюху желательно тоже проверить, ибо она может перестать работать с расширинными дровами.

базы данных, отстрел всех проданных стволов и занесение в базу экспертизы

Да, в тут даже нет единой базы населения и приезжих, куда там за всеми стволами и магазинами.

Да плевать яндексу и другим ПС на ваши IP

Grandifer:
но это первый и главный критерий. На этом весь алгоритм гугловский основан

Вау! Вот это да! А мы то тут думаем, как продвигать под гугл!

т.е. у вас выдача в гугле идёт по уровню PR?

Всего: 31516