dantess

dantess
Рейтинг
133
Регистрация
06.11.2004

preg_match_all("/<li class=\"raz\">([^\/>]*)[^>]*<\/li>/U", $file1, $file2);

Вот так можно...

Zlo:
Сорри за OFF, но сдержаться не могу

dantess,
Эх, нравятся мне ваши рассуждения, готов залатить 10к если Вам это удасться сделать даже за 2 недели... Нагрузка следующяя 2 000 проектов 800 000 запросов в сутки (имеется в виду запрос на получение страницы и т.д.)... Ну я думаю как профессионалу в разработке таких проектов понятно, что необходима система самоконтроля, биллинга ну и все остальное...

С биллингом - все зависит от того, насколько он гибким должен быть.

Если туда еще автоприем оплаты прособачивать...

Вещи необходимые, бесспорно, но давайте туда еще форум прикрутим, новости проекта, систему внутренних сообщений, разработаем оригинальную capcha,

будем палить кто из пользователей в каких тематиках специализируется => сможем продавать информация о действиях конкурентах, их планах и интересах = > будем продавать функцию защиты от предыдущей функции...

Насчет самоконтроля - тут, возможно, потребуется доп. тестирование - ибо яндекс - система сторонняя и, в некоторых случаях - непредсказуемая.

Нагрузку увеличивают и увеличивают ;)

Ну при такой нагрузке proxy особо не покатят (такое кол-во живых прокси с хорошей скоростью - нереально - проще ip купить), а на XML точно разоритесь:

по 10К$ будет выходить только за XML - ибо 800 000 запросов * 30 * 0,1 р/ за запрос = 2.4 млн руб. / мес - не вариант вообще.

Вот ip адресов накупить - уже более реалистичный вариант:

16 ip - 20$/месяц:

800000 / 3000 (вроде столько разрешает яндекс до бана IP, но точно не знаю - видел цифру в форуме)*20/16 = 340 $ баков в месяц - только на IP

Однако, вариант не сильно надежный (побанить яндекс может, даже и всю подсеть) - довольно рисковано, как и любой "подпольный" с точки зрения яндекса вариант.

При такой нагрузке добавьте еще сервера + солидный входящий траф.

В результате - программная реализация получается одной из самых дешевых частей проекта.

Так что не в это тут все упирается.

Никто не будет за это столько платить.

Имхо, проще продавать скрипт или использовать клиента+сервера, где клиент устанавливается на сервере клиента сервиса (вот загнул-то ).

Иначе - реализация будет слишком дорогой.

А тут и нагрузка-то вся вынесена наружу.

oLL:
Сервис - значит для многих. Проблема - именно в нагрузках при сканировании сотен проектов и десятков тысяч запросов. (еще раз - ключевое слово СЕРВИС)

Сервис сервису рознь.

siteposition.ru не сильно нагружен, но сервис.

Все дело в лимите по ip у яндекса - тут уж либо XML, либо прокси, либо купить необходимое кол-во ip (что, в общем-то не так дорого) - опять же - вполне решаемо.

oLL:
И вы можете вышеописанное сделать за неделю? Даже - "максимум за неделю"? :)
Если ДА - закажу. Неделя - это клево. Со всеми рюшечками.

В зависимости от кол-ва/типа рюшечек ;)

Если то что описано - получение на отчетов по позициям в разных поисковиках на мыло - то вполне можно и за неделю.

Другое дело - смотря на какую аудиторию рассчитывать сервис - если там не будет лимита и туда весь форум будет ходить - то придется жестоко заморачиваться с проксями/или xml (что тоже вообщем-то не проблема).

Pancake:
dantess, Как сильно это может повлиять на кликабельность? Проводились ли эксперименты, есть какие либо данные?

Конкретных цифр лично у меня нет, именно экспериментов специальных не проводил.

Но по личному опыту - влияет ощутимо.

Даже на форуме обсуждалось вроде бы.

Zlo:
адекватно оценить свои силы и финансовые возможности ибо такой продукт будет стоить от 10 килотонн американской валюты

Ну уж насчет 10к$ Вы загнули.

Максимум - неделя для хорошего программиста. (со всеми рюшечками типа аналитики и пр).

Megavolt:
возможно кэш для я и для яндекса разный, у первого например нет иконок.

Иконки тут ни при чем.

Просто ya.ru - "облегченный поиск" - там никогда их и не было ;)

Основной минус - у Вас везде в сниппете будет "найден по ссылке" => кликабельность будет меньше.

Остальное - уже мелочи.

mr.MAIL:
Есть одно НО: работает только на локалхосте.

Не понятно - почему?

Вернее - с чего Вы взяли?

У меня вот великолепно завелось на nix-овом сервере...

Или это Вы так сформулировали условия распространения скрипта?

Думаю, вполне полезно было бы добавить сортировочку - хотя бы средствами JS.

pelvis:
Код? Подалуйста:

Если еще актуально приложите код, пожалуйста, нормально - а то эти смайлики выковыривать из него не хочется...

Всего: 389