preg_match_all("/<li class=\"raz\">([^\/>]*)[^>]*<\/li>/U", $file1, $file2);
Вот так можно...
С биллингом - все зависит от того, насколько он гибким должен быть.
Если туда еще автоприем оплаты прособачивать...
Вещи необходимые, бесспорно, но давайте туда еще форум прикрутим, новости проекта, систему внутренних сообщений, разработаем оригинальную capcha,
будем палить кто из пользователей в каких тематиках специализируется => сможем продавать информация о действиях конкурентах, их планах и интересах = > будем продавать функцию защиты от предыдущей функции...
Насчет самоконтроля - тут, возможно, потребуется доп. тестирование - ибо яндекс - система сторонняя и, в некоторых случаях - непредсказуемая.
Нагрузку увеличивают и увеличивают ;)
Ну при такой нагрузке proxy особо не покатят (такое кол-во живых прокси с хорошей скоростью - нереально - проще ip купить), а на XML точно разоритесь:
по 10К$ будет выходить только за XML - ибо 800 000 запросов * 30 * 0,1 р/ за запрос = 2.4 млн руб. / мес - не вариант вообще.
Вот ip адресов накупить - уже более реалистичный вариант:
16 ip - 20$/месяц:
800000 / 3000 (вроде столько разрешает яндекс до бана IP, но точно не знаю - видел цифру в форуме)*20/16 = 340 $ баков в месяц - только на IP
Однако, вариант не сильно надежный (побанить яндекс может, даже и всю подсеть) - довольно рисковано, как и любой "подпольный" с точки зрения яндекса вариант.
При такой нагрузке добавьте еще сервера + солидный входящий траф.
В результате - программная реализация получается одной из самых дешевых частей проекта.
Так что не в это тут все упирается.
Никто не будет за это столько платить.
Имхо, проще продавать скрипт или использовать клиента+сервера, где клиент устанавливается на сервере клиента сервиса (вот загнул-то ).
Иначе - реализация будет слишком дорогой.
А тут и нагрузка-то вся вынесена наружу.
Сервис сервису рознь.
siteposition.ru не сильно нагружен, но сервис.
Все дело в лимите по ip у яндекса - тут уж либо XML, либо прокси, либо купить необходимое кол-во ip (что, в общем-то не так дорого) - опять же - вполне решаемо.
В зависимости от кол-ва/типа рюшечек ;)
Если то что описано - получение на отчетов по позициям в разных поисковиках на мыло - то вполне можно и за неделю.
Другое дело - смотря на какую аудиторию рассчитывать сервис - если там не будет лимита и туда весь форум будет ходить - то придется жестоко заморачиваться с проксями/или xml (что тоже вообщем-то не проблема).
Конкретных цифр лично у меня нет, именно экспериментов специальных не проводил.
Но по личному опыту - влияет ощутимо.
Даже на форуме обсуждалось вроде бы.
Ну уж насчет 10к$ Вы загнули.
Максимум - неделя для хорошего программиста. (со всеми рюшечками типа аналитики и пр).
Иконки тут ни при чем.
Просто ya.ru - "облегченный поиск" - там никогда их и не было ;)
Основной минус - у Вас везде в сниппете будет "найден по ссылке" => кликабельность будет меньше.
Остальное - уже мелочи.
Не понятно - почему?
Вернее - с чего Вы взяли?
У меня вот великолепно завелось на nix-овом сервере...
Или это Вы так сформулировали условия распространения скрипта?
Думаю, вполне полезно было бы добавить сортировочку - хотя бы средствами JS.
Если еще актуально приложите код, пожалуйста, нормально - а то эти смайлики выковыривать из него не хочется...