А что же с титлами пр.. ?
Везде одно-и-тоже...
Непорядок..
Парсить можно все что угодно.
Другое дело - как.
Одно дело, когда сайт сам предоставляет информацию в xml, а другое дело, когда он не предоставляет - Вам придется парсить html.
забейте кусок из их новости в яндексе - все станет ясно.
Полгода назад сессия не привязывалась к ip по умолчанию (эту опцию можно включить). Читай - не привязана у 80 % пользователей.
Не думаю, что что-то изменилось.
Перехватив глобальную куку (т.е. относящуюся ко всему домену) сможете войти под аккаунтом человека на любой (почти) из сервисов. И действовать от его имени до тех пор, пока не истечет срок действия сессии. А он не истечет до тех пор, пока вы будете проявлять активность под этой сессией.
P.S. немножко пространно изначально сформулировал - под "глобальной кукой" имелось ввиду то, что авторизационная кука устанавливается для домена вцелом и может быть прочитана с поддомена в том числе.
Так что именно Вам нужно?
погода - weather.yahoo.com можно использовать
курсы валют - rbc.ru
и т.д.
Придумали. Можно и с картинками забирать.
Новости какого региона Вам нужны? И какого рода новости?
Так и забивайте - "Новости Владивостока"
RSS также относится к XML как "яблоня" к "дерево" :)
Как и обещал:
http://talk.mail.ru/ - xss уязвимость при обработки одной из ошибок. Позволяет выполнить любой JavaScript - таким образом можно без проблем получить глобальную куку пользователя mail.ru
Поиск уязвимости занял где-то минут 20...
Разработчиков не оповещал. Ибо у них этих уязвимостей предостаточно - куда не копни.
Если кому интересно - спросите подробнее в личку - в паблик не буду выкладывать.
Кроме бегуна есть еще гугл, а теперь, вот и яндекс...
Так привел же Вам решение - как можно сделать в такой ситуации robots.txt разный для разных доменов.
по запросу конкуренция практически отсутствует.
бюджет:
Заказ прогона по каталогам - от 20 до 100 $ (единовременно)
ну, для верности можно еще 3-4 морды купить - еще баков 80
Понимает.
Только при этом "распознанность" пропадает. - глючит иногда.