http://ru-net-biz.ru/index.php/2010/11/26/nebolshoe-obnovlenie-parsera-i-mini-urok/
Крайняя версия в блогролле.
Есть у него доры не адалтные, по билетам, займам и страховкам. Просто вбейте в google низкочастотник с региональной привязкой к городу США и здесь бабулеровские доры и встретите. Или сляпанные по его технологии - на поддоменах инфошек.
В США президент и республиканцы договорились - по Евроньюс только-что передавали. Так-что ожидать 2 августа смысла больше нет.
А если парсить не непосредственно Google, а к примеру выдачу с aol.com?
Вообще, отлично с файлами таких и много больших размеров справляется EmEditor. На древнем компьютере с гигагерцевым процем и 512 Мб оперативки редактирует и заменяет гигабайтных размеров файлы.
Доходы русскоязычных по-обыкновению много ниже англоязычных, что способно сказаться отрицательно.