Конкретно "что не работает"?
RewriteRule ^ru/data/(\d+) ru/data/page.php?page=$1 [L]
добавить в htaccess корня сайта (/var/www/site.ru/.htaccess)
За то она явно прибавится на mysql, и неизвестно что хуже. Тем более что на mysql не хватает инструментов для такого поиска.
Кодировки -> преобразовать в UTF-8 без BOM
и заменить collation в файле
если после импорта крокозябры, проблема значит в инструменте импорта, либо с кодировкой дампа намного сложнее.
Тогда нет смысла мучать mysql когда в посте могут быть и другие ссылки. Дергать все и обработать на php.
Ну или установить PCRE функции
В стандартном REGEXP нет поддержки утверждений.
Можно что-то типа WHERE post_content LIKE '%href="%' AND post_content NOT REGEXP 'href="https?://(www\.)?(google\.ru|yandex\.ru)'
либо установить udf расширение preg https://github.com/mysqludf/lib_mysqludf_preg#readme---------- Добавлено 13.07.2013 в 11:57 ----------
На сколько много, тысячу, десять тысяч?...
Про вашу "тему" уже все забыли на втором сообщение, и давно не является темой обсуждения. :)
Да, интересный прием с утверждением, ставить пробел если до конца строки повторяется шаблон из трех цифр.
http://www.google.ru/search?client=opera&rls=ru&q=%D1%82%D0%B0%D0%B9%D0%BC%D0%B0%D1%83%D1%82+php&sourceid=opera&ie=utf-8&oe=utf-8&channel=suggest
http://habrahabr.ru/post/134784/#comment_4478804
vasyakrn, http://ru.wikipedia.org/wiki/Cron#crontab осилите?
Только не забывайте, что вызов через крон это сродни вызова из command line (CLI php)