Так к делу.. внешние ссылки они не страшны - страшно куда они ведут :)
Вам один черт придется решать эту проблему, и как то мониторить профиля..
power_play, это у вас что типа табов, переключаемые вкладки по одному и томуже адресу(URL)?
Чем выше релевантный контент относительно страницы, тем луче. Как правило "описание товара" в табах должно идти выше остального контента(если у вас СЕО текст описании) затем все остальное(характеристики, отзывы).
A007MP, потом еще по крону проверять каждый час ответ сервера на 200 OK? на проверку 10к профилей скоко ресурсов надо?
Господа, не вариант ссылку пробивать. Сейчас страница жива а через час 404.
Когда внутренние ссылки ведут на 404, то это плохо, однозначно. А внешние скорее всего ничего страшного(хотя вес уходит непонятно куда).
Как вариант сделать ссылки через javascript
<a href="javascript:document.location.href='http://profile.go/'">profile</a>
altezzik, хороший плагин, не знал о нем..
Раньше приходилось так делать:
<?php $wp_root = $_SERVER['DOCUMENT_ROOT']; require_once($wp_root."/wp-load.php"); require_once(ABSPATH.WPINC."/post.php"); define('db_host', "localhost"); define('db_user', "root"); define('db_pass', ""); define('db_table', ""); define('db_charset', "utf8"); set_time_limit(0); $db = mysql_connect(db_host, db_user, db_pass); mysql_select_db(db_table, $db); mysql_query("set names '".db_charset."'"); $sql = mysql_query("select * from `wp_posts`"); while ($row = mysql_fetch_assoc($sql)) { $parent_post_id = $row['ID']; $post_content = $row['post_content']; if (!preg_match("#<img[^>]+src=[\"']?http://([^/]+)/([^\"']+)#i", $post_content, $match)) continue; $host = strtolower($match[1]); if (strcmp(strtolower($_SERVER['HTTP_HOST']), $host) !== 0) continue; $pinfo = pathinfo($match[2]); $filename = $wp_root."/".$match[2]; $filetype = wp_check_filetype(basename($filename), null); $attachment = array( 'guid' => "http://".$host."/".$match[2], 'post_mime_type' => $filetype['type'], 'post_title' => $pinfo['filename'], 'post_content' => '', 'post_status' => 'inherit' ); $attach_id = wp_insert_attachment($attachment, $filename, $parent_post_id); require_once(ABSPATH . 'wp-admin/includes/image.php'); $attach_data = wp_generate_attachment_metadata($attach_id, $filename); wp_update_attachment_metadata($attach_id, $attach_data); set_post_thumbnail($parent_post_id, $attach_id); echo("<pre>add attach to post_id: {$parent_post_id}</pre>"); flush(); } ?>
Целиком страницу и не надо http://randomword.pythonanywhere.com/get/4/10 JSON данные с приведенного вами из примера сервиси.
Параллельно заносите уникальные слова к себе в БД для дальнейшего локального использования.
А проще взять скан какова нибудь шедевра, откинуть стоп слова и напарьсмить к себе в БД
mega94, Вам вроде предлагали уже заюзать http://phantomjs.org/ зачем темы плодить?
Средствами PHP вы не выполните JS код.
Другое дело когда данные подгружаются AJAX-ом и эти запросы явно видно(можно отследить).
То что по вашей проблеме генериться на стороне клиента JS машиной а сам скрипт формируется на сервере этим framework-ом http://docs.kissyui.com/
Maxkup, Удалите плагин и сами составляйте post_name, берите основной посыл статьи в ЧПУ
"Никита Михалков предложил создать канал для молодых режиссёров" to "mikhalkov-predlozhil-kanal"
ORIGAMMI, Убрать то что выделил жирным RewriteRule ^(.*)$ http://newsite.ru/site_10089.html/$1
RewriteEngine On RewriteCond %{HTTP_HOST} ^(www\.)?site\.ru$ [NC] RewriteRule ^(.*)$ http://newsite.ru/site_10089.html [R=301,L] RewriteRule ^(([^/]+/)*[^.]+)$ /$1.html [L]
fackest1, вставить надо после строки RewriteEngine on и вместо domen.ru свой домен.
Малость исправлено:
Перенаправление будет без слеша на конце.
RewriteCond %{REQUEST_URI} !^/page/ RewriteRule ^([^/]+)/\d+/?$ http://domen.ru/$1 [R=301,L]
Про page(пагинацию) так и не понял у вас ее вообще нет чтоли?