Новое в версии Autodor.SQLite.Wmsn v.2.0.7 от 15 ноября 2015:
1) Доработан клоакинг, добавлены новые данные для фильтрации.
2) Доработано своевременное срабатывание лимита страниц при ручном кешировании.
3) Доработана XML карта сайта (разбита на части для большого кол-ва страниц).
4) Исправлена циклическая переадресация при 404 ошибке с ЧПУ.
5) В .htaccess добавлен список User-Agent плохих ботов, для снижения нагрузки.
6) Новый функционал и параметры в конфиге:
$maxwords - максимальная длина ключевика (кол-во слов) при доп парсинге.
$manykey - оставлять переспам ключевика в контенте или чистить (понижать плотность).
7) Прочие мелкие исправления.
Для обновления с прошлой версии: просто заменить файлы .htaccess, index.php и log.php
Заменив .htaccess - заметно снижается нагрузка, т.к. мусорные боты не будут доходить до скрипта.
Если используете клоакинг, то log.php желательно заменить, старый обходится новым ботом яндекса.
Рассылку на емейл новой версии доргена и товарного фида сделал. Если не получили - проверяйте папку спам.
Nassa, раз тематика не прошла в кросспостинг, значит не судьба, не подойдет )
Nassa, это все потому, что мой кросспостинг не тестировали ))))
При бесполезной дискуссии думать не надо ) А код писать - это напрягаться, я на форум больше за расслаблением захожу. Вариант: загонять картинки вместе с стартовыми кеями вам не подходит?
Zegeberg, индекс быстробота живет 2-3 дня (сначало показывает часы, потом "вчера" и "позавчера"). Ну т.к. апы у яндекса стали не 2 раза в неделю, а вообще редко - то ясно дело вы замечаете выпадения.
Ну а если тенденция на ухудшение - то точно ждите полного обрубания быстробота, если сайт не в яндекс новостях конечно.
kxk, я это не планирую писать ) даже за доп плату. Не люблю писать бесполезные скрипты.
Zegeberg, а вам собственн очто хотелось? Этот принцип быстробота уже много лет. Вам вообще надо радоваться что у вас быстробот есть, и молиться чтоб его вам не отключили.
гугл, вконтакт, фейсбук - выгледят "не современно". И что? А то что дизайн и свистоперделки это не главное в сайте.
Можно напрямую парсить страницы. Всего то нужно решить проблему: правильное определение кодировки сайта. Ну и контент будет с кусками левого текста, потому что фиг напишешь такую умную логику как у яндекса по выдиранию именно основного контента страницы.
в доргене можно делать доп поля (столбцы). они там уже есть пустые. в них и добавляйте ссылки.
в шаблон вставить скрипт проверку типа if ($column1 == '') {берем рандомную картинку и записываем в это поле}