хз
1000 хз
Claremont добавил 07.10.2009 в 18:50
Забыл про ЧПУ. ЧПУ в виде ключевика не всегда то что нужно.
Навороты? Текста просто много написал а так пару-тройку тегов, работа с ключевиками и учет ботов, вроде все. Но это всего лишь мои предложения насчет доргена, учитывать их или нет дело автора. Да и зачем тебе заказывать платную упрощенную версию если дорген и так упрощенный получается? Упрощенный но универсальный, делай хоть дор хоть сдл :)
В общем постарался внести свои 5 копеек в развитие пирожка. А потом можно скинутся вместе на хорошего лингвиста который поможет написать свою генерацию текста ничем не уступающую яндекс рефератам. Аля генерация Енгелса )))
1. Карта дорвея в дизайне дорвея. Пока не успел реализовать...
2. Веб-Админка (в виде панели учета)
3. Возможность менять расширение страниц
4. Категории (привет Трансформерам)
5. Возможность указывать конфиги для доменов.
6. Синомайзинг текста.
Что могу добавить? Вроде все четко, хотя все таки попробую.
1. Процент стронгов. Думаю над этим можно особо не заморачиваться и поставить рандомный
процент в промежутке 15-50%. Хотя желательно указывать в конфиге.
2. Не помню кто предлагал но идея хорошая:
Неплохо сделать [STR-N] - случайная строка из файла str-n.txt, где n - номер файла. или
[STR-N] - вставка содержимого файла полностью, где n - номер файла.
Лучше и то и другое (но первое необходимо)
3. Для категории в рб транформере есть замечательные теги и они универсальны, т.е. больше
ничего придумывать не нужно если они будут реализованы здесь. Вот они:
Макросы для категорий
[MENU-X-Y] — урлы меню создаются из списка категорий, где Х – первый порядковый номер
категории в списке, а Y – последний, естественно не меняется на всех страницах(то есть при 0-4
получаем 5 первых урла категорий)
[CAT] – категория для текущей страницы
[CATURL] – урл категории с анкором для текущей страницы
[CATURLCLEAR] – урл категории без анкора для текущей страницы
[CAT-N] – строчка из списка категорий, N – номер строчки категорий
[CATURL-N] – урл категории с анкором, N – номер строчки категорий
[CATURLCLEAR-N] – урл категории без анкора, N – номер строчки категорий (для создания например
такого тега <a href=”[CATURLCLEAR-N]“><img src=”http://вашдомен/images/[RAND-1-40].jpg”></a>)
[RANDCATURLCLEAR] – рандомный урл категории
[CATS] — список урлов категорий
[RANDCAT] — рандомная категория
[RANDURLCAT] — рандомный урл категории
4. Кеи:
Я бы добавил в config.php следующие переменные для кеев:
- 1. shuffle_keys = false
Что будет делать эта функция если включена:
Допустим у нас в папке с кейями есть 5 фалов с кеями не привязанные к доменам, т.е. они не
называются site.ru.txt а допустим 1.txt, 2.txt и т.д. а доменов-алиасов у нас штук 10, при этом
дорген возьмет по два раза каждого файла с кейвордами для генерации дорвея (образно выражаюсь,
понятно что рандом) и на них будет одинаковый сайтмап так как файлов с кейвордами меньше чем
доменов (доров). Если эта функция включена каждый раз при генерации нового дорвея кеи в файлах
будут перемешиваться.
Конечно может это и не нужно и можно всего лишь по колдовать над генерацией сайт мапа, но по моему
перемешивание все таки полезная штука во избежание еще ряда проблем. Можно эту функцию не
добавлять в конфиг а просто сделать по умолчанию.
P.S. Я плотно не тестировал дорген, возможно сайтмап и так генерится уникальный.
- 2. number_of_keys = 800:1100:random (number_of_keys = false)
У нас есть файл с 40к кеями и мы не хотим делить его на более мелкие, для этого копируем в
папку с кеями всего один файл со всеми кеями и включаем в конфиге number_of_keys, которая
указывает на количество кейвордов для каждого дорвея. number_of_keys = 800:1100 т.е. каждый дор
будет иметь количество страниц в промежутке 800-1100, при этом кеи будут выбираться из большого
файла поочередно или рандомно. При включенном number_of_keys переменная shuffle_keys становится
не актуальной (игнорируется).
Эти две переменные для кеев актуальны только если файлы с кеями не распределены по конкретным
доменам, т.е. не называются dor.ru.txt Если встречаются такие файлы с кеями внутри папки с кеями
то автоматически игнорируются оба переменных именно для этих файлов.
5. Картинки:
Картинки можно заюзать привычным способом аля img[RAND-7-70].jpg, но мне не нравится когда
картинки так называются и это по моему выглядит не естественно. Мне больше нравятся настоящие
названия картинок а не нумерованные. Можно сделать новый тег [RIMGFF=img] расшифровка - random
image from folder = img. Тег будет выводит случайные картинки с указанной папки не меняя при этом
их названий. Т.е. названия картинок в указанной папке не обязательно должны быть по маске а могут
иметь произвольное название типа pamelu_opyat_snyali_goluyu034_76311.jpg :)
P.S. Админка по моему все таки не нужна, и учет доров не нужен и т.д. И так все настройки через
конфиг файл. Если очень хочется сделать панель (админкой трудно его назвать) можно сделать
отдельный продукт не привязанный к доргену, там пусть будет и учет, количество проиндексированных,
адурилка и все такое :)
6. Любимые боты :)
Тут решение, конечно уверен ваше будет более креативней.
<?
if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; I')){ $bot='Yandex.I';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; D')){$bot='Yandex.D';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; H')){$bot='Yandex.H';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; P')){$bot='Yandex.P';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; F')){$bot='Yandex.F';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; M')){$bot='Yandex.M';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'YandexBlog')){$bot='YandexB ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'YandexSomething')){$bot='YandexS ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Googlebot')){$bot='Google ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'google')){$bot='google ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'StackRambler')){$bot='Rambler ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Yahoo! Slurp')){$bot='Yahoo ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'yahoo')){$bot='yahoo ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Msnbot')){$bot='MSN ';}
else if (strstr($_SERVER['HTTP_USER_AGENT'], 'msn')){$bot='msn ';}
if($bot !=""){
$b_data = "lyubimie-boti.txt";
$day = date("d.m.Y",time());
$time = date("H:i",time());
$home = $_SERVER['HTTP_HOST'] . $_SERVER['REQUEST_URI'];
$data = fopen($b_data, "a");
fwrite($data, "$day $time |$bot| -> $home \r\n");
fclose($data);
}
?>
Вопрос:
[RTEXT-x-y] - Вставляет указанное кол-во строчек из файла с текстом. Чистый текст.
[KTEXT-x-y] - Вставляет указанное кол-во строчек из файла с текстом и разбавляет текущем кеем.
Эти два тега вставляют указанное количество строчек из текстового файла или всетаки указанное
количесто предложений? Если предложений то отлично, так как одновременно можно юзать и
генерированный текст (включена функция генерации текста по рб) и копипаст а также текст без
ключей. Но если эти два тега втавляют именно СТРОЧКИ то мне не понятно зачем они нужны. Конечно
можно отредактировать текстовку таким образом что бы каждое предложение начиналось с новой
строчки но это лишний гемор :)
Категории обязательны, виртуальные папки тоже (htaccess). Как-нибудь вечером помечтаю на тему идеального доргена :)
Нагрузка будет во время индексации, т.к. только тогда они будут генерироватся. Насчет нагрузки не стоит беспокоится, кеширование спасет. Да и волков бояться - в лес не ходит, для чего придумали вдс и дедикейтед?
Синонимизация не нужна, это уже точно повалит сервер. А насчет 404 согласен. И сайтап конечно статичный должен быть а то тоже повалит серв :)
Вы сами покупали там?
А в чем смысл юзать одни и те же прокси из паблика? Я имел ввиду платные http прокси.
Где доставать прокси для адурилки?
Неужели разница в выхлопе на столько велика что вы пошли по "черному" пути?
Куда добавляет яндекс ваш сайт? Ага, правильно! В очередь индексации. А в очереди нужно ждать :)