Claremont

Claremont
Рейтинг
92
Регистрация
17.03.2009
хз ... пусть без ника:
утопия )

123

хз

1000 хз

Claremont добавил 07.10.2009 в 18:50

Забыл про ЧПУ. ЧПУ в виде ключевика не всегда то что нужно.

хз ... пусть без ника:
чувствую придётся заказывать автору платную облегчённую версию без всяких этих наворотов (

Навороты? Текста просто много написал а так пару-тройку тегов, работа с ключевиками и учет ботов, вроде все. Но это всего лишь мои предложения насчет доргена, учитывать их или нет дело автора. Да и зачем тебе заказывать платную упрощенную версию если дорген и так упрощенный получается? Упрощенный но универсальный, делай хоть дор хоть сдл :)

В общем постарался внести свои 5 копеек в развитие пирожка. А потом можно скинутся вместе на хорошего лингвиста который поможет написать свою генерацию текста ничем не уступающую яндекс рефератам. Аля генерация Енгелса )))

1. Карта дорвея в дизайне дорвея. Пока не успел реализовать...

2. Веб-Админка (в виде панели учета)

3. Возможность менять расширение страниц

4. Категории (привет Трансформерам)

5. Возможность указывать конфиги для доменов.

6. Синомайзинг текста.

Что могу добавить? Вроде все четко, хотя все таки попробую.

1. Процент стронгов. Думаю над этим можно особо не заморачиваться и поставить рандомный

процент в промежутке 15-50%. Хотя желательно указывать в конфиге.

2. Не помню кто предлагал но идея хорошая:

Неплохо сделать [STR-N] - случайная строка из файла str-n.txt, где n - номер файла. или

[STR-N] - вставка содержимого файла полностью, где n - номер файла.

Лучше и то и другое (но первое необходимо)

3. Для категории в рб транформере есть замечательные теги и они универсальны, т.е. больше

ничего придумывать не нужно если они будут реализованы здесь. Вот они:

Макросы для категорий

[MENU-X-Y] — урлы меню создаются из списка категорий, где Х – первый порядковый номер

категории в списке, а Y – последний, естественно не меняется на всех страницах(то есть при 0-4

получаем 5 первых урла категорий)

[CAT] – категория для текущей страницы

[CATURL] – урл категории с анкором для текущей страницы

[CATURLCLEAR] – урл категории без анкора для текущей страницы

[CAT-N] – строчка из списка категорий, N – номер строчки категорий

[CATURL-N] – урл категории с анкором, N – номер строчки категорий

[CATURLCLEAR-N] – урл категории без анкора, N – номер строчки категорий (для создания например

такого тега <a href=”[CATURLCLEAR-N]“><img src=”http://вашдомен/images/[RAND-1-40].jpg”></a>)

[RANDCATURLCLEAR] – рандомный урл категории

[CATS] — список урлов категорий

[RANDCAT] — рандомная категория

[RANDURLCAT] — рандомный урл категории

4. Кеи:

Я бы добавил в config.php следующие переменные для кеев:

- 1. shuffle_keys = false

Что будет делать эта функция если включена:

Допустим у нас в папке с кейями есть 5 фалов с кеями не привязанные к доменам, т.е. они не

называются site.ru.txt а допустим 1.txt, 2.txt и т.д. а доменов-алиасов у нас штук 10, при этом

дорген возьмет по два раза каждого файла с кейвордами для генерации дорвея (образно выражаюсь,

понятно что рандом) и на них будет одинаковый сайтмап так как файлов с кейвордами меньше чем

доменов (доров). Если эта функция включена каждый раз при генерации нового дорвея кеи в файлах

будут перемешиваться.

Конечно может это и не нужно и можно всего лишь по колдовать над генерацией сайт мапа, но по моему

перемешивание все таки полезная штука во избежание еще ряда проблем. Можно эту функцию не

добавлять в конфиг а просто сделать по умолчанию.

P.S. Я плотно не тестировал дорген, возможно сайтмап и так генерится уникальный.

- 2. number_of_keys = 800:1100:random (number_of_keys = false)

У нас есть файл с 40к кеями и мы не хотим делить его на более мелкие, для этого копируем в

папку с кеями всего один файл со всеми кеями и включаем в конфиге number_of_keys, которая

указывает на количество кейвордов для каждого дорвея. number_of_keys = 800:1100 т.е. каждый дор

будет иметь количество страниц в промежутке 800-1100, при этом кеи будут выбираться из большого

файла поочередно или рандомно. При включенном number_of_keys переменная shuffle_keys становится

не актуальной (игнорируется).

Эти две переменные для кеев актуальны только если файлы с кеями не распределены по конкретным

доменам, т.е. не называются dor.ru.txt Если встречаются такие файлы с кеями внутри папки с кеями

то автоматически игнорируются оба переменных именно для этих файлов.

5. Картинки:

Картинки можно заюзать привычным способом аля img[RAND-7-70].jpg, но мне не нравится когда

картинки так называются и это по моему выглядит не естественно. Мне больше нравятся настоящие

названия картинок а не нумерованные. Можно сделать новый тег [RIMGFF=img] расшифровка - random

image from folder = img. Тег будет выводит случайные картинки с указанной папки не меняя при этом

их названий. Т.е. названия картинок в указанной папке не обязательно должны быть по маске а могут

иметь произвольное название типа pamelu_opyat_snyali_goluyu034_76311.jpg :)

P.S. Админка по моему все таки не нужна, и учет доров не нужен и т.д. И так все настройки через

конфиг файл. Если очень хочется сделать панель (админкой трудно его назвать) можно сделать

отдельный продукт не привязанный к доргену, там пусть будет и учет, количество проиндексированных,

адурилка и все такое :)

6. Любимые боты :)

Тут решение, конечно уверен ваше будет более креативней.

<?

if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; I')){ $bot='Yandex.I';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; D')){$bot='Yandex.D';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; H')){$bot='Yandex.H';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; P')){$bot='Yandex.P';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; F')){$bot='Yandex.F';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Win16; M')){$bot='Yandex.M';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'YandexBlog')){$bot='YandexB ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'YandexSomething')){$bot='YandexS ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Googlebot')){$bot='Google ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'google')){$bot='google ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'StackRambler')){$bot='Rambler ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Yahoo! Slurp')){$bot='Yahoo ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'yahoo')){$bot='yahoo ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'Msnbot')){$bot='MSN ';}

else if (strstr($_SERVER['HTTP_USER_AGENT'], 'msn')){$bot='msn ';}

if($bot !=""){

$b_data = "lyubimie-boti.txt";

$day = date("d.m.Y",time());

$time = date("H:i",time());

$home = $_SERVER['HTTP_HOST'] . $_SERVER['REQUEST_URI'];

$data = fopen($b_data, "a");

fwrite($data, "$day $time |$bot| -> $home \r\n");

fclose($data);

}

?>

Вопрос:

[RTEXT-x-y] - Вставляет указанное кол-во строчек из файла с текстом. Чистый текст.

[KTEXT-x-y] - Вставляет указанное кол-во строчек из файла с текстом и разбавляет текущем кеем.

Эти два тега вставляют указанное количество строчек из текстового файла или всетаки указанное

количесто предложений? Если предложений то отлично, так как одновременно можно юзать и

генерированный текст (включена функция генерации текста по рб) и копипаст а также текст без

ключей. Но если эти два тега втавляют именно СТРОЧКИ то мне не понятно зачем они нужны. Конечно

можно отредактировать текстовку таким образом что бы каждое предложение начиналось с новой

строчки но это лишний гемор :)

Категории обязательны, виртуальные папки тоже (htaccess). Как-нибудь вечером помечтаю на тему идеального доргена :)

Восток:
1. Если в наборе доргена есть 404 и механизм выдачи этой странцицы, значит нужно чтоб этот механизм работал правильно

3. У меня на денвере загрузка процессора подскакивает до 30% за генерацию одной страницы (тестовка 150кб). Если пустить паука на дор (teleport ом выкачать к примеру) думаю будет очень большая нагрузка => палево => наш хостер обратит на нас внимание...

Пункты 4 и 5 комментировать не буду. Я например хочу иметь возможность в любой момент исполнить php код на странице. Добавил в шаблон <?php include("bottom.php"); ?> и можешь в любой момент изменить код редиректа, поставить счетчик там или еще чего. Синонимайзер вещь полезная, тебе не нужно, не значит что всем.

Нагрузка будет во время индексации, т.к. только тогда они будут генерироватся. Насчет нагрузки не стоит беспокоится, кеширование спасет. Да и волков бояться - в лес не ходит, для чего придумали вдс и дедикейтед?

Синонимизация не нужна, это уже точно повалит сервер. А насчет 404 согласен. И сайтап конечно статичный должен быть а то тоже повалит серв :)

Вы сами покупали там?

Squadblr:
Ну это пипец вопрос 😂 первоклассник даже наверное это знает.
Клац
http://www.proxy4free.com/page1.html
http://www.proxylist.net/

А в чем смысл юзать одни и те же прокси из паблика? Я имел ввиду платные http прокси.

Где доставать прокси для адурилки?

Неужели разница в выхлопе на столько велика что вы пошли по "черному" пути?

Куда добавляет яндекс ваш сайт? Ага, правильно! В очередь индексации. А в очереди нужно ждать :)

Всего: 587