уникальный скрипт перелинковки

1 234 5
M
На сайте с 08.11.2006
Offline
39
#21

не используется ob_start или какие либо другие функции ob

Используется метод прокси (curl, socket, fileopen) - на выбор

Позволяет заменять любое выражение/контент на то что напишите (используется регулярное выражение для замен в блоках)

Регулярка обрабатывает только сниппет. (снижает затраты на ресурсы)

Контент делится на сниппеты

Скрипт может служить мощным кеширующим звеном. (хоть в memcache хоть в файлы)

Скрипту не важен движок (единственное условие это PHP и (curl, socket, fileopen) - на выбор)

Roof Builder (http://roof-builder.ru) - Сделай расчет кровли неутомительным MDinc - Блог о Drupal (http://mdinc.ru) - Блог разработчика. Для CMS Drupal. (модули, клиент-сервер технологии и.т.д.)
gamepark
На сайте с 09.02.2007
Offline
124
#22
Хортица:
Говорите ставится на любую CMS ? На ipb поставите ?

а ваш скрипт, который вы помнится продавали, встает на ИПБ?


ну ятож так просто проходил и спросил...

M
На сайте с 08.11.2006
Offline
39
#23
gamepark:
а ваш скрипт, который вы помнится продавали, встает на ИПБ?

ну ятож так просто проходил и спросил...

да встает да встает

gamepark
На сайте с 09.02.2007
Offline
124
#24

mdinc, Htracer у меня не встал корректно изза того, что форум старый и там балаган с кодировками в БД

а то, что в теории он встанет хоть куда - дак это понятно

M
На сайте с 08.11.2006
Offline
39
#25
gamepark:
mdinc, Htracer у меня не встал корректно изза того, что форум старый и там балаган с кодировками в БД

а то, что в теории он встанет хоть куда - дак это понятно

Дело не в теории а в реализации. Скрипт работает с готовым контентом и ему всеравно что ему нужно обрабатывать, хоть голый html, хоть скрипт на perl или php.

[Удален]
#26

вопрос замена по точной словоформе или с учётом морфологии запроса?

SeVlad
На сайте с 03.11.2008
Offline
1609
#27

1. Что значит "по принципу прокси"? Как это прокси имеет отношение с сайту?

Единственное, что я могу предположить - это кеширование. Но это к прокси не имеет отношение.

2. Если не кеширование, то как это на "любой" сайт? В разных сайтах\двиках и хранение и вывод данных организованно по разному. Куда-как вносятся изменения и как они появляются на сайте?

3. Ок, составили таблицу перелинковки - нагрузили хостинг (и хорошо, если хостинг справился, а если нет - что будет с сайтом?). Вечером я добавил пост (2, 3, 150000) - и что? Каждый раз перегенерять? А как насчёт сохранения\изменения "старых" ссылок (ранее сгенерённых).

4. Как насчёт релевантности?

5. Про морфологию тоже интересно.

и как следствие -

6. Поддерживаемые языки (и вообще зависимость от языков. Особенно на многоязычных сайтах).

7. Какие функции настроек? Задание исключений страниц\слов (регулярки?), настройки кол-ва линков на страницу и тд? Покажите админку (или конфиг, если без адмники).

sasa84:
А, ну и вот. Ваш раб/день 600 р стоит ? Или что-то похожее X*2 ~ 5000 р

А сколько копий Вы намереваетесь продать?

ЗЫ. Жадность - одна из главных причин провала продаж.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
M
На сайте с 08.11.2006
Offline
39
#28
SeVlad:
1. Что значит "по принципу прокси"? Как это прокси имеет отношение с сайту?
Единственное, что я могу предположить - это кеширование. Но это к прокси не имеет отношение.

Прокси - это когда на сайте стоит скрипт который вызывает тот же сайт. Кеширование может иметь несколько уровней.

Кеш всей страницы (те то что отрендерено), кеш сниппетов итд

SeVlad:

2. Если не кеширование, то как это на "любой" сайт? В разных сайтах\двиках и хранение и вывод данных организованно по разному. Куда-как вносятся изменения и как они появляются на сайте?

Абсолютно на любой сайт и абсолютно любой движок. Скрипту безразницы с каким движком иметь дело. Хоть голый html.

SeVlad:

3. Ок, составили таблицу перелинковки - нагрузили хостинг (и хорошо, если хостинг справился, а если нет - что будет с сайтом?). Вечером я добавил пост (2, 3, 150000) - и что? Каждый раз перегенерять? А как насчёт сохранения\изменения "старых" ссылок (ранее сгенерённых).

Скрипту всеравно сколько постов в вашей CMS. Ему вообще всеравно как много контента на вашем сайте. Скрипт единовременно работает только с одной отрендеренной страницей.

SeVlad:

4. Как насчёт релевантности?

Все зависит только от Вашей фантазии

SeVlad:

5. Про морфологию тоже интересно.

Все зависит только от Вашей фантазии. Скрипт работает с регулярными выражениями.

Те host-serv, hostme итд заменяется одной простой регуляркой host.*?

SeVlad:

и как следствие -
6. Поддерживаемые языки (и вообще зависимость от языков. Особенно на многоязычных сайтах).

скрипт работает с любыми кодировками. В тело скрипта встроено определение кодировки контента.

SeVlad:

7. Какие функции настроек? Задание исключений страниц\слов (регулярки?), настройки кол-ва линков на страницу и тд? Покажите админку (или конфиг, если без адмники).

<pre>

<?php

/**

* Настроечные переменные

*/

@define('RELATIVE_PATH', '/seo_linker');

@define('ALLOW_CONTENT_TYPE', 'text/html');

@define('FORBIDEN_TAGS', 'img, a, title, h1, h2, h3, h4, h5, h6, thead, ol, ul' .

'xmp, textarea, select, button, script, style, label, noscript, noindex, form');

// Страницы на которых разрешена работа скрипта (допускаются регулярные выражения)

@define('ALLOW_URI', '*');

// Страницы на которых запрещена работа скрипта (допускаются регулярные выражения)

@define('FORBIDEN_URI',

'/admin,

/edit,

/links,

update\.php,

install\.php,

^admin.*,

/rm_import/index\.php'

);

@define('SINGLE_TAGS',

'img'

);

// УВЕЛИЧИВАЕТ ВРЕМЯ РАБОТЫ СКРИПТА!!!

// Максимальное количесво замен

// Возможные значения: от 1 - до MAX (но рекумендуется делать большим)

@define('MAX_AMOUNT_REPLACES', 500);

// Длина с которой скрипт считает что это спиппет

// Возможные значения: от 100 - 1000

@define('ALLOW_STRING_LENGTH', 150);

/**

TODO:

Сделать возможность ограничения по кол-ву символов в сниппете

REPLACE_LIMIT_IN_SNIPPET_[100] - ([100] - кол-во символов в сниппете)

Пример:

@define('REPLACE_LIMIT_IN_SNIPPET_100', 1);

@define('REPLACE_LIMIT_IN_SNIPPET_500', 2);

@define('REPLACE_LIMIT_IN_SNIPPET_10000', 10);

*/

// Разрешенное кол-во замен в сниппете

// Возможные значения: от 1 - 10

@define('REPLACE_LIMIT_IN_SNIPPET', 1);

// Разрешенное кол-во замен одного и того же слова в сниппете

// Возможные значения: 1

@define('REPLACE_LIMIT_WORD', 1);

// УВЕЛИЧИВАЕТ ВРЕМЯ РАБОТЫ СКРИПТА!!!

// Разрешенное кол-во замен на странице

// Возможные значения: от 1 - 20

@define('REPLACE_LIMIT_WORDS', 15);

// УВЕЛИЧИВАЕТ ВРЕМЯ РАБОТЫ СКРИПТА!!!

// Максимальное кол-во сниппетов для обработки

// Возможные значения: 1 - MAX

@define('REPLACE_MAX_SNIPPETS', 5);

// УВЕЛИЧИВАЕТ ВРЕМЯ РАБОТЫ СКРИПТА!!!

// Разрешается ли повтояющиеся замены

// Возможные значения: FALSE, TRUE

@define('REPLACE_DUPLICATE', FALSE);

/*

* Системные настройки

* Начиная с этой строчки, не трогайте если не знаете что делать.

*/

@define('SEOLINKER_VERSION', '2.5.5');

@define('SCRIPT_FOLDER', dirname(__FILE__));

// Движок для получения контента

// Возможные значения: curl

@define('SCRIPT_ENGINE', "curl");

// Включаем/Выключаем вывод ошибок

@error_reporting(1);

@ini_set("pcre.backtrack_limit", 1000000);

// Отключаем логирование ошибок

@ini_set('error_log', NULL);

@ini_set('log_errors', 0);

// Устанавливаем ограничение на выполнения скрипта

@ini_set('max_execution_time', 60);

@set_time_limit(0);

@set_magic_quotes_runtime(0);

include_once('core.inc');

I();

</pre>

SeVlad:

А сколько копий Вы намереваетесь продать?

ЗЫ. Жадность - одна из главных причин провала продаж.
SeVlad
На сайте с 03.11.2008
Offline
1609
#29

mdinc, Вы же не ТС? Или-таки клон?

Это я к тому, что кто потом будет нести ответственность за достоверность сказанных Вам слов?

К тому же, кроме мутного (если не сказать больше) и не человечного (не юзабельного) конфига Вы ничего конкретного не ответили ни по одному вопросу.

Какие нафик "фантазии", если вопрос той же релевантности лежит в плоскости работы (вычислений) скрипта?! А морфология не заканчивается окончаниями (впрочем, тут уже понятно, что морфологического разбора нет).

3-й мой вопрос... Вы вообще прочитали, о чем я спрашиваю? А о чем Вы отвечаете?

То же самое и по 2-му вопросу..

Про прокси - это вообще..

Прокси - это когда на сайте стоит скрипт который вызывает тот же сайт

записать бы в перлы... :)

UPD.

И да, самый важный вопрос (N2) о принципе обработки\перехвата\вывода контента остаётся открытый.

M
На сайте с 08.11.2006
Offline
39
#30
SeVlad:
mdinc, Вы же не ТС? Или-таки клон?
Это я к тому, что кто потом будет нести ответственность за достоверность сказанных Вам слов?

я тот кто писал данный скрипт

SeVlad:

К тому же, кроме мутного (если не сказать больше) и не человечного (не юзабельного) конфига Вы ничего конкретного не ответили ни по одному вопросу.

Какие нафик "фантазии", если вопрос той же релевантности лежит в плоскости работы (вычислений) скрипта?! А морфология не заканчивается окончаниями (впрочем, тут уже понятно, что морфологического разбора нет).

сейчас используется регексп но можно подключить и морфологию. Правда это увеличит время работы скрипта.

SeVlad:

3-й мой вопрос... Вы вообще прочитали, о чем я спрашиваю? А о чем Вы отвечаете?
То же самое и по 2-му вопросу..

Про прокси - это вообще..

записать бы в перлы... :)

UPD.
И да, самый важный вопрос (N2) о принципе обработки\перехвата\вывода контента остаётся открытый.

Про вывод контента писал уже ни раз. описал практически весь принцип действия. Может Вам просто проще показать. Стучитесь тогда в icq.

1 234 5

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий