orka13

orka13
Рейтинг
102
Регистрация
28.03.2011
InterVlad:
Только приступаю к изучению Пандоры, прошу сильно не пинать...

Вопрос такой, можно ли в пандоре реализовать такую схему:
У нас есть категории, ключевики, тексты и картинки
Скажем есть 5 категорий
Для них есть 5 фалов с ключами
5 файлов (папок с текстами)
5 папок с картинками

Реально ли сделать так, что бы для категории 1, взялся файл с ключами 1, файл с текстами 1, папка с картинками 1
аналогично для категорий 2-5

Если это реально - может кто нибудь подсказать как это реализовать?

readme.doc

вторая страница (30 стр.)

TopperHarley:
Дык а не удобнее ли будет если программа динамически сформирует этот список стопов? Просто собираем статистику слов по каждому ключу и те что набрали больше 10%(настраивается в тюнинг файле) - считаем стоп словами и их тупо не рассматриваем.
Плюс нужен настраиваемый баланс между скоростью и степенью похожести.

Просто сейчас очень быстро посты все штамповали, и я свой предыдущий пост писал, не читая еще твоего. Все ок, сойдет любой вариант.

UPD

Еще нужен обязательно:

{PUNIQSIMILARKEY}…{/PUNIQSIMILARKEY} – аналогичен {SIMILARKEY}, но уникален в пределах страницы.

Чтобы на тех же тубах можно было его выводить типа так:

{REPEAT-5-15}{PUNIQSIMILARKEY}…{/PUNIQSIMILARKEY}{REPEAT}

Подправил тот пост, теперь там можно найти «очень похожие» ключи по двум словам. Идеала все равно не будет, ведь все-равно попадутся ключи со «скачать бесплатно», но без «фотошоп». Это дор, такая погрешность допустима.

Для идеала нам надо научить дорген выделять в ключе самые значимые слова. Это уже надо очень придирчивым. Но если уже начали, то алгоритм такой:

  • Перед генерецией дорген разбивает все ключи дора на отдельные слова, формирует из них огромный список
  • Сортирует в списке слова по количеству их вхождений в списке, или просто для каждой строки добавляет показатель с количеством ее вхождения в списке. Соответственно «Скачать» и «Бесплатно» будут иметь наивысшие показатели.
  • Берет наш ключ "скачать фотошоп бесплатно", делит его на слова, ищет какое же слово из ключа имеет наименьшей показатель. В нашем случае это «фотошоп» будет. И только по нему ищет похожие ключи. Если похожего нет (ключ с редкостным бредословом "скачать фотошоп бесплатно куйнямуйня_версии5"), то берет более популярное слово.

Или вариант попроще: указать в настройках доргена список стоп-слов (stop-SIMILARKEY.txt), которые игнорируются при формировании похожих ключей:

скачать
бесплатно
в
на
для

А дорвейщик уже сам сможет выделить их из списка ключей для нужной тематики. тот же KeyCollector через "анализ групп" покажет наиболее часто встречаемые слова. Необязательно весь массив пересмтаривать, хватит рандомно 10К кеев взять.

TopperHarley:
Какой принцип выбора похожих применить? Уже понятно что совпадение слов в ключе и в кандидатах не вариант
  • - Делим ключ на отдельные слова
  • - По каждому слову находим похожие ключи (типа по старому аглоритму, ищем ~3-10 ключей с таким же вхождение этого слова в ключ)
  • - Собираем все похожие ключи из всех слов в 1 список
  • - Рандомно берем 1 ключ из списка, это и есть наш SIMILARKEY

Получается, что на длинных ключах будет чуть больше ресурсов обработки жрать, но зато получаем действительно рандомную похожесть.

---------- Добавлено 17.11.2015 в 20:33 ----------

UPD:

Можно сделеать отдельный макрос SIMILARKEY2, который жрет больше ресурсов, но ищет «очень» похожие ключи (совпадение по более чем 1 слову):

  • - Делим ключ на отдельные слова
  • - По каждому слову находим похожие ключи (типа по старому аглоритму, ищем ~40-400 ключей с таким же вхождение этого слова в ключ). Ключей надо много, чтобы среди них обязательно дубли встретились.
  • - Собираем все похожие ключи из всех слов в 1 список.
  • - Ищем хотя бы ~2…20 ключей, которые наиболее часто встречаются в нашем списке. То есть это дубли фактически. (Как искать хз, может в C# есть функция сортировки дублей в пределах списка по количеству встреч строки в списке). Выделяем их в отдельный список.
  • - Рандомно берем 1 ключ из этого отдельного списка, это и есть наш SIMILARKEY2.

Заметьте, что всегда в финале мы берем рандомно какой-то один вариант из нескольких (правда могут быть ситуации, когда не будет из чего выбирать). Это спасает от ситуаций, когда некоторые ключи зацикливаются в группе. То есть получается НЕНУЖНАЯ перелинковка кольцом. Встречал такое вчера при генерации адалт туба.

TopperHarley:
Ок, сделаю
{IFCAT-(Название категории)}Выводится на страницах указанной категории{/IFCAT}
Но уже в следующей версии, а то вы меня совсем без личной жизни оставите )

Спасибо! А то я беру категории из подключа, и печально осознавал что последние апдейты мне не подойдут, а так все ок будет.

T e c h n o:
Как обновиться? (при запуске нет уведомления).

наверное, вручную на http://pandoraboxx.ru (кнопка "Скачать...")

T e c h n o:
Спрошу тут:

Как в <head></head> на страницах постов вывести разный код для разных категорий?

Есть категория "Вязанные валенки из кожи жопы дракона" - для неё свой код выводится в хедере, для другой категории - другой код.

{POST-1/2/3...} - не подходит, "оно" выводит непосредственно статью на странице. Несколько раз использовать одинаковый нельзя.

Нужно что-то типа макроса: {CATEGORY-1,2,3}контент, который выводится на страницах указанной категории{/CATEGORY}

Возможное решение для этого желания совпадает с моей просьбой:

Уже есть макрос:

{IF-(драйвер)}…1…{ELSE}…2…{/IF} – если строка ключа содержит указанную подстроку, то выводится блок №1, иначе – №2. Может быть записан без ELSE: {IF-(драйвер)}…{/IF}

Нужен аналог для подключей:

{IF-7-(драйвер)}…1…{ELSE}…2…{/IF} – если строка ключа [KEYPART-7] содержит указанную подстроку, то выводится блок №1, иначе – №2. Может быть записан без ELSE: {IF-7-(драйвер)}…{/IF}

Очень помог бы в сложных дорах на мультикее. Тогда можно было бы в шабе ключей сделать столбцы типа с [KEYPART-7] со значениями «True\False» и т.п., и в зависимости от их содержания выводить на страницах разные дополнительные фичи, актуальные только для конкретной группы ключей.

babuler:
разница между Белым сайтом и Дорвеем очевидна
Белые сайты делаются в основном по конкурентным, целенаправленным ключам
Дорвеи делаются по огромной массе НЧ
и если по ВЧ Гугл хорошо отслеживает все движения и нарушения, то на не конкурентные НЧ-сферы он своё внимание почти не распространяет
Гугл - не Бох, у него есть определённое ограничение по мощностям

Фильтры с 29 сентября показали, что мощности хватит на всех.

dr_Min:
Балда... Это же не проксирование... я так http://дор.ru/papka[RAND-1-3]/pic[RAND-1-2000].jpg хочу.

В Пандоре есть, но сам не пробовал:

{PROXYIMG-(prefix/)}<img src="[RANDLINE-(images.txt)]" … />{/PROXYIMG} – проксификация урлов картинок через локальный домен. Префикс может иметь вид: “img/” или “pic-“. Шаблон проксирования можно поправить в файле img.proxify.template.xml
Важно: Для работы фукнции включается SQLite база данных и вносится mod_rewrite правило редиректа на скрипт в файле .htaccess.

Все норм работает. Только я за раз добавил 200 сайтов (сабы), и httpd\nginx перестали запускаться. Пришлось удалять домены вручную. Вывод: не добавляйте подряд так много на слыбых VPS, а то там после каждого домена Vesta вроде делает перезапуск некоторых процесов и может во такой косяк случится.

Всего: 532