Дорген PandoraBox - вопросы и ответы + апдейты

C
На сайте с 05.09.2013
Offline
32
#301
TopperHarley:
А разве это решит проблему обозначенную коллегами?
Допустим у меня выборка по словам "скачать" и "установить"
У меня все ключи будут содержать эти слова. Либо первое либо второе.
Потом алгоритм описанный выше будет находить либо по 1му либо по 2му слову совершенно нерелевантные слова.
Например ключ "скачать фотошоп бесплатно"
по этому алгоритму найдет :
по 1му слову: скачать все подряд - все ключи похожие
по 2му слову: все про фотошоп - уже лучше
по 3му слову: дофига нерел. ключей по слову бесплатно
И в итоге будет у нас 1 список где важное слово было всего 1 + куча шлака.
Не?

Ну с другой стороны переспама по 1 отдельно взятому ключу уже не будет.

ufoplast
На сайте с 05.12.2009
Offline
68
#302

тогда можно взять и разделить ключ не по 1 слову, а по 2 например, тогда будет более похоже.

Делаем сайты... http://web-shark.com.ua (http://web-shark.com.ua)
TopperHarley
На сайте с 24.03.2009
Offline
350
#303

Может не учитывать при поиске слова, которые встречаются чаще 10% от всего списка?

То есть убрать из рассмотрения слово "скачать, видео, п0рн0" если они попадаются в каждом 10 ключей или чаще.

Оставшиеся слова - это именно те, что имеют значение при поиске похожих. Не лучше ли так будет?

PandoraBox - генератор #1 ( https://pandoraboxx.ru ) :: ContentBox - Новый многопточный парсер текста,картинок,видео и т.д. ( https://pandoraboxx.ru/contentbox.php ) :: Конвертор шаблонов WP/DLE ( https://pandoraboxx.ru/templateconvertor.php )
orka13
На сайте с 28.03.2011
Offline
102
#304

Подправил тот пост, теперь там можно найти «очень похожие» ключи по двум словам. Идеала все равно не будет, ведь все-равно попадутся ключи со «скачать бесплатно», но без «фотошоп». Это дор, такая погрешность допустима.

Для идеала нам надо научить дорген выделять в ключе самые значимые слова. Это уже надо очень придирчивым. Но если уже начали, то алгоритм такой:

  • Перед генерецией дорген разбивает все ключи дора на отдельные слова, формирует из них огромный список
  • Сортирует в списке слова по количеству их вхождений в списке, или просто для каждой строки добавляет показатель с количеством ее вхождения в списке. Соответственно «Скачать» и «Бесплатно» будут иметь наивысшие показатели.
  • Берет наш ключ "скачать фотошоп бесплатно", делит его на слова, ищет какое же слово из ключа имеет наименьшей показатель. В нашем случае это «фотошоп» будет. И только по нему ищет похожие ключи. Если похожего нет (ключ с редкостным бредословом "скачать фотошоп бесплатно куйнямуйня_версии5"), то берет более популярное слово.

Или вариант попроще: указать в настройках доргена список стоп-слов (stop-SIMILARKEY.txt), которые игнорируются при формировании похожих ключей:

скачать
бесплатно
в
на
для

А дорвейщик уже сам сможет выделить их из списка ключей для нужной тематики. тот же KeyCollector через "анализ групп" покажет наиболее часто встречаемые слова. Необязательно весь массив пересмтаривать, хватит рандомно 10К кеев взять.

Продажи шаблона Google-Translate (Гугл Переводчик), скорость: 20 млн ключей/час, с прокси, без API. (http://zennolab.com/discussion/threads/prodazhi-shablona-google-translate.43684/) Переводит ключи, статьи, HTML+PHP файлы (целые сайты, доры) с сохранением верстки!
TopperHarley
На сайте с 24.03.2009
Offline
350
#305
orka13:
Или вариант попроще: указать в настройках доргена список стоп-слов (stop-SIMILARKEY.txt), которые игнорируются при формировании похожих ключей:

Дык а не удобнее ли будет если программа динамически сформирует этот список стопов? Просто собираем статистику слов по каждому ключу и те что набрали больше 10%(настраивается в тюнинг файле) - считаем стоп словами и их тупо не рассматриваем.

Плюс нужен настраиваемый баланс между скоростью и степенью похожести.

ufoplast
На сайте с 05.12.2009
Offline
68
#306
TopperHarley:
Дык а не удобнее ли будет если программа динамически сформирует этот список стопов? Просто собираем статистику слов по каждому ключу и те что набрали больше 10%(настраивается в тюнинг файле) - считаем стоп словами и их тупо не рассматриваем.

Удобнее конечно будет, наверно так и надо делать.)

orka13
На сайте с 28.03.2011
Offline
102
#307
TopperHarley:
Дык а не удобнее ли будет если программа динамически сформирует этот список стопов? Просто собираем статистику слов по каждому ключу и те что набрали больше 10%(настраивается в тюнинг файле) - считаем стоп словами и их тупо не рассматриваем.
Плюс нужен настраиваемый баланс между скоростью и степенью похожести.

Просто сейчас очень быстро посты все штамповали, и я свой предыдущий пост писал, не читая еще твоего. Все ок, сойдет любой вариант.

UPD

Еще нужен обязательно:

{PUNIQSIMILARKEY}…{/PUNIQSIMILARKEY} – аналогичен {SIMILARKEY}, но уникален в пределах страницы.

Чтобы на тех же тубах можно было его выводить типа так:

{REPEAT-5-15}{PUNIQSIMILARKEY}…{/PUNIQSIMILARKEY}{REPEAT}

TopperHarley
На сайте с 24.03.2009
Offline
350
#308
orka13:
{PUNIQSIMILARKEY}…{/PUNIQSIMILARKEY}

Обычный {SIMILARKEY} уже и так уникален в пределах страницы, иначе смысла бы не было :)

IV
На сайте с 16.07.2012
Offline
45
#309

Только приступаю к изучению Пандоры, прошу сильно не пинать...

Вопрос такой, можно ли в пандоре реализовать такую схему:

У нас есть категории, ключевики, тексты и картинки

Скажем есть 5 категорий

Для них есть 5 фалов с ключами

5 файлов (папок с текстами)

5 папок с картинками

Реально ли сделать так, что бы для категории 1, взялся файл с ключами 1, файл с текстами 1, папка с картинками 1

аналогично для категорий 2-5

Если это реально - может кто нибудь подсказать как это реализовать?

orka13
На сайте с 28.03.2011
Offline
102
#310
InterVlad:
Только приступаю к изучению Пандоры, прошу сильно не пинать...

Вопрос такой, можно ли в пандоре реализовать такую схему:
У нас есть категории, ключевики, тексты и картинки
Скажем есть 5 категорий
Для них есть 5 фалов с ключами
5 файлов (папок с текстами)
5 папок с картинками

Реально ли сделать так, что бы для категории 1, взялся файл с ключами 1, файл с текстами 1, папка с картинками 1
аналогично для категорий 2-5

Если это реально - может кто нибудь подсказать как это реализовать?

readme.doc

вторая страница (30 стр.)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий