уже когда-то просил, написал теперь просьбу в тикеты:
Есть небольшая индивидуальная проблема:
Раньше (~пару месяцев назад) если мы парсили на хвосты (словоформы) любую бредовую фразу с нулевой частотностью, то в отчет проекта добавляясь сама фраза, даже если хвостов не было. А теперь этого не происходит (как будто мы такой фразы и не парсили). Как вернуть назад?
Такое надо для ситуации, когда надо поочередно распарсить на хвосты в 1 поток большой список ключей. Сам список можно было разбить на блоки, принудительно добавив такие бредовые фразы, пример:
...Разделитель 1 автомобиль (бредовая фраза)Ремонт автомобиляЦена автомобиляКупить автоРазделитель 2 окна (бредовая фраза)Купить окноЦена окноРемонт окно...
и на выходе мы имели разделенный на блоки результат собранных хвостов.
П.С. Все время стоит пункт в настройках вордстата [«добавлять в таблицу фразы с частотностью от» «0»], так что это не из-за него.
Тогда остается только метод через попу:
закомментировать этот кусок текста, чтобы в браузере не виден был пользователям, но данные можно будет стянуть. Правда размер дора немножко увеличится на те пару мб.
Заинтересовало. Решил реализовать:
{MAINITEMS-50-100}<p>[ONESENT-1-2] <a href="[KEYWORDURL]">[BKEYWORD]</a>. [ONESENT-1-2]<p> <br />{/MAINITEMS}
Если вставить в шаблон главной страницы, то на ней сгенерирует 50-100 шт анкорных ссылок с текстом по краям, так как тебе надо. Вот только я понимаю, что тебе такое полотно не надо светить на сайте, поэтому логичнее было бы вывести в отдельный файл на доре, ну скажем в статическую страницу «prospam.html», которая нигде не будет подключаться, но с нее будет удобно стянуть данные (код ниже не рабочий):
{STATIC-prospam.html}{MAINITEMS-50-100}<p>[ONESENT-1-2] <a href="[KEYWORDURL]">[BKEYWORD]</a>. [ONESENT-1-2]<p> <br />{/MAINITEMS} {/STATIC}
Но беда: в статических страницах Пандора не поддерживает макрос «MAINITEMS» (у меня не получилось). Пускай Топпер подскажет что можно сделать.
Постом выше правильно описали самый популярный вариант сбора. Из сервисов еще этим пользовался:
http://seo.dj
пример данных - http://seo.dj/keys.php?url=searchengines.ru®=1
Сори если я слишком много букв написал постом выше, но там сказано, что я пробовал через [PLUSKEYWORDS].
Еще раз проверил – он кириллицу трансформирует. То есть через «%...» делает трансформацию урла, будто рассчитывает, что браузеры не понимают кириллицу.
http://site.net/search?q=[PLUSKEYWORDS]
То есть если ключ - «fieldrunners 2 скачать android», то на выходе получаем
http://site.net/search?q=fieldrunners+2+%F1%EA%E0%F7%E0%F2%FC+android
Может я случайно в настройках включил где-то эту фичу.
Не получается передать на партнерку ключ с кириллицей, так как Пандора декодирует его, а партнерка такой вид не принимает. Например, используем в шаблоне:
<a href="http://УрлЛендингаПартнерки/search?q=[BBBKEYWORD]">
или
<a href="http://УрлЛендингаПартнерки/search?q=[PLUSKEYWORDS]">
Если KEYWORD = «english word», то на выходе получаем нормальные значение, которые принимает партнерка:
http://УрлЛендингаПартнерки/search?q=english%20word
http://УрлЛендингаПартнерки/search?q=english+word
Если KEYWORD = «любые слова» (кириллица), то на выходе получаем декодированное значение, которые НЕ принимает партнерка:
http://УрлЛендингаПартнерки/search?q=%CF%E0%F0%F2%ED%E5%F0%EA%E8%20%C0%ED%E4%F0%EE%E8%E4
http://УрлЛендингаПартнерки/search?q=%EF%E0%F0%F2%ED%E5%F0%EA%E8+%E0%ED%E4%F0%EE%E8%E4
А надо:
http://УрлЛендингаПартнерки/search?q=любые%20слова
http://УрлЛендингаПартнерки/search?q=любые+слова
Как реализовать?
Демо-версия СЯ "Полы". В ней большинство ключей скрыто, но видны почти все СЕО-показатели, чтобы оценить перспективу ключей.
Решил обновить коллекцию готовых СЯ чем-то из «Ремонт своими руками». Начал из тематики «Полы»: разобрал все популярные виды полов и запросы связанный с самостоятельным выбором, укладкой, уходом и т.д. Обработал около 60К запросов, из них выбрал самые НК-ключи как в ПС Яндекс, так и Гугл, на основе которых руками сгруппировал крупное СЯ: 730 ключей разбиты на 253 статьи (в среднем получается ~3 ключа\статью). Вот структура разделов (на основе популярных типов полов). В демо-версии они разделены цветами, и в некоторых строках я оставил для примера пару ключей.
1. Ламинат (84 статьи)
2. Линолеум (38)
3. Теплый пол (25)
4. Плитка напольная (18)
5. Наливной пол (16)
6. Паркет/паркетная доска/доска для пола (17)
7. Керамогранит для пола (11)
8. Бетонная стяжка пола (13)
9. Покрытие пола/лак (5)
10. Интерьер пола (6)
11. Пол в бане (6)
12. Остальное, что уже нет смысла разделять на разделы (14)
Я понимаю, что СЯ весьма крупное\дорогое, поэтому, если не найдется в ближайшее время состоятельный покупатель, то буду рассматривать и возможности продажи по частям. Но принцип «одно СЯ (одна часть) в одни руки» не отменяется. Так что можете не переживать, что кто-то будет по тем же ключам делать. Репутация для меня важна.
Списибо, понял, что проблема лично у меня. Начал тестировать на дефолтном шаблоне, и выяснилось, что все регулярки работают, даже та моя первая. Так что буду искать косяк у себя в шаблоне. Надо прекращать мутить сложные шаблоны :).
П.С.:
Нашел причины, у меня еще и пустые строки генерировались случайно, типа
<h1>Слово и пробел в конце строки точки нет в конце, она в следующей строке .</h1>
Так что просто надо еще их сначала было удалить:
template = Regex.Replace(template, @"\r\n\r\n", "\r\n"); return Regex.Replace(template, @"([^>])\r\n", "$1");
Теперь все ОК!
Будете смеяться, но я не нашел тот редактор «Данные скрипты можно писать в редакторе пользовательских макросов, скачать который можно на сайте в разделе БОНУСЫ», так как на сайте нет ссылке на него, только описание.
я просто в блокноте делаю, и в Пандоре тестирую. Так вот тесты показали, что замена происходит только в таком случае (template, @"\r\n", "").Видимо в Regex.Replace какие то отклонения в обработке переносов строк при замене, если вместо "" прописать какое-то значение.