Hkey

Hkey
Рейтинг
222
Регистрация
30.09.2006
Интересы
Java
Skie:
А что будет если туда ввести какой-нибудь запрос?

Скрипт попытается вывести вероятные продолжения запроса.

Hkey добавил 11.03.2011 в 21:06

alekzey:
А исправление cp1251 будет еще в первой версии?

Если вы про облако, то оно уже есть в рабочей версии. Когда она перейдет в публичную, то будет исправлено.

Выйдет не скоро (2-3 месяца), нужно еще подрихтровать первую версию.

Стоить будет дороже.

Переход будет быстрый.

regta:
Интересная возможность
Можно подробнее об этой функции?

Например запрос|показы (пример абстрактный цифры не связаны с реальностью)

ноутбуки | 15

ноутбуки купить | 13

ноутбуки недорого | 7

Сумма показов "ноутбуки купить" и "ноутбуки недорого" больше показов первого кея на 5. Из этого следует что у запросов есть невидимый общий потомок (ноутбуки купить недорого) с числом показов от 5 до 7.

Чтобы таблица была нагляднее, я переверну ее


запрос |показы |оценка чистых показов
ноутбуки купить недорого (*) | 6 | 6
ноутбуки недорого | 7 | 7-6=1
ноутбуки купить | 13 | 13-6=7
ноутбуки | 15 | 15-7-1-6 =1

Либо, очень редко такое бывает, эти два запроса пересекаются по омонемии. Т.е. существуют словоформы обоих запросов, которые пишутся одинаково. Это определяется по косвенным признакам.

Oyuna:
"Чистые" показы как-то не согласуются с "чистыми" показами в вордстате. Оценки оценками, но отличия в разы немножко расстраивают.
В целом впечатление не однозначное. Удобно, наглядно, но есть такое чувство, что цифры выдают себя за то, чем не являются.
P.S. для оператора (*) существенным оказалось отсутствие пробела между запросом и (*), если он есть, выдается ошибка. Интересно, какие 'косвенные факторы' учитывает этот оператор..

Про оператор не понял.

Чистые это оценка показов запроса без уточнений.

"Чистые" могут сильно отличаться от вордстатовских кавычек, особенно если глубина парсинга ограничена и чистых намного меньше чем всех.

Погрешность (Все - Чистые) в среднем около 3-5%.

Для чистых погрешность увеличивается в Все/Чистые раз.

Т.е. если чистых в десять раз меньше чем всех, то погрешность около 30-50%.

Счас работаю над улучшением расчета.

Цена 95 wmz. Первый пост попрошу админов поправить

Кстати вот скрипт, который будет в следующем апе

/ru/forum/608868

Сам по себе он тоже интересен, но он будет использоваться для построения СЯ. Как один из шагов.

vtomas:
Hkey, прошу прощения, что снова напрягаю, идеи это хорошо, но лучше бы текущие огрехи подправить, это я про импорт в базу Joomla. В почте отписали что глянете, но воз и ныне там.

Да я выделил ваше сообщение звездочкой, в следующем апе исправлю

P.S.

Есть идея как запихнуть 5-10 ссылочек на каждую страницу, невидимых для пользователя и которые не нарушают лицензию Яндекса.

Есть такая абилити у Гугла и Яши, как поисковые подсказки (хинты или автокомплит) вы набираете запрос, а он его продолжает.

Можно сделать такую абилити на основе базы HTracer. Только при нажатии на хинт идет сразу переход на нужную страницу. Т.е. хинт оформлен ссылкой.

По дефолту (когда ничего не введено, но курсор стоит в поле поиска) отображается 5-10 самых популярных переходов с ПС. Можно 5 случайных из 50 самых популярных переходов.

Вот мы получаем блок ссылок, который, обычно, невидим, но полезен для пользователей.

Проблема в том, что сайт может попасть под автофильтры, хотя если "dispay:none" явно прописан, то этого крайне маловероятно. Однако в этом случае вес этих ссылок ниже чем обычных.

Как вам идея?

Force68:
А как собственно выглядет этот блок с "внутренними контекстными ссылками"? Можно ли где нибудь посмотреть пример как их выводит скрипт?

Контекстные ссылки это просто ссылки в тексте как в википедии.

Hkey добавил 08.03.2011 в 17:51

mpak17:
Ну скрипт поставить на дле я то думаю смогу, тут вопрос в другом, разобрались с проблемой кодировки cp1251 или нет.

Разобрался, но новую версию еще не собрал. Т.е. в рабочей версии это решено, но эта версия станет публичной только через дня 3, а может через неделю. Ее нужно протестировать и для каждого пользователя внести небольшие изменения в код, чтобы если ее кто-то в паблик выложит узнать, кто это сделал.

mpak17:

Ага это хорошо. Но есть ли смысл делать только внутренние контекстные ссылки или без облака эти действия не принесут рост позиций по НЧ запросам?

Не было случая, когда облако выглядело плохо. Ну по крайней мере, там где я его смотрел оно выглядело нормально. И об облаке ничего плохого мне не писали. Имеет смысл и облако и контекстные ссылки использовать.

Hkey добавил 08.03.2011 в 17:54

stabuev:

stabuev добавил 06.03.2011 в 21:34
Потестировал, вроде получил именно то, что искал. Единственное неясно как подкорректировать список запросов. Поскольку уже загнал все подряд.

Выпушу в следующем апе или через один фишку которая позволяет удалять запросы.

AKonstantin:
Hkey, какой максимальный обьём текста можно загрузить для обработки. 1000 страниц выдержит?
Ещё возможно-ли загрузить свою базу синонимов, чтобы конкретное слово менялось только на мой вариант слова или словосочетания?

Выдержит

Если более широких замен нет, то будет работать ваша замена.

Всего: 2639