brubru

Рейтинг
17
Регистрация
30.03.2009

Добрый день

Посмотрите, может быть вам будет интересно написать такой парсер?

/ru/forum/557629

Str256:
Типа указываешь запрос и на выходе список ассоциативных ему слов, не синонимов. Пример того, что на входе и что хочу получить на выходе.

рубашка - рубаха, сорочка, косоворотка
свитер - фуфайка, пуловер, джемпер, кофта, водолазка
брюки - штаны, галифе, джинсы
дом - высотка, сталинка, хрущёвка, хоромы, изба, коттедж, таунхаус, дворец, усадьба, имение, хижина, лачуга, бунгало, дача, вилла

Я примерно написал ассоциации, если что...

А разве это не синонимы написаны?? Просто очень широкий круг.

http://www.synonymizer.ru/index.php?sword=%F5%E0%F2%E0

MIND:
Версия 1.3.6 от 18.10.2010:
- добавлены всплывающие уведомления об окончании процесса парсинга, если программа свернута в трей;
- [BETA] добавлена новая настройка интерфейса "Скрывать неудовлетворяющие результатам быстрого поиска строки в таблице";
- изменен логотип программы;
- исправлены проблемы удаленных строк (багфикс для версии 1.3.5).
==============================

Пользователи версии 1.3.3 и выше могут загрузить обновление автоматически при запуске программы. Пользователи 1.3.2 должны сперва заменить файл KeyCollectorUpdater.exe в директории программы на следующий: KeyCollectorUpdater.exe. Остальные могут загрузить обновление вручную по ссылке.

Стоимость лицензии составляет 25$ на один компьютер, 100$ - брендирование.
Подробней о покупке программы вы можете узнать по ссылке: http://seom.info/buy-key-collector/
После 20 октября цена на Key Collector будет поднята, используйте возможность приобрести сейчас и получать бесплатные обновления.

P.S. Следующий апдейт будет направлен на улучшение производительности программы и новый фукнционал :).
brubru, Ваши пожелания по поводу возможности указания способа парсинга данных будут учтены. Над стабильностью, разумеется, тоже поработаем :).

Отлично! Спасибо🍻

MyOST:
а если нужно оценить сначала топ 10 потом топ 1?

Кому нужно - тот снимает просто эту галочку и программа проверяет все слова.

Причем эта опция появляется в дополнительном окне, не нагружая основной интерфейс.

MyOST:
а в чем логика не та? для кеи и для агрегаторов в частности?

Логика работы просто отличается от пункта к пункту.

Где-то не парсит старые данные, а где-то парсит. И как понять, где как - неясно.

MyOST:

где есть вариации, допустим эффектор - можно выбрать топ1-3-5-10, и заново можно пропарсить, директ - там спецуха, первое место или гарантия

Если сделать запрет на перебивку - это уныло.

Запрет и не нужно.

Например, при парсинге webeffectora, после нажатия на кнопку, вылезает новое окошечко, где нужно вбивать логин, парольк, тип парсинга и т.д.

Почему бы не добавить туда галочку "Пропускать проверенные" - это и уменьшит нагрузку на агрегаторы/поисковые системы, облегчит работу пользователям (попробуйте на проекте в 8000 слов, выделить для проверки kei непроверенных 1000 слов), так как понятно что именно программа будет делать и с какими словами.

Логика парсинга для расчета kei не совсем ясна. Впрочем как и остальных систем (руки, вебэффектор, пульт и т.д.)

Есть проект, порядка 8000 слов, в котором перестали парситься данные для расчета кеи по яндексу, гуглу и мылу.

Оказалось, что программа заново парсит уже проверенные данные, если они отмечены галочкой. При этом фильтра для "отметки" галочкой по этому полю нет. Соответственно на большом проекте возможности отметить непроверенные по яндексу слова нет.

Может быть при добавлении этой задачи (и других задач - в открывающемся новом окне) дать возможность выбрать опцию "парсить только непроверенные"?

Второй вопрос - стабильности работы программы.

Может стоить добавить в нее опцию принудительного "пересброса" процесса парсинга. Не знаю у кого как, может быть проблема только у меня такая, но сейчас при долгом парсинге (8000 слов) периодически разные процессы (руки, kei, частотность) сами останавливаются из-за разных ошибок (в т.ч. и на стороне серверов). Сечас вопрос решаю с помощью костылей в виде программы, которая сама раз в 20 минут тыкает мышкой за меня в кнопку "остановить все процессы" и потом через минуту тыкает на нужные мне кнопки парсинга...:D

Очень не хватает такой функции, я бы сказал "сверхстабильности":)

В новой версии очень долго происходит оперция "отметить все" (при нажатии на название столбца над чекбоксами).

Комп подвисает и надолго.

В версии 1.3.1 работало значительно быстрее (на том же проекте, на том же железе).

Автообновление - супер.

Очень хорошая программа

Jeff:
madass: Да есть. По домену.

brubru: Если честно, не понял вопрос. Если что - стучите в аську, проконсультирую.

Пока вас в аське нет, спрошу здесь.

Допустим, есть сайт со статьями о Питере.

И в одной из статей встречается такой текст: "Жаль, но не часто удается прогуляться по Питеру с фотокамерой :( То занятия какие не дают, то настроения нет, то фотокамеру; не прихватил..."

а мне нужно вставить в эту статью контекстную ссылку с анкором, прямого вхождения которого в тексте нет. Например, "прогулки в Санкт-Петербурге на теплоходе". Для этого, в обычной ситуации, нужно немного перефразировать исходный текст и вписать в него анкор.

Вопрос. Можно ли это делать напрямую из программы?

Для чего нужно? Контекстные ссылки нужны не только для поднятия ТИЦ, но и для продвижения в поиске, зачастую по конкретным фразам, которые не всегда напрямую встречаются в исходных текстах на сайте.

Такой вопрос. Можно ли при простановке ссылки менять немного прямо из скрипта исходный текст? Например: нужно поставить анкор "экскурсии по Питеру", а в тексте встречается только "экскурсии в Санкт-Петербурге"?

Здесь уже поднимался вопрос по словоформам, подниму его еще раз, ибо он как-то ушел в небытие.

Как вы посоветуете искать самые вероятные/правильные словформы запросов?

Например, делаем парсинг по слову массажные кресла.

Wordstat возвращает тучу слов где встречаются "массажные кресла". При этом есть еще огромный пласт (по популярности), где есть "массажное кресло", который вообще не выводится в список.

Как вы посоветуете обходить этот недостаток, в массовом, так сказать, порядке (когда 10 тыс. запросов по теме)?

Есть ли какие-то программы, которые позволяют ввести список запросов, а они поизменяв словоформы выдадут расширенный список?

1 234 5
Всего: 43