Добрый день
Посмотрите, может быть вам будет интересно написать такой парсер?
/ru/forum/557629
А разве это не синонимы написаны?? Просто очень широкий круг.
http://www.synonymizer.ru/index.php?sword=%F5%E0%F2%E0
Отлично! Спасибо🍻
Кому нужно - тот снимает просто эту галочку и программа проверяет все слова.
Причем эта опция появляется в дополнительном окне, не нагружая основной интерфейс.
Логика работы просто отличается от пункта к пункту.
Где-то не парсит старые данные, а где-то парсит. И как понять, где как - неясно.
Запрет и не нужно.
Например, при парсинге webeffectora, после нажатия на кнопку, вылезает новое окошечко, где нужно вбивать логин, парольк, тип парсинга и т.д.
Почему бы не добавить туда галочку "Пропускать проверенные" - это и уменьшит нагрузку на агрегаторы/поисковые системы, облегчит работу пользователям (попробуйте на проекте в 8000 слов, выделить для проверки kei непроверенных 1000 слов), так как понятно что именно программа будет делать и с какими словами.
Логика парсинга для расчета kei не совсем ясна. Впрочем как и остальных систем (руки, вебэффектор, пульт и т.д.)
Есть проект, порядка 8000 слов, в котором перестали парситься данные для расчета кеи по яндексу, гуглу и мылу.
Оказалось, что программа заново парсит уже проверенные данные, если они отмечены галочкой. При этом фильтра для "отметки" галочкой по этому полю нет. Соответственно на большом проекте возможности отметить непроверенные по яндексу слова нет.
Может быть при добавлении этой задачи (и других задач - в открывающемся новом окне) дать возможность выбрать опцию "парсить только непроверенные"?
Второй вопрос - стабильности работы программы.
Может стоить добавить в нее опцию принудительного "пересброса" процесса парсинга. Не знаю у кого как, может быть проблема только у меня такая, но сейчас при долгом парсинге (8000 слов) периодически разные процессы (руки, kei, частотность) сами останавливаются из-за разных ошибок (в т.ч. и на стороне серверов). Сечас вопрос решаю с помощью костылей в виде программы, которая сама раз в 20 минут тыкает мышкой за меня в кнопку "остановить все процессы" и потом через минуту тыкает на нужные мне кнопки парсинга...:D
Очень не хватает такой функции, я бы сказал "сверхстабильности":)
В новой версии очень долго происходит оперция "отметить все" (при нажатии на название столбца над чекбоксами).
Комп подвисает и надолго.
В версии 1.3.1 работало значительно быстрее (на том же проекте, на том же железе).
Автообновление - супер.
Очень хорошая программа
Пока вас в аське нет, спрошу здесь.
Допустим, есть сайт со статьями о Питере.
И в одной из статей встречается такой текст: "Жаль, но не часто удается прогуляться по Питеру с фотокамерой :( То занятия какие не дают, то настроения нет, то фотокамеру; не прихватил..."
а мне нужно вставить в эту статью контекстную ссылку с анкором, прямого вхождения которого в тексте нет. Например, "прогулки в Санкт-Петербурге на теплоходе". Для этого, в обычной ситуации, нужно немного перефразировать исходный текст и вписать в него анкор.
Вопрос. Можно ли это делать напрямую из программы?
Для чего нужно? Контекстные ссылки нужны не только для поднятия ТИЦ, но и для продвижения в поиске, зачастую по конкретным фразам, которые не всегда напрямую встречаются в исходных текстах на сайте.
Такой вопрос. Можно ли при простановке ссылки менять немного прямо из скрипта исходный текст? Например: нужно поставить анкор "экскурсии по Питеру", а в тексте встречается только "экскурсии в Санкт-Петербурге"?
Здесь уже поднимался вопрос по словоформам, подниму его еще раз, ибо он как-то ушел в небытие.
Как вы посоветуете искать самые вероятные/правильные словформы запросов?
Например, делаем парсинг по слову массажные кресла.
Wordstat возвращает тучу слов где встречаются "массажные кресла". При этом есть еще огромный пласт (по популярности), где есть "массажное кресло", который вообще не выводится в список.
Как вы посоветуете обходить этот недостаток, в массовом, так сказать, порядке (когда 10 тыс. запросов по теме)?
Есть ли какие-то программы, которые позволяют ввести список запросов, а они поизменяв словоформы выдадут расширенный список?