Умный скрипт удаления дублей

Удивительно
На сайте с 07.07.2009
Offline
215
1689

Рады представить вам нашу новую разработку – скрипт интеллектуального удаления дублей ключевых слов. Итак, что делает скрипт:

  • простое удаление дублей – из имеющихся полных совпадений строк остается только первая найденная строка
  • сложное удаление дублей
    • строка разбивается на слова
    • слова в строке сортируются по алфавиту
    • из ключевиков удаляются предлоги, союзы и местоимения (проработано 113 предлогов, союзов и местоимений, которые Яндекс не учитывает в своей статистике)
    • каждое слово приводится к базовой морфологической форме
    • удаляются совпадения полученных конструкций – остается только первая найденная строка

Разберем на примере:

Ключевик: у меня сиськи большого размера

После сортировки слов: большого меня размера сиськи у

После удаления предлогов, союзов и местоимений: большого размера сиськи

После приведения слов к базовым формам: большой размер сиська

Под дубли попадут ключевики:

большие размеры сисек
большой размер сисек
размер больших сисек
у моих сисек большой размер

и так далее.

Попробуйте ввести в Яндекс.WordStat любую из этих конструкций – вы получите совершенно одинаковый результат! Так зачем работать больше? ;)

Скрипт рассчитан на работу в Windows и полностью самодостаточен – в комплекте идет развернутый и настроенный дистрибутив PHP, позволяющий обойтись без установленного веб-сервера и интерпретатора. При желании, скрипт можно использовать и на linux-системах – для этого нужно установить права 777 на папку со скриптом и запускать файл index.php в браузере или по крону.

Для работы скрипта необходимо в папку с ним положить файл с ключевиками, которые нужно обработать (имя файла должно быть строго keys.txt), и запустить файл go.bat. Кодировка файла с ключевиками должна быть UTF-8, иначе скрипт не отработает. Результатом работы скрипта будут два файла – result.txt (файл с очищенной от дублей базой) и doubles.txt (файл с логом удаления дублей). Пример файла doubles.txt:

Оригинал: порно секретарши Дубль: порно секретарш
Оригинал: порно видео памелы андерсон Дубль: памела андерсон порно видео
Оригинал: домашнее порно россия Дубль: домашнее порно россии
Оригинал: порно видео сагаловой Дубль: порно видео сагалова
Оригинал: большие клиторы Дубль: большой клитор
Оригинал: жестокое порно Дубль: порно жестоко
Оригинал: большие клиторы крупным планом Дубль: большой клитор крупным планом
Оригинал: порно северодвинска Дубль: порно северодвинск
Оригинал: скачать большие клиторы Дубль: скачать большой клитор

Стоимость скрипта – 19 WMZ. Купить автоматически можно по этой ссылке.

С уважением, студия AmazingSoftware.

Качественная семантика недорого ( https://moab.tools/ )
Удивительно
На сайте с 07.07.2009
Offline
215
#1

Небольшая разница в выдаче есть, я в курсе )

N
На сайте с 07.08.2009
Offline
3
#2

Вытер, кому надо тот думаю купит.

Удивительно
На сайте с 07.07.2009
Offline
215
#3

Вообще скрипт предназначается тем, кто не хочет прочекивать лишние кеи по вордстату на количество запросов. После обработки скриптом уходит около 30% кеев, которые Яндекс.WordStat считает одинаковыми.

N
На сайте с 07.08.2009
Offline
3
#4
Удивительно:
Вообще скрипт предназначается тем, кто не хочет прочекивать лишние кеи по вордстату на количество запросов. После обработки скриптом уходит около 30% кеев, которые Яндекс.WordStat считает одинаковыми.

Вы бы уже какой нибудь сеокомплекс придумали, где все вместе будет, и эдак баков по 200-300 продавали бы его. 🍻

Удивительно
На сайте с 07.07.2009
Offline
215
#5
Nubbber:
Вы бы уже какой нибудь сеокомплекс придумали, где все вместе будет, и эдак баков по 200-300 продавали бы его. 🍻

Рановато ещё. Вот как будет скриптов 20 - тогда и можно будет в комплекс объединить :)

O
На сайте с 06.11.2008
Offline
23
#6

Удивительно, Вы бы лучше не новые скрипты клепали, а старые дорабатывали. Скрипт глубинного парсинга до сих пор сохраняет только после окончания парсинга.

Удивительно
На сайте с 07.07.2009
Offline
215
#7
ozmail:
Удивительно, Вы бы лучше не новые скрипты клепали, а старые дорабатывали. Скрипт глубинного парсинга до сих пор сохраняет только после окончания парсинга.

Уже давно ситуация исправлена.

Пожалуйста, запишитесь на получение обновлений скрипта:

1. Перейдите на страницу техподдержки

2. Выберите тему обращения - Запрос на обновление продукта

3. Укажите в тексте сообщения название продукта и WMID, с которого совершалась покупка

После этих действий вы будете внесены в базу автоматических обновлений и будете получать обновления купленного вами продукта по мере их выхода.

O
На сайте с 06.11.2008
Offline
23
#8

Удивительно, сорри, забыл проверить почту=)

HD
На сайте с 13.04.2009
Offline
20
#9

Ну вот, половину моей технологии спалили и выложили в свободную продажу =)

Чёрный балахон не спасёт тебя от страшных снов! Имею ответы на ваши вопросы. Пишите.
Удивительно
На сайте с 07.07.2009
Offline
215
#10
Holy Diver:
Ну вот, половину моей технологии спалили и выложили в свободную продажу =)

Мы не специально :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий