Soft

Soft
Рейтинг
34
Регистрация
22.06.2008

Подтверждаю, есть ап картинок

В индексе новый сайт )

😮 Чего за косяк? я уже запустил, на 400 слов, вроде всё нормально )

-------------------------

-------------------------

Закончил парсить, скорость отличная, более 400 кеев без бана от yandex )

Но столкнулся с проблемой в excel, при открытии выскочило сообщение "Файл загружен не полностью" (Я напарсел 260 k)

Эта ошибка обычно возникает при попытке открыть файл, содержащий больше 65536 строк или больше 256 столбцов.

Пришлось переименовать в txt, там всё ок.

Надеюсь завтра поправишь, а то совсем делать нечего )))

Думаю, стоит тебе обзавестись обложкой, так солиднее, вот набросал за пол часа 🚬

[ATTACH]53189[/ATTACH][ATTACH]53191[/ATTACH][ATTACH]53195[/ATTACH]

jpg itnetov.jpg
jpg itnetov2.jpg
jpg itnetov5.jpg
it.netov:
Сделал новую версию парсера кеев, подробнее тут.

C новой версией, возникли проблемы - парсит только одну страницу, т.е. например у кея 40 стр. . а у меня в результатах только одна. Пробовал разные настройки и на разных серверах.

Тоже искал, но так и не нашёл, есть русские партнёрки, которые выкупают иностранный трафик.

А сами англоязычные сайты в основном работают с http://www.doubleclick.com/ - там несколько форматов баннеров, есть похожие на тизеры.


- указание какой разделитель ставить ; , : , пробел, табуляция

Думаю, выбор разделителя будет самый оптимальный вариант


Как вы это видите: в отдельный файл все похожие кеи (как в магадане) или иначе как-то?

Видимо имелось в виду как в магадане, считаю не нужной функцией, лучше самому составить основные кей, буде меньше мусора.


На счет формата вывода: планировал сделать возможность создания csv файла для работы в excel, но как вариант оставлю предложенный формат.

Если будет выбор разделителей, то надобность в этом отпадёт, например, если сохранить txt с табуляцией, то достаточно будет переименовать fail.txt в fail.xlc и он будет корректно отображаться в Excel


На счет "не парсит" не понял, у меня ни разу капча не вылезла, возможно, это перегрузка wordstat, в новой версии я предусмотрю это.

Остановка может быть по двум причинам:

- действительно перегрузка, днём вордстат часто в дауне.

- капча. По личному опыту, капча появляется при большом количестве запросов и при смене куки. Если зайти на вордстат и пообновлять куки, то при новых запросах можно увидить капчу. От ip не зависит.

Точнее это не бан, а скорее всего капча вылазеет.

Пожелания по адейту )

- убирать знак "+" автоматом

- вместо знака ";" разделитель-табуляции, пример (вязаные шарфы 8516), т.е. если вставить (экспортировать) в excel то слова и кол-во запросов размесяться в разных колонках

- если больше не парсит, выводить окно типа iframe для ввода капчи

--------------------------------

PS: Собрал уже около 40 к с задержкой 3 сек. пока всё отлично

Отличный парсер.

Единственное. если смотреть результат на сервере, то слова крякозябры ) а если через браузер или скачать на рабочий. то всё отлично.

Сколько ставишь задержку?

И не банил yandex если слов много (больше 20, например) ?

Доменное имя у меня есть на IP с прописанным PTR (c него я и отправляю через php mail ())

Или Вы имеете ввиду, что мне нужен

vm380.majordomo.ru в named с A и PTR ?

Всего: 87