Опрос: Какую вы хотите видеть базу ключевиков?

12
[Удален]
1283

В общем готовится к выходу база русскоязычных ключевиков + мощная оболочка, для обработки этой базы.

Так вот такой вопрос: Нужны ли кроме списка ключевиков еще и параметры ключевика (количество показов вордстата, биды и т.п.)? Процесс сбора данной инфы занимает время и силы, потому увеличивает стоимость базы, да и размер... А нужны ли дорвейщикам эти параметры ?

Я лично никогда на эти пункты не смотрел, т.к.:

Количество показов по вордстату - параметр не о чем не говорящий, для одного слова 50 показов - это высокочастотник считается, для другого это меганизкочастотник.... Смешал кеи нужной тематики, почистил от мусора нетематического и вперед на барикады :)

Бид (к примеру бид клик-клика) - тоже в рунете особо не важен, т.к. параметр меняется несколько раз в сутки и сейчас он может быть 0,5$ , а завтра 0 ... лучше чекалку бидов сделать, и сами чекайте партии нужные...

Количество найденных страниц в яндексе по ключевику - тоже никогда не смотрел, и тоже меняется, то база отвалится, то жесткий апдейт (то находка, то чукотка...).

В общем вопрос: А вам оно надо? Или лучше силы бросить на сбор максимального объема самих ключевиков?

VipRaskrutka добавил 13.09.2008 в 18:43

Кстати, неплохо было бы, если бы прокоментировали свой выбор в опросе :)

Нужны ли базе ключевиков параметры каждого ключевика?

Нет.
56% (20)
Да.
28% (10)
Не знаю...
17% (6)
Всего проголосовало: 36
[Удален]
#1
VipRaskrutka:
В общем готовится к выходу база русскоязычных ключевиков + мощная оболочка, для обработки этой базы.

Так вот такой вопрос: Нужны ли кроме списка ключевиков еще и параметры ключевика (количество показов вордстата, биды и т.п.)? Процесс сбора данной инфы занимает время и силы, потому увеличивает стоимость базы, да и размер... А нужны ли дорвейщикам эти параметры ?

Я лично никогда на эти пункты не смотрел, т.к.:
Количество показов по вордстату - параметр не о чем не говорящий, для одного слова 50 показов - это высокочастотник считается, для другого это меганизкочастотник.... Смешал кеи нужной тематики, почистил от мусора нетематического и вперед на барикады :)
Бид (к примеру бид клик-клика) - тоже в рунете особо не важен, т.к. параметр меняется несколько раз в сутки и сейчас он может быть 0,5$ , а завтра 0 ... лучше чекалку бидов сделать, и сами чекайте партии нужные...
Количество найденных страниц в яндексе по ключевику - тоже никогда не смотрел, и тоже меняется, то база отвалится, то жесткий апдейт (то находка, то чукотка...).

В общем вопрос: А вам оно надо? Или лучше силы бросить на сбор максимального объема самих ключевиков?

VipRaskrutka добавил 13.09.2008 в 18:43
Кстати, неплохо было бы, если бы прокоментировали свой выбор в опросе :)

Если будет база именно НЧ, то параметры абсолютно не нужны. Но указать максимальное кол-во запросов было бы неплохо. Например, максимальное кол-во запросов по словам в базе на yandex.direct - 300 в месяц

firacet
На сайте с 23.07.2008
Offline
68
#2

Кстати у меня сейчас тоже две машинки пашут на сбор базы ру кеев, я собираю всю самую подробную информацию, мне не трудно, зато больше мегобайт будет ;)

На текущий момент же есть 4 318 076 ключевиков, размер в базе 850 мб. но к сожалению еще нет оболочки, все лежит в mysql.

Антиофтоп - я бы собирал все данные какие только можно и сделал две версии,лайт - без данных, и фулл - с доп. данными.

2тс. А не хотите ли после окончания сбора данных обменяться базами, и вам хорошо и мне не плохо, уверен что мы друг-друго хорошо дополним ( я про базы ;) )

Вот так.

Сбылись мечты народный: Мир-Труд-Май
[Удален]
#3
monia:
Если будет база именно НЧ, то параметры абсолютно не нужны. Но указать максимальное кол-во запросов было бы неплохо. Например, максимальное кол-во запросов по словам в базе на yandex.direct - 300 в месяц

База будет всякая, но ясно дело в основном средне-низкочастотная, выпарсенная по цепочкам под самое нихачу.

firacet:


На текущий момент же есть 4 318 076 ключевиков, размер в базе 850 мб. но к сожалению еще нет оболочки, все лежит в mysql.

Мускул для такого ихмо не серьезно, для себя конечно можно юзать, но пустив сервис в паблик - положат любой сервак :)

firacet:

2тс. А не хотите ли после окончания сбора данных обменяться базами, и вам хорошо и мне не плохо, уверен что мы друг-друго хорошо дополним ( я про базы ;) )
Вот так.

Врятли вы както заметно дополните, у меня планируется к выходу базы иметь 40 лямов чищенных от спам мусора (мусорные запросы разными чекерами и парсерами), и чеканных на подмененные символы (которые вордстат меняет) + с рамблера и mail.ru кеи + со статистик... + фриапдейты постоянные новыми кеями...

[Удален]
#4
VipRaskrutka:
База будет всякая, но ясно дело в основном средне-низкочастотная, выпарсенная по цепочкам под самое нихачу.

Ну и все тогда, зачем они нужны эти данные по каждому кею, мы же здесь не аналитикой занимаемся

ciber
На сайте с 04.01.2008
Offline
215
#5
VipRaskrutka:

Мускул для такого ихмо не серьезно, для себя конечно можно юзать, но пустив сервис в паблик - положат любой сервак :)

Бился челом о сруб светлицы.

П.С. положить можно при неумении оракал, но мускул в десятки раз быстрее

[Удален]
#6
ciber:
но мускул в десятки раз быстрее

Быстрее чем что?

kruk1
На сайте с 02.10.2006
Offline
152
#7

Единственная база которую юзал из вебоболочки была keytoday, делать как они явно не нужно

Идеальный вариант как у пастухова, но параметров можно поменьше использовать, мне б хотелось видеть частотность запроса по яндексу и рамблеру.

[Удален]
#8
kruk1:
Единственная база которую юзал из вебоболочки была keytoday, делать как они явно не нужно.

:) Оболочка будет под винду, у каждого пользователя, никаких ВЕБоболочек.

И кроме простой выборок будет куча доп возможностей: фильт выбранного по стопсловам, разбивка файлов, перемешка, сборка, чистка на мусор и подмененные буквы и прочие операции на текстовых (сторонних) файлах + возможность создавать свою базу или добавлять в имеющуюся базу свои кеи при этом чекая новые кеи на дубли и прочие условия...

firacet
На сайте с 23.07.2008
Offline
68
#9
VipRaskrutka:
База будет всякая, но ясно дело в основном средне-низкочастотная, выпарсенная по цепочкам под самое нихачу.


Мускул для такого ихмо не серьезно, для себя конечно можно юзать, но пустив сервис в паблик - положат любой сервак :)

Врятли вы както заметно дополните, у меня планируется к выходу базы иметь 40 лямов чищенных от спам мусора (мусорные запросы разными чекерами и парсерами), и чеканных на подмененные символы (которые вордстат меняет) + с рамблера и mail.ru кеи + со статистик... + фриапдейты постоянные новыми кеями...

Понял! Ну тогда я у вас куплю базу и свою дополню ;) А делаю я ее только для себя, так что обойдусь мускулом с php ;o)

Вообщем удачи! 40 лямов это уже серьезно!

Кстати, раз уже затронулась тема метода хранения ключевиков, как вы думаете, пару десятков лямов можно будет в microsoft access загнать и на нем сделать guiшное приложения для работы с ключевиками, или акцес не потянет стоко? спс!

[Удален]
#10
firacet:

Кстати, раз уже затронулась тема метода хранения ключевиков, как вы думаете, пару десятков лямов можно будет в microsoft access загнать и на нем сделать guiшное приложения для работы с ключевиками, или акцес не потянет стоко? спс!

Насчет этих микрософтовских прог хз, да и вообще я не прогер, ответственный по тех части у меня другой человек :)

Но 60 лямов в txt (только ключевики без атрибутов) - на своем старом ноуте DELL inspiron 1300 (пень 1,7 Ггц, 512 оперативки) делал выборки, чекал на дубли и т.п. без проблем...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий