dimok

dimok
Рейтинг
291
Регистрация
08.11.2002
gutako:
dimok, чем принципиально лучше базы Пастухова? По цене и функционалу аж никак не конкурирует... Про оболочку тоже молчу :-) имхо

Насчет лучше:

1. В 4-5 раз больше кивордов, чем у Пастухова. Если учитывать, что у него куча мусора, то еще больше разница.

2. Нет нелегала. Это вообще то противозаконно, а у Пастухова в базе есть, так что пользоваться можно лишь на свой страх и риск.

3. Нет мусора.

4. Свежие киворды. Есть такие, которых в принципе не было, когда Пастухов свою базу собирал.

Оболочка простая, но эффективная. Можно выборку по 1000 запросов сделать сразу - у Пастухова на это уйдет не один день...

gutako:
Возникли следующие вопросы:
1. Обновления за чей счет?
2. База на каком языке?
3. Сколько места занимает БД?
4. Машина при элементарных выборках не виснет случаем?

1. За счет клиента. Он в любой момент может купить обновленную базу за небольшой процент от ее стоимости.

2. Все киворды англоязычные. Но при желании там можно и итальянские, например, найти, если делать выборку по чисто итальянским словам.

3. Сама база весит 3.5 Гб. После установки надо запустить процесс индексации для того, чтобы все работало так быстро, как мы заявляем, - база будет весить уже 15 Гб.

4. Pentium D с 2ГБ оперативки спокойно делает выборку по 9000 двухсловных запросов и при этом можно работать в других приложениях без каких-либо тормозов.

Да быстро, не представляю как Вы могли добиться такой скорости. Выборка по базе Пастухова в которой 44000000 делаться около минуты…

Индексацией базы. Все очень просто. Плюс ее (базы) чистотой. Чем меньше мусора, тем быстрее выборки. Про "около минуты" ты загнул - реально у него дольше.

напишите кто нить такую прогу:
загружаем из ткст список урлов, прога проверяет индексации ссылки на этих урлах, запрос через яндекс иксмл
и потом прога отправляет в сапу урлы с непроиндекс ссылкой, то есть галки ставит чтоб автоматом снять ссылки

Интересная фича. Но надо еще получается учитывать время размещения ссылки, ведь далеко не все ссылки индексируются в в течение одного-нескольких дней, поэтому снимать ссылку через пару дней после простановки лишь потому, что она не проиндексировалось, неправильно. Так?

Софт пишется как кроссплатформенный.

Интереснее другое: какой функционал сейчас наиболее востребован?

Stripe, я вообще за то, чтобы под любой осью работало, так что с этим без проблем ;)

MaulNet, нет, совсем не для этого.

ksylite, в личку отписал

ksylite:
Я бы хотел софтину, которая обрабатывает контекстную рекламу, показывает конкурентов, ставки от и до, объявления с подробной статистикой и раздельно по разным сервисам...

Даем программе список запросов, по которым надо провести анализ, а программа составляет список всех контекстных объяв, из которых выдирает все что только можно:

- названия объяв, тексты

- сайты рекламодателей

- стоимость объявлений и их количество

Так?

Попробуем. О результатах в блоге отпишусь :)

Тоже ничего не помогало. Удалил links.db и все заработало :)

Всего: 4272