DEM333

Рейтинг
55
Регистрация
08.02.2009
noindexwhy:
telaskaner.narod.ru , rengenskaner.narod.ru

конетнт уг, морфо примитивная, анкоры кеями перегружены, картинки гут)

DEM333 добавил 30.03.2010 в 17:08

Webfile:
евраля синонимайз в индекс не попадает как таковой

он наверно еще раньше не стал попадать, яша его клеит по своей базе синонимов с оригиналом.

адназначна. засуньте на него сайт, в следующий ап 50% будет в индексе, со второго весь зайдет, в плане ранжирования тоже преимущества, хотя надо смотреть какое на нем ссылочное.

akaplenko:
DEM333, зачем бить кеи по точкам ?

Думал это для текстов.

Я бы добавил предварительную разбивку текста на строки по точкам в конце предложений, чтобы структуру текста не ломал.

Парсер текста. Берет в качестве затравки слова из списка кейвордов, идет в топ и скачивает 10 сайтов сидящих там по этим запросам по следующему алгоритму: заходим на главную, выдираем все линки по регулряке и регуляркой же высеиваем из их числа те, в которых встречается любой хост, кроме распаршиваемого. Таким образом получаем линки стр УВ2, далее повторяем на них туже процедуру - зарываемся еще на уровень. По мере углубления другой регулркой вытаскиваем все жирные дивы и складываем в файл. + этап парсигна списка сайтов, этап углублений по структуре сайта можно сделать настраиваемыми (настраивать диаппазон с которого берем сайты и настраивать глубину парсинга и процент линков по которым будет идти углубление). + добавить косвенные признаки галер и прочих малоконтентников, чтобы парсер сразу с них уходил, на затрачивая времени.

ЗЫ. если что - это не заказ, а мое видение алгоритма как подобный парсер должен работать.

eJik-mod:
Я имел ввиду что доры сделанные на РБТ не до конца входят в индекс не успевают ..и даже при полной индексации живут несколько дней. С другим доргеном по той же схеме все лезло. Думаю все таки сказывается ущербность генерации текста..говорили же про баг 288 предложений, берутся одни и теже куски текста для всех страниц! Так что в этом смысле уник текст не играет роль

по маркову если - то нужно выкидывать т.н слепые хвосты- это пары с очень малым числом ветвлений.

Bilderman:
Если не сложно распшите его

сtrl-s, ctrl-x, ctrl-x...

Может эта рирайт :D или ручной скан распечатанных скринов сайта. А так конечно с ценообразованием - ребус. Да и с востребованностью данной услуги тоже.

TopperHarley:
не все умеют запускать батч в фотож.. шопе. Я например вообще его боюсь, а вот программа ТСа могла бы иметь такой функционал и юзерам было бы радостней.

ИМХО, незачем плодить одинаковые сущности. лучше уже создавать нечто инновационное)) хотя в полезности проги, кагбе не сомневаюсь, хотя бы в плане развития мастерства ТСа как программиста.

Насчет батча- гугль.

Раз напарсить по тематикам, потом оттуда миксовать. Намиксованное прогнать в шопе батчем - подергать ползунки Нyue/Saturation, ресайзнуть, немного обрезать... далее - на что фантазии хватит:)

Всего: 528