response

response
Рейтинг
324
Регистрация
01.12.2004
ciber:
Да, для сапы можно настрогать.

для сапы лучше каталожную организацию. сплоги в сапе не то чтобы плохо идут, но не рулят имхо.

ciber:
Ластовский точно нужно раскручивать, тем более без рерайта высоких позиций даже по НЧ недостичь без ссылок

а ластовский никак контент не модифицирует? один к одному копипастит?

bystrobot:
Сплог надо раскручивать или тут тоже посезаемость за счет НЧ.

как умеете.

bystrobot:
P.S. Lasto Portator это сплог?

хз, не юзал.

Diversant:
Голосовалка в соседнем топике !!! Поддержим ОНОТОЛИЯ !!! Чак аутсайдер !!!

Россия для Онотолия!

Попячсо! Онотоле наше все!!11

seoliga:
Ну а есть смысл в сплогах под рунет,кто юзает,отпишите.Очень интересно выслушать опыт работы под рунет.

есть смысл. это круче доров.

ЧерныйKот:
Вы говорите что данные продукт нафиг ненужен?

я говорю только то, что лично я его не куплю, не более.

Добрый дорвейщик:
Для меня востребованы скрипты получения сравнительно больших (~ 1 гб) объемов качественных (без всякого мусора в виде обравков тегов, стилей, адракадабры) тектов за сравнительно небольшие сроки (~ 10 часов)... ;)

я не верю в приемлимые результаты от универсального парсера. проще сделать распарсивалку под каждый конкретный ресурс. для адалта парсил, среди прочих, стульчик.нет, для авто - каталог авто.ру. Весьма неплохо. Маловато, конечно, но и не 10 часов потребовалось (не считая парсера, который при наличии наработок делается за сравнительно небольшое время).

а то что тс предлагает, оно как бы не работает, не то чтобы могло насканить гиг безмусорных текстов за 10 часов.

solnikolay:
Куда тебе.

могу сказать, куда тебе.

сравнил, тоже, попу с пальцем, копание в грязном белье пачки клонов и отлов невероятно эффективно спрятанного кодированием редиректа на onload, который всей тусой где-то тут пару месяцев назад изобретали, мухаха 😂

ну так себе:

http://l00t.ru/magadan:
<hr> burunduk
06.03.2008 17:59
Андрей
06.03.2008 18:15
99th
06.03.2008 18:30
06.03.2008 22:07
99th
06.03.2008 22:31
06.03.2008 23:26
06.03.2008 23:29
99th
06.03.2008 23:42
06.03.2008 23:57
99th
07.03.2008 00:02
07.03.2008 00:09
99th
07.03.2008 00:10
Alexander
07.03.2008 09:54
tyt1
07.03.2008 10:50
tyt1
07.03.2008 10:52
tyt1
07.03.2008 11:40
99th
07.03.2008 13:26
tyt1
07.03.2008 18:01
99th
07.03.2008 18:13
tyt1
07.03.2008 20:24
99th
07.03.2008 21:06
tyt1
07.03.2008 21:39
99th
07.03.2008 21:56
tyt1
08.03.2008 09:47
99th
08.03.2008 15:12
Виктор
08.03.2008 16:31
99th
08.03.2008 20:49
09.03.2008 03:55
Сергей
09.03.2008 19:19
99th
09.03.2008 20:28
Сергей
09.03.2008 21:09
10.03.2008 11:13
99th
11.03.2008 02:18
Alexander
12.03.2008 16:22
Alexander
12.03.2008 16:33
99th
12.03.2008 17:39
<hr>

а применение, по-моему, напрашивается само собой: спарсить весь смысловой контент рунета. Если есть бот, который правильно определяет как рипнуть смысловое содержимое без предварительной ручной подготовки к парсингу (забивание сигнатур, и пр), то его предназначение - рипать все подряд (поскольку в "подряд" его основная фишка). Я бы пустил его по инету гулять, через пару месяцев у вас на руках был бы огромный текстовый корпус. А если еще и обдуманно направлять его в кравлинге, то вообще красота.

зы

ждем появления ен_слона, который скажет, что у него целая команда разработчиков и ноу-хау механизм для создания роботов, и он сейчас все разрулит, если вы согласитесь работать с ним в доле 😂

Всего: 3770