Solo_by

Solo_by
Рейтинг
220
Регистрация
19.06.2009
Должность
web
Интересы
web

Вот такие темы радуют. Такие темы дают надежду..

ansorg:
Я думаю, скоро опять должны нормальные апы пойти, как раньше - ап в 3-4 дня.

Очень надеюсь на это.

У меня вообщем то та же ситуация. Всё стоит на месте, где-то в +10-15 страниц, но это мелочи. Трафа чуть больше стало, но его как было мало так и есть.

Сейчас все друг другу инвайты раздадут, а работать то будет кто-нибудь?) Вылезли у кого-нибудь доры по этой теме уже? Есть конверт?

Solo_by добавил 08.12.2009 в 18:46

И ещё, владельцы партнёрки, сделайте пожалуйста кнопку "Скачать" повыше, так чтобы она на первой странице была у всех. Уж поверьте, это важно.

Ну блин, скоро во всех темах про Арба будут вспоминать.

за ночь?) ну с десяток доров по 2к страниц где то) по 60-70 предложений на странице

Ну тут есть ещё вопрос уникальности и на сколько быстро генерится текст. У меня например генерится достаточно медленно, ставлю пакетную генерацию на ночь и ложусь спать.

ikolibri, А у меня друг в армию не пошёл потому что его личное дело подпирало ножку стола...

на голой нулевой рушке дор?

sokol_jack:

Статистика. Вот что хорошо и плохо. У Яндекса есть небольшой такой :p индекс на хз сколько документов. И уж например (упрощенно) посчтитать н-граммы встречаемости "пар" слов определенных для него всего лишь вопрос компьютерных ресурсов. И найти артефакты, где в одном тексте есть много "пар" слов, которые не встречаются в 99% остальных текстов (а их не один миллион!) - не настолько неразрешимая задача.

Может и так) С этим у меня уж точно никаких проблем нет. Про маркова где-то на РОМИП за этот год был научный труд о том как их распознать, оочень полезная информация. Многое становится ясно.

Я сейчас смотрю в сторону нейронных сетей ;)

А насчет ресурсов Яндекса, в этом вся и соль. В первые апы он проверяет текст по малозатратным для ресурсов критериям, а уже на 4-5 проверяет и стиль текста, и таматику, и бог знает что ещё. Вообщем факторы, которые присутствуют в копирайте, но которые непросто отследить, и которых мало или вовсе нет в генереном контенте. Поэтому, лучше текст - живучей дор.

Я бы так сделал ;)

AssignFile(f,'input.txt')

AssignFile(f2,'output.txt');

Reset(f);

ReWrite(f);

while not eof(f) do

begin

readln(f,s); white(f2,s+', ');

end;

CloseFile(f); CloseFile(f2);

snatch, несовсем так. Условия есть, от условий зависит текущее состояние (или как там оно называется). А вообще я против обсуждения генерации текста в паблике, им место в аськах и хайдах) Так что давайте прекратим.

Всего: 3209