Бан 14ого.

G
На сайте с 01.09.2006
Offline
38
#51

Smile8979, а ты какой алго для генерации текста юзаешь?

S8
На сайте с 26.09.2008
Offline
45
#52

gmario, Скажем так не "Цепи Маркова" Это ведь даже не вчерашний день это можно сказать прошлая неделя. Не думал что их ещё кто-то использует.

G
На сайте с 01.09.2006
Offline
38
#53

Smile8979, да а почему бы и нет? Правда я сделал пост-обработку текста ещё. Минус - долго генерится, плюс - дофига уник текста без какой-либо там синонимизации. Но я задумался... Ты сам свой алго разрабатывал или что-то публичное?

S
На сайте с 01.01.2009
Offline
10
#54
Smile8979:
gmario, Скажем так не "Цепи Маркова" Это ведь даже не вчерашний день это можно сказать прошлая неделя. Не думал что их ещё кто-то использует.

Ну достаточно взглянуть выдачу :) Попробуй найти НЕ цепи Маркова или их модификацию(ну и вся остальная байда с перемешиванием, перестановкой текста). Альтернатива это лишь перевод языка туда-обратно, синонимизация. А для хорошей морфологической библиотеки нужна мощная система, я вот пробовал генерить "правильный" текст: 4000 слов с пост обработкой строились около часа!(зато текст был более-менее вменяемым). Да и представитель Яндекса на какой то конференции рассказывал, что морфологический анализ занимает у них 70% мощностей... Видимо 14-го его и запускали :) Хотя из моих доров только половина вылетила )

G
На сайте с 01.09.2006
Offline
38
#55

spzero, да как-то смотрел выдачу, вроде ничего этакого не нашёл. Но способ я таки уже придумал, вот его думаю и прикручу.

Про перевод - это много прокси надо или какой-то локальный переводчик... или я не прав и давно не в теме?

p.s. - банили, кстати, не только по морфологии, но и по свежести доменов, возможно ещё какие-то факторы.

S8
На сайте с 26.09.2008
Offline
45
#56
gmario:
Smile8979, да а почему бы и нет? Правда я сделал пост-обработку текста ещё. Минус - долго генерится, плюс - дофига уник текста без какой-либо там синонимизации. Но я задумался... Ты сам свой алго разрабатывал или что-то публичное?

Генериться долго это сколько? Я скажем создаю из 10 мб парсеного текста 10мб уникального, более менее читаемого примерно за 2-3 час, столько уходит на генерацию. По поводу алгоритмов создания, в паблике самих принципов я не видел + собственный софт.

spzero:
Ну достаточно взглянуть выдачу Попробуй найти НЕ цепи Маркова или их модификацию(ну и вся остальная байда с перемешиванием, перестановкой текста).

Судя по всему плохо смотрите.

Claremont
На сайте с 17.03.2009
Offline
92
#57

Значит филтр: адалт+недавно зареганные домены+морфология? Может просто первые две?

Время - это капитал работника умственного труда. (с) Оноре Бальзак
Z
На сайте с 09.05.2009
Offline
116
zac
#58

Насколько я знаю якодорген и редбатон используют цепи маркова. Разве не так?

[Удален]
#59

Я думаю просто в последнее время появилось дофига школоты, которая возомнила себе, что всё теперь золотая жила и они теперь супер великие дорвейщики.

Это Яндекс готовит эту школоту к учебному году.

Думали, купили софт и всё полились деньги. Фиг вам, тут мозг нужен, которого у вас нет и не будет никогда.

Claremont
На сайте с 17.03.2009
Offline
92
#60

После 20и минутного изучения выдачи пришел к выводу что бан очень даже справедливый хотя свои доры я тоже потерял сегодня. Еще раз руки и только руки. Автоматизация зло.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий