Комментарии - webpavilion - Профиль вебмастера - Форум об интернет-маркетинге

ТИЦ - большой эксперемент. Статистика по декабрьским АПам.

4 января 2011, 10:56

saykel:
Насколько я понял здесь про некую глобальную константу тиц, которая дается на растерзания вебмастерам? ..
Ну мысль не плохая а как с доказательствами...

статью прочитайте.

Чертежи-схемы страниц сайтов (информационная архитектура)

12 декабря 2010, 18:24

Больше полугода пользуюсь https://gomockingbird.com/mockingbird/ очень удобно, попробуйте. До этого рисовал макеты в Inkscape, долго и нудно.

Синонимайзеры и закон ципфа.

23 ноября 2010, 07:34

G00DMAN:
...потому что самому сделать аналогичный сложновато. :)

ну для настоящего мастера своего дела это не сложнее чем написать классификатор файлов по их расширению, vitali_y уже справился, жаль только что его поделка глубока альфа но все же потенциалом "попахивает" :)

насколько я знаю в МГУ раздавали первую версию анализатора она же была в свободном доступе, яндекс же купил версию 2+ отличаются они (со слов разработчиков) алгоритмом синтаксического разбора и расширенным набором связей в получаемом дереве.

первая версии после плясок с бубном запускается (и работает) в *nux. жаль конечно что исходников не достать...

Синонимайзеры и закон ципфа.

22 ноября 2010, 09:35

G00DMAN:
А как Вы подключаете n-граммы? Что-то я не могу догнать даже на уровне идеи. :(

алгоритм глуп и не универсален, жестко привязан к имеющейся базе.

Текст обработанный синонимайзером бьется на нграммы, частотность полученных nграмм сверяется с "эталонной" в БД.

Если частота в результирующем тексте близка к нулю полученная нграмма считается неестественной и либо откатывается к исходной либо подбирается другой синоним и все с начала.

прикинь щас лично сам медвед целую пару выносил нам моск в гз универа


# # прикинь           102

# прикинь щас          78

прикинь щас лично       6

щас лично сам           9

сам медвед целую        0

целую пару выносил      0

выносил нам моск        1

нам моск в              0

моск в гз               0

в гз универа            1

kapow_expert:
Будет ли ситуация с 3-граммами такая же?

с увеличением размерности nграм растет объем БД, уменьшается количество замен. с 3-граммами будет еще хуже. по мне так это тупиковая ветвь в технологиях спама.

Синонимайзеры и закон ципфа.

21 ноября 2010, 13:13

kapow_expert, дело не в объеме словарей или размерности нграмм, на качество в первую очередь влияет используемый алгоритм. под качеством подразумевается не количество замен а "человечность" получаемого текста.

Синонимайзеры и закон ципфа.

19 ноября 2010, 20:31

Top for the good, наверное вот это имелось ввиду: http://ru.wikipedia.org/wiki/Scigen

Синонимайзеры и закон ципфа.

17 ноября 2010, 11:40

vitali_y, к чему выносить свое невежество на показ? если вы считаете что все вокруг пользуются молотками, это не значит что так и есть.

проблема захламленности рунета генерированными текстами на данный момент не может быть решена полностью, глупо это отрицать.

Синонимайзеры и закон ципфа.

16 ноября 2010, 16:40

vitali_y:
а зачем это делать? зачем захламлять индекс? с какой целью?

Для продажи ссылок и манипуляции выдачей.

vitali_y:
и зачем бороться с этим?

Думаю банальная экономия ресурсов.

При желании я мог бы генерить тысячи ГС с синонимизированным контентом автоматизировав процесс до нажатия одной кнопки. Я не жадны и продал свои наработки еще сотне умельцев. Допустим 500 человек по 3000 сайтов по 3000 страниц с 3000 тысячами знаков на каждой. ~12TB мусорного контента в день. сервера для обработки подобного объема информации стоят немалых денег а пользы от полученного результата нет.

Синонимайзеры и закон ципфа.

10 ноября 2010, 05:26

Stripe:
80% на 20% это все-таки Парето, а не Ципф, сохраняйте копирайты ))

вовсе не он. в вводной статье все расписано, я почти месяц сидел в настоящей бумажной библиотеке.

Синонимайзеры и закон ципфа.

7 ноября 2010, 14:32

G00DMAN, спасибо, все вышеприведенное давно зачитано до дыр. Вы случайно не подскажите где коллекции с РОМИПа добыть?

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Что делать, чтобы попасть в ответы Google Bard

webpavilion