Тимон

Тимон
Рейтинг
74
Регистрация
08.06.2007
Zonk:
это, как бы так сказать... демка, показывающая, что качественно размножать статьи способен только человек. Использовать такую машинную уникализацию не рекомендую - то же самое, что копипаст, если не хуже.

+1

Тогда все понятно.

На счет человека согласен.

Хотя, синонимайзером тоже можно, правда читабельность страдает сильно

Zonk:

не понял, о каком генераторе идет речь. Вообще уникальность зависит от шаблона для размножения, при хорошем шаблоне вполне возможно 0% сходство всех вариантов по 10-словному шинглу.

http://www.liex.ru/uniquelize.jsp - или это просто демка?

Dimoogle:
А попробовать мозгами тряхнуть можно? Не задумывались почему с 1000 купленных ссылок тИЦ дай боже 20 набегает, а ведь если 1000 естественных ссылок это минимум тИЦ 300 а то и вообще 1000 если качественные сайты. следовательно раз яндекс не передаёт тИЦ значит на самом деле он в курсе всех площадок, которые продают ссылки через сапу, ксапу и подобные системы.

ну на мой блог о фотографии ссылается примерно 300 сайтов, >4000 беков - и что? тИЦ как болтается в районе 50, так и болтается уже год. При этом, сами понимаете, все ссылки тематичные.

---------------------

На счет уникальности - ну посмотрел я генератор от liex - 30-40% схожести при использовании метода шинглов для оценки, что уже не есть хорошо. Учитывая, что Яндекс использует подобие метода описательных слов, то такие сгенеренные статьи он сможет отлавливать достаточно хорошо

---------------------

До конца не осознал плюсы продвижения статьями по сравнению с тем же блогуном (написание мини-обзора). В блогуне заказываешь обзор - текст напишут хоть и краткий, но уникальный, анкор твой подставят. В новом посте все будет, который не проиндексирован...

---------------------

Итого, может сейчас статьи и дают в некоторых случаях больше преимуществ, чем Сапа, но на перспективу - кажется мне, что все эти биржи, когда станут массовыми, выродятся и превратятся в обычную помойку. Что поможет? Ручная модерация площадок, жесткий контроль, доступ не для всех и все в таком же духе.

wolf:
На мой взгляд, изменений явно недостаточно, чтоб утверждать о неактуальности "по большей части".

Как пользователь, я могу сказать, что ранжирование по низкочастотным запросам стало хуже, мне стало труднее искать.

Из-за отказа от контекстных ограничений сменилась логика поиска, его изначальный принцип... С точки зрения алгоритма, может изменения и не такие сильные

wolf:
С чего Вы взяли? Поизучайте на досуге оператор &

Не, понятно что напрямую через строку запроса можно задать что типа такого

Просто нет переколдовки типа "пластиковые &/(-1 3) окна", как раньше была

wolf:
С чего Вы взяли, что по большей части? Можно зафиксировать только лишь неактуальность кворума на данный момент (ну, и, соответсвенно, неполных пассажей). Или Вы коэффициенты контекстуального сходства проверяете? :)
  • Нет контекстных ограничений
  • Соответственно нет деления на предложения
  • нет кворума

Вроде бы осталась "тошнота" и какой-то алгоритмический учет словопозиций.

При этом, словопозиции, возможно, учитываются как на ромипе 2006.

Хрен его знает, как точно, надо сидеть ковыряться - я как-то темку поднял , да желающих поговорить было немного.

П.с. Имхо, это сильные изменения :)

wolf:
Так Сегалович же давно всё описал. Про контрастности, про расчет веса словопозиций, про вычисление сходства расстояний, про коэффициент контекстуального сходства, про деградацию неполных пассажей, про табулированный набор коэффициентов, в конце концов. Для кого это всё писалось, спрашивается? :)

Это про два Ромиповских доклада?

+ труд австралийцев про lexical spans?

Только ща Ромип*04 неактуален по большей части...

Если говорить о синтаксической оценке текста, то тут ничего сложного нет - структуру предложения (подлежащее, сказуемое, группа однородных прилагательных и т.д.) выделить можно. Можно даже пойти дальше и вести оценку текста как в Word'е .т.е. используя тезаурус. Вопрос в затратах - хз, насколько это ресурсоемко.

Вопрос также и в том, а повышает ли такая глубокая оценка точность оценки релевантности текста? Тут можно долго гадать, пока мы не попробуем провести практический эксперимент. Яндекс наверняка проводит, так что ему виднее, где накручивать, а где достаточно TF*IDF

savage:
Какой ап прошел? Сегодня только ап тИЦ. Последний ап был 10-го числа, после которого я и создал эту тему.

да, поспешил я мальца...

П.с. <index></index> - это вроде для того, чтобы робот Бегуна индексировал то, что хочет вебмастер

Всего: 265