- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Пару раз на форуме видел интересную мысль но она постоянно пропадала под потоком флуда.
Итак, как бы я модифицировал ссылочное ранжирование? Для начала вернемся к истории. Как известно, алгоритм ссылочного ранжирования базируется на схожем алгоритме пришедшем из системы оценки авторитетности научных трудов. Естественная ссылка из одного научного труда на другой имеет анкор, собственно ссылку и ТЕКСТ в ссылающемся труде для объяснения, цитирования и т.д. которого собственно используется данная ссылка. Очевидно что давать ссылки на труды не использованные при написании данной работы не имеет смысла.
Теперь вернемся к ссылочному ранжированию в интернете. На данный момент активно используется только два фактора: ссылка и анкор. Однако третий фактор а именно учет текста, связанного с данной ссылкой, не используется или используется неактивно.
Очевидно, что именно этот фактор можно использовать для определения естественности и неангажированности ссылки. Для этого нужно определить, в каких именно местах относительно ссылки располагается связанный с ней текст.
Вариантов я вижу 3:
1) Ссылка располагается рядом с текстом, а именно: внутри, непосредственно перед (редко) или после.
2) Ссылка располагается в конце документа в виде сноски, однако из связанного с ней текста есть ссылка на эту сноску
3) Тоже самое что пункт 2, только без ссылки на сноску.
Видно что пункт 2 можно свести к пункту 1 (с некоторыми усилиями).
Теперь попробуем построить алгоритм который бы учитывал третий фактор. Для этого необходимо попробовать ассоциировать документ реципиент с некоторым фрагментом документа донора. Соответственно, в ссылочном помимо текста анкора учитывать слова из фрагмента. В частности можно вообще не учитывать слова в анкоре если их нет в достаточно большом ассоциированном фрагменте.
Возможны несколько вариантов ассоциирования:
1) Просто взять кусок документа донора вокруг ссылки (годица для варантов расположения 1 и 2 )
2) Взять весь документ-донор.
3) Взять кусок документа донора имеющего смысловую связь с документом реципиентом (хрен знает как делать, но было бы круто)
Очевидно что использование данного алгоритма сильно ударит по продажным мордам. Так как вокруг покупной ссылки должен быть еще достаточно большой тематический кусок контента. Способ обхода данного алгоритма очевиден:-)) Однако он потребует увеличения стоимости ссылок, так как ссылок можно будет разместить совсем немного;-)
Горю желанием обсудить возможность применения данного алгоритма яндексом.
ЗЫ. Горю еще большим желанием продать данный алгоритм яндексу. Хотя уверен что там люди неглупые и его уже внедрили.
Пару раз на форуме видел интересную мысль но она постоянно пропадала под потоком флуда.
Думаете, постоянно пропадала, а если оформить отдельной веткой - флуд отступит в священном трепете?
Мне кажется, рассуждения дилетантов интересны только другим дилетантам, а никак не Яндексу, отсюда и флуд - это по теме :)
Каширин, если честно, то хочу мысли по теме. И если не возражаете, то давайте потрем 2 наших поста;-) А то действительно увязнем во флуде
Очевидно что использование данного алгоритма сильно ударит по продажным мордам. Так как вокруг покупной ссылки должен быть еще достаточно большой тематический кусок контента. Способ обхода данного алгоритма очевиден:-)) Однако он потребует увеличения стоимости ссылок, так как ссылок можно будет разместить совсем немного;-)
На самом деле "достаточно большой" не такой уж и большой. Обычно, для поиска уникального контента хватает пяти-шести слов из него в точной последовательности и форме. Поэкспериментируйте в Яндексе.
А в настоящий момент большинство продажных морд позволяют использовать в ссылках до 70-80 символов. Пять-шесть слов вполне влезет. И Яндекс все это дело давно и легко определяет и использует.
На данный момент активно используется только два фактора: ссылка и анкор.
C чего ты взял, что используются только два фактора?
Не забывайте, что при разработке того или иного алгоритма огромное значение играет его экономичность, т.е. количество операций. Сегалович где-то упоминал, что, к примеру, алгоритм HITS намного лучше PageRank'а, но т.к. сильно уступает ему в экономичности, то не используется.
Решения яндексоидов должны быть изящны, но нетривиальны именно в силу ограничения, накладываемого экономичностью.
Мишган, скажите, вы читая посты ХРНС, всегда понимаете, о чем он говорит? читали источники, на которые он ссылается?
алгоритм HITS намного лучше PageRank'а
а можно, извиняюсь, об этом поподробнее... просто ранее не слышал... если возможно то со ссылками на первоисточник, или реальные статьи по теме...
заранее спасибо!
а можно, извиняюсь, об этом поподробнее... просто ранее не слышал... если возможно то со ссылками на первоисточник, или реальные статьи по теме...
заранее спасибо!
Например
http://company.yandex.ru/grant/2005/06_Kozlov_102805.pdf
http://www.obgoni.ru/2006/10/30/algoritmyi-sortirovki-poiskovikov-hits/
остальное найдете по запросам алгоритм hits и т.п.
C чего ты взял, что используются только два фактора?
Вообщет то я сказал что АКТИВНО используются. Из этого следует, что третий фактор используется НЕАКТИВНО, а не то что он не используется ВООБЩЕ.
Мишган, скажите, вы читая посты ХРНС, всегда понимаете, о чем он говорит? читали источники, на которые он ссылается?
А это тут причем? Мне неинтересна техническая сторона поиска, вычисление весов различных факторов и т.д. Мне интересно КАКИЕ факторы могут быть использованы при поиске.
А в настоящий момент большинство продажных морд позволяют использовать в ссылках до 70-80 символов. Пять-шесть слов вполне влезет.
Никто не делает цитату ради 5 слов. Нужен фрагмент значительно большего размера!
если возможно то со ссылками на первоисточник, или реальные статьи по теме...
Первоисточник здесь:
http://www.dialog-21.ru/trends/?id=15539&f=1
Насчет того, что Сегалович его назвал лучшим, прошу пардону, это я, получается, присочинил :), но то, что он сказал, что тот не не используется на практике в основном из-за вычислительной дороговизны - факт.
Первоисточник по алгоритму HITS: http://www.cs.cornell.edu/home/kleinber/auth.pdf
Никто не делает цитату ради 5 слов. Нужен фрагмент значительно большего размера!
Я исхожу из точки зрения оптимизатора и из точки зрения практического использования морд и эффективности ссылок с них. Для того, чтобы Яндекс однозначно определил, что именно "эта" ссылка является цитатой именно из "вон того" текста с "вон того" сайта, часто хватает пяти-шести слов. А поисковому роботу "бир-бар" до человеческой подозрительности: "как же так, не может же быть, чтобы процитировали пять слов"! Тем более, что в мире есть достаточно много мудростей и афоризмов из нескольких слов, которые четко обозначают свой источник и которые "не грех" процитировать.