все переживают за свои спамные ссылки, аппелируя тем, что какие-то там "невинные" сайты пострадают. невинных нет, есть полезные и бесполезные.
они сразу пропалят, кто это сделал :)
надо это партизански потихоньку делать ;)
Это Вам кто-то сказал или мысли вслух?
Определение тематичности можно сделать автоматом причем как по семантическим параметрам, так и по поведенческим. Для первого нужно иметь всего лишь таблицу тематик, таблицу метрик между ними и собственно коллекцию документов (с уже определенными тематиками), для второго нужно иметь достаточно репрезентативную историческую выборку по поведению пользователей. по анализу этой выборки можно задать соответствующие веса (как вероятность перехода пользователя по ссылке с документа А1 и тематикой В1 на документ А2 с тематикой В2)
Множество этих примеров утопает в множестве спама (тут неравенство можно задать как <<)
Что касается новостей, то если они нетематичны, то нужны ли они пользователю? это раз. А нормальные новости со статьей и всеми делами имеют тематический контекст, поэтому с ними все нормально.
😕 это когда отвечал на вопросы после доклада? что-то у меня это в голове не отложилось...
хотя мне лично по барабану, индексируются они или нет, я столько на одну страницу не засовываю...
Всем спасибо! Приятно было познакомиться!! :)
Torio незачет за отсутствие на футболе! ;)
На вопрос о тематичности А.Садовский однозначно ответил, что Яндекс умеет определять тематичность, причем уже давно. Понятно, что если есть возможность определения тематики документа (без наличия сайта в ЯК), то можно и определить тематику ссылки. Если есть рубрикатор тематик, то можно найти метрику между двумя тематиками (семантически или даже поведенчески, имея хорошую историческую выборку). если есть метрика, то можно получить коэфициент тематичности и умножать на него ссылочный вес, передаваемый по ссылке. why not? можно даже поставить эксперимент.
и офф небольшой. про доклад Садовского. Думаю, что он не просто так назывался "качественные сайты с точки зрения Яндекса", а в основном там говорилось про недостатки... и демонстрировались наиболее популярные методы (сомнительные по эффективности), такие как линкопомойки, линк-фармы, сеточные автоматы, копи-пастеры и прочие вещи, не несущие никакой пользы и/или не имеющие добавочной ценности для пользователя. Я полностью согласен с Александром в том, что всё, что сделано исключительно для поисковых систем и не имеет никакой ценности для пользователя должно быть (и, надеюсь, будет) отправлено в топку.
или слушателей... :(
Ох, блин, отличная получилась вечеринка!!!!!!!!!! спасибо всем! :) :)
Пиво было очень вкусное, но я только проснулся и на конфу, значит, недетски опаздаю :)
Flamingo, Паш, а есть наши с фруктом фотки? (я понимаю, что мы обычно несколько нефотогеничны, но все же...) ;)
Андрей, а можно я тоже с тобой поеду? :) потому что я буду без машины эти два дня навеселе гонять 😂
значит мне не повезло :) в те дни, когда я ходил, тикеты давались автоматом по нажатию кнопки без паспорта. при мне к этому аппарату подвалил чувак торчкового типа и получил около десяти тикетов по разным тематикам. потом на улице ими барыжил нагло. поэтому у меня было так, что беру билетик, там а225, а очередь на табло показывает а67 и медлеееенно так двигается. если у барыги не купить, то можно и пролететь.