- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Вы думаете, что сейчас в Яндексе реализовано сравнение документов по синонимам? А объем вычислений прикидывали? Мне кажется, что это маловероятно, тем более, что цель не особо значимая - лучше отранжировать ЯК. Не верю. :)
А вдруг оно еще как-то на качества донора\акцептора влияет? :)
Ну, как-то это слишком просто :)
А забить на синонимы проблем нет - один флажок менять :)
sokol_jack, вы так и не ответили на мой вопрос - как вы собираетесь сравнивать документы? ;)
sokol_jack, вы так и не ответили на мой вопрос - как вы собираетесь сравнивать документы? ;)
По результам прогона через БАК.;)
sokol_jack, вы так и не ответили на мой вопрос - как вы собираетесь сравнивать документы? ;)
Отвечу. Только торопится тут не надо - вон уже шуточки про БАК начались ;)
Сейчас делаю кое-какие наброски, мучаю теорию.
а ещё лучше думаю по tf*idf. наверное, там контрастность всё-таки считают :)
эта формула уже не работает.
Найдите самые частотные из не стоп-слов, допустим первые пять. Если в таких списках три пересечения, то ссылку можно считать тематической. Параметры три и пять из головы. Можно еще анализировать текст анкора.
Отвечу. Только торопится тут не надо - вон уже шуточки про БАК начались ;)
Сейчас делаю кое-какие наброски, мучаю теорию.
Думаю тема стоить эксперимента.
Можно брать >% прямого вхождения слова в документ. И относительно него тематику донора рассчитывать.
Просто с синонимами можно либо уйти не туда, либо получить не то, что ожидалось. :)
Склонения можно тащить отсуда:
http://export.yandex.ru/inflect.xml?name=эксперемент тематика
словами, парами. :)
P.S. Время эксперимента ?
Что делать, если страница (сайт) в бан ушёл ?
эта формула уже не работает.
И сразу примеры, почему не работает, если не сложно.
Как-то слишком упрощенно.
Грубо говоря, на первой странице у нас рассказ о том, как хорошо отдыхать на море, на второй - как хорошо отдыхать в горах, на третьей - научная статья о формах жизни в Тихом океане на глубине 1000м.
Первая страница - море, стрелка, арабатская, вода, отдых.
Вторая страница - заповедник, территория, посещение, проезд, крым, карта, водохранилище
Страница №3 - вид, глубина, океан, море, эльпидия, глубоководный, тело
Однако я бы назвал страницы один и два тематичными (тематичными на поределенный %, а не да\нет!).
sokol_jack добавил 30.01.2009 в 11:09
Склонения можно тащить отсуда:
http://export.yandex.ru/inflect.xml?name=эксперемент тематика
словами, парами. :)
Зачем? С морфологией проблем нет (если вы читали топик :) ).
Наше время. Солнечная система, планета Земля. ;)
Пока не получу результат или его отсутствие :)
Если донор - то вводить поправку на количество "сработавших" сайтов. Если акцептор - "Мочить" конкурентов? ;)
И сразу примеры, почему не работает, если не сложно.
Скажем, это результат моих экспериментов, которые я пока не собираюсь раскрывать. Вам от них пользы мало будет, так как вы вряд ли знаете как узнать IDF😎 Мне самому от них пользы пока мало. Со времен Миныча и ХРНС все усложнилось:(
На счет ваших примеров --- может вы и правы. У первых двух сайтов действительно общая широкая тематика. Но лично я, если на информационном сайте читаю про какое-то слово, то хочу по ссылке прочитать еще что нибудь про это слово и в этом случае я бы не посчитал, что эти сайты на одну тему. А если я на коммерческом сайте, то вряд ли там среди наиболее частотных слов не будет "купить", "путевка", "база", "отдых". В любом случае не важно что думаем мы с вами, важно как оценивает тематику Яндекс.
Скажем, это результат моих экспериментов, которые я пока не собираюсь раскрывать. Вам от них пользы мало будет, так как вы вряд ли знаете как узнать IDF😎
А, ну точно. Логарифм - это ж не для обычных людей. Даже с учетом факльтета прикладной математики КПИ за плечами. Пишите еще.
Однако я бы назвал страницы один и два тематичными (тематичными на поределенный %, а не да\нет!).
Ни разу не верю, что ПС сейчас так определяет тематичность.🚬
G00DMAN добавил 31.01.2009 в 18:21
А, ну точно. Логарифм - это ж не для обычных людей. Даже с учетом факльтета прикладной математики КПИ за плечами.
А от чего необычные люди будут брать логарифм? ;)