- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
А я бы вот в яндексе такую бы фишку сделал - если сниппеты одинаковые, то выводить только первый (самый релевантный) результат. Идея конечно спорная, но видеть три страницы подряд одно и тоже - убивает.
О у меня пункт 2 готов, спасибо Миха
2) количеством дублей и невозможностью определить оригинальный источник
Вообще я не совсем в курсе, но база приблизительно так устроена:
Есть словарь из нормализованных словоформ.
Есть база с документами, каждый документ представляется списком, в котором элементы есть id от словоформы + еще несколько параметров (вес слова, допустим).
Более-менее верно ?
Насколько я понимаю решений по оценке ценности инфы никто не предложил. А если к этому вопросу подойти с другой стороны, зачем поисковой машине оценивать ту или иную инфу, её степень. Пусть сам "клиент сети" на своём ресурсе оценит её и при регистрации на поисковой машине даст основные сноски на неё. И без этих сносок не регистрировать его.
Как один из вариантов ???
Я так и не понял, что вы подразумеваете под ценностью информации и уж тем более, как ее может определить сам "клиент сети".
Ценность, главное, что несет в себе сайт или другой ресурс.
Для примера. Туристический сайт посещают с целью посмотреть маршруты предлагаемые агенством и их стоимость, где на первом месте стоит даже стоимость и ее, по моему мнению надо ставить на первое место, а не прятать за мишурой. А когда посетитель получит необходимую информацию я думаю он просмотрит и дополнительную которая как правило выставляется наружу.
Так вот. Для меня ценность указанной вами информации - ноль. Я только что вернулся из отпуска.
Для другого будет ценна именно та информация, которую вы считаете мишурой (описание Тадж-Махала какого-нибудь).
Вероятность того, что ищущий Тадж-Махал захочет его увидеть воочию достаточно велика. Так рассуждают все туристические агентства и правильно делают.
Я о другом пытаюсь сказать. Я это называю "привлекающей информацией", которую в том или ином виде используют большинство сайтов.
Например, работные ресурсы с поражающей методичностью используют на своих сайтах Классификатор профессий ДК 003-95. Иногда очень даже изобретательно используют. Но они не являются официальными источниками, никакой веб-мастер никому не гарантирует того, что пользуется последней версией (издание постоянно дополняется). Официальную версию этого классификатора и даже его издательство их стараниями найти невозможно (не продвигает ее никто, что не удивительно). Получается странная ситуация, когда информацию подают все, кому не лень, никто не гарантирует ее актуальности и достоверности, а официальный владелец неизвестен (невидим через поисковики по крайней мере).
Кстати, согласен с товарищем Тихоновым на все 100, что проблема
а) заключается в сущности используемых стат. методов
б) в недостаточности современных вычислительных ресурсов для отказа
от "статистики"
хочу сказать, что даже такая "тривиальная" операция, как составление смысловой "выжимки" документа, ее автореферата замедлит индексацию в разы. а смысловая "выжимка", кстати говоря, могла бы несколько улучшить качество поиска по коротким запросам и существенно усложнить жизнь спаммерам. одно дело: ломать статистику (с более или менее известными алгоритмами), другое дело программу реферирования (которая гораздо сложнее).
А я бы вот в яндексе такую бы фишку сделал - если сниппеты одинаковые, то выводить только первый
Есть данные, что именно по такому принципу работает фильтрация дубликатов в Google. В Яндексе алгоритм намного мощнее. Почему тогда встречаются дубли? Вероятно, запускают чистку базы от дублей не так часто, как хотелось бы.
С уважением,
Александр Садовский.
euhenio, если