- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева

Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Собственно уже долгое время пишу небольшую поисковую систему для собственных сайтов. И особо не задавался вопросом кому-то это нужно или нет, кроме меня.
Но вот недавно сформировал алгоритм, который беря URL страницы пытается сформировать двусловные запросы, для данной страницы. Вот только если ли смысл прорабатывать алгоритм доведя его до более менее приличного результата. На сегодня алгоритм выдаёт вот такие вот вещи :
URL : http://www.lenta.ru/news/2009/08/10/deficit/
Результат : дефицит бюджета
URL : http://www.florist.ru/
Результат :
# доставка цветов
# цветов флорист
# доставку цветов
# цветов доставкой
# заказ цветов
# цветов россии
# заказа цветов
# цветов букетов
# цветов другие
# цветов москве
URL : http://www.2321111.ru/
Результат :
# заказ такси
# заказать такси
# такси москва
# такси москве
# вызов такси
Ну и т.д. Обычно нормально видятся первые 3 запроса, в конце бывают пары совсем глупые. Иногда ничего не выдаёт, почему так еще разбираюсь.
Но в целом в перспективе можно доработать систему для узнавания уже нормальные двусловные и даже трёхсловные запросы.
Как поиск на сайтах, уже созданные алгоритмы меня устраивают вполне. А вот нужно ли реализовать отдельно подобный аналитический сервис ?
Как один из вариантов, конечно можно сделать в итоге робот-обходчик, который будет обходить весь сайт и для каждой страницы формировать основные запросы, к примеру. У меня как раз сейчас на подобном принципе поиск по сайту работает. Создаёт карту ключевых слов (правда однословных пока). В результате будет уже большая карта сайта с ключевыми запросами, как однословными, так и двусловными и целыми фразами.
Если есть какие-то идеи по этому поводу, был бы рад выслушать. Ну и в целом, если кто-то хочет попробовать чего получается, ссылку дам в личку. Просто интересно, насколько так или не так работает.
На каком языке написано? Можно ли взглянуть на реализацию? Каким частям адреса отдаётся больший приоритет?
mymind, идея действительно полезная. После анализа выдаётся список запросов отсортированный по частоте? Если создавать, сервис то он должен быть универсален, не всегда удобно давать для анализа юрл страницы, т.к. на этапе производства сайта будет довольно сложно воспользоваться сервисом для быстрого составления семантического ядра...
Дай ссылку пожалуйста в личку, охота посмотреть.
можно в личку ссылку?
Можно ссылку в личку. Сервис будет мега-полезен, если будет выдавать более менее ключевые запросы для страницы. Прогнал по нему внутренние страницы, сформировал титульники, немного ссылочек подкупил и траф по низкочастотным запросам обеспечен, а самое главное все на автомате.
тоже не против посмотреть. о результатах напишу
серивис действительно был бы полезен, можно тоже ссылку в личку получить? на бета версию?
mymind, прогнал http://www.2321111.ru/ через HTML Analyzer модуль от Semonitor-а и получил похожие результаты (т.е. банальная плотность ключей). Практического применения (в данной реализации) не вижу.
P.S. ИМХО.
mymind, шикарная штучка, сервис точно будет востребован. Желаю удачи!
Кстати, в связке можно использовать мой сервис определения тематики запроса - http://brokenbrake.biz/2009/05/07/lirubric
Он бесплатный, внутренности открыты и могут быть модифицированы кем угодно.
Гм. be1.ru и десктопный Site Content Analyzer, не?
З.Ы. Гм. Рега 2004-го... Значит, наверное, всё-таки не... Не гоже человеку с такой датой регистрации изобретать велосипеды. :) Видимо, я чего-то не понял.
Ссылки отправил, версия пока "детская", алгоритм, который сейчас работает достаточно простой. И пытается построить только двусловные фразы. Ключевые слова тоже выводятся, их можно увидеть в первой таблице. Это как бы не особо интересно.
Хотя более сложный, с некоторым "пониманием" структуры того, что написано думаю будет позже. В конечном счёте я пока вижу "понимание" в ловле схожих сущностей в тексте.
Насколько это точно получится, пока не знаю, но в принципе алгоритм понимания о том, что "офисный стул" и "стул для офиса" это близкие по смыслу сущности, написать можно, частями уже даже готов. И по идее, итоговая выдача должна их объединить в одну группу. Но это в перспективе, пока вот только вариант с попыткой вытащить двусловные фразы из текста.
Рега 2004-го...
Это не показатель. Тем более я СЕО не сильно занимаюсь, я больше разработчик. )))
Не гоже человеку с такой датой регистрации изобретать велосипеды. Видимо, я чего-то не понял.
Как бы не особенно и велосипед. Просто в финале (как я это пока вижу) должен получится скрипт, который устанавливается на сайт (к примеру заказчика) и на следующий день скачивается отчёт, который выдаёт карту сайта, ключевые запросы основные, их релевантность в том же Яндексе, например, относительно страниц сайта.
Собственно в этом есть и отличие от того же SCA. Не надо сидеть и качать весь сайт.
По крайне мере поиск по сайту, собственно всё для этого и затевается, будет очень удачным, нежели имеющиеся в наличие скрипты.
Да и затея имеет и более прогрессивный смысл.