- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Всем "здрасьте"!
Дело такое: я написал счётчик для "движка" (сайты, сделанные на этом движке, хостятся у нас, так что проблем с серверными скриптами нет). Собирает данные надёжно и хорошо. Но вот как стал аналитику делать - на анализе заходов через поисковики и каталоги - хоть вешайся!!! Проблема в том, что сложно формализовать форматы адресных строк. Например, в Яндексе видим строку "http://www.yandex.ru/yandsearch?text=<строка в формате %xx>". И вдруг, потом - "http://www.yandex.ru/yandpage<...>&qs=text%3D<строка в формате %xx>". Во втором случае вместо Win-1251 используется непонятная кодировка (по "Штирлицу" - UTF-7 -> KOI-8).
На остальных поисковиках тоже неясно.
А в каталогах - вообще смерть...
Может, кто-то знает эти форматы? Подскажите, плиз
http://ktmatu.com/software/relax/ - на Perl
там в исходниках покопайся.
Посмотрел, спасибо. Но, как я понял (или не там смотрел?😕 ), там не парсится поисковая фраза, а всего-лишь идёт поиск роботов (по URL) в качестве ссылающихся страниц
Может, кто-то знает эти форматы? Подскажите, плиз
На самом деле там все достаточно несложно... Сплитуешь запрос на переменные, каждую анализируешь, выбераешь какая нужна и вперед...
Вариантов для Яндекса не так уж и много, для Гугля еще проще (имхо).
Я сейчас одну фишку задумал написать, мне с этими запросами тоже разбираться придется, так что если время терпит - подожди, кусок скрипта отдам. А по-другому - кинь в личку конкретное техзадание - попробую для тебя написать (за пиво 🍻 )
Вариантов для Яндекса не так уж и много, для Гугля еще проще (имхо).
Проблема не только в том, какое ключевое слово в каким URL определяет поисковую фразу, но ещё и в том, что непонятно чем и как управляется кодировка - был бы юникод (явно %uXXXX), так всё было бы проще, а то лишь двухбайтовые (по умолчанию - Win-1251), но переключатели кодировки в некоторых местах стоят - например, в гугле (проверено - по ключевым словам "ie=..." и "oe=..."), да и в яндексе зачем-то "цепная" перекодировка встречается.
Я сейчас одну фишку задумал написать, мне с этими запросами тоже разбираться придется, так что если время терпит - подожди, кусок скрипта отдам. А по-другому - кинь в личку конкретное техзадание - попробую для тебя написать (за пиво 🍻 )
Смотри, как бы не наоборот ;) 🍻
А если серьёзно - могу, кому надо, скинуть, что сам нарыл по поисковикам...🚬
Штирлиц не поможет. Я с этой проблемой сталкивалась, когда анализировала поисковые запросы из логов. Фишка в том, что иногда (насколько я поняла - если браузер соотв. настроен) при передаче запросов используется юникод, который представляется через UTF-8. Поэтому чтобы разобрать запрос, надо раскодировать UTF-8. Почитать можно здесь: rfc 2279 .
Чем богаты...
Ща обогатим! :)
http://www.science.co.il/analog/SearchQuery.txt - оно обновляется.
По поводу кодировок - вроде все не так сложно, Гугль если в UTF-8, то эта подстрока есть в URL, а Яндекс имеет две разные кодировки на yandsearch и yandpage. Хотя это утверждение могло устареть.
А скрипт для расшифровки UTF-8 был у одного из участников форума (LiM, если быть точным).
Спасибо, богатая коллекция 🍻
Кстати, про поводу яндекса:
http://www.yandex.ru/yandpage?q=<id>&p=<# страницы>&ag=h&qs=text%3D<... поисковая строка ...>
Прикол в том, что в этом случае поисковая строка не "%хх%хх%хх", как можно было ожидать, причём 'xx' - 16-ричный код в Win-1251, а примерно так:
http://www.yandex.ru/yandpage?q=11111111&p=2&qs=text%3D%25xx%25xx%25xx
т.е. знак "%" меняется на '%25', но 'xx' - уже непонятно в какой кодировке :(
И заметьте, уже ключевое слово не "text=", а "qs=text%3D"
Кстати, про поводу яндекса:...
уже непонятно в какой кодировке :(
Яндекс - найдем все.