Евгений Молдовану

Евгений Молдовану
Рейтинг
697
Регистрация
02.07.2008
Должность
Senior seo специалист
moalexey:
Возможно это подойдет под вашу задачу

Я пишу на Delphi. Поэтому и ищу алгоритм.

webiumpro:
Вы можете найти родителя h1. Значит все, что выше этого родительского контейнера, уже можно отбросить

Об этом я писал в старпосте. Но проблема определить конец статьи.

webiumpro:
Вы заинтересовали меня этой задачей. Давайте спишемся в личке и проведем эксперимент. Вы мне дадите для теста несколько сайтов, а я попробую реализовать этот алгоритм на php и вычленить контент. Я не возьму за это ни копейки, просто задача реально очень интересная.

Сегодня точно нет, я слишком пьян чтобы осилить код. В теории мы сканим любой топ 10 по информационным запросам.

Я вот это нагуглил и приуныл. Проблема не так проста как кажется

https://toster.ru/q/308852

https://toster.ru/q/23997

webiumpro:
Вполне будет достаточно html-crawler'a и регулярок.

Понятно. Почитал ответы программистов на Тостере и понял что задача нереализуемая, только гадания. Эта проблема уровня поисковиков.

WP_Expert:
по числу абзацев можно

конкретнее?

BLIKSSS:
Софт X-Parser-Light?

Я ж написал что свой софт пишу. Мне бы понять алгоритм.

webiumpro:
Все, что ниже контента статьи, как правило, будет повторяться

Так теги вообще повторяющиеся будут. Вашу мысль я понял, искать какие то повторяющиеся элементы - типа автора или кнопок поделиться или звездочек. Но такое начать определять - тут нейросеть надо писать и обучать на выборке. Сложновато.

fliger:
Сервис умер или еще жив?

очевидно что такие вопросы нужно в сервис поддержки отправлять.

KiraMango:
В среднем у нас 2-я позиция. Но рост только на 20% ( а не на 50% как скаканул вордстат)

Ну тут нужно смотреть комплексно. Возможно рост по регионам или региональным запросам, возможно рост вообще из других стран. Может быть что действительно парсеры накрутили.

KiraMango:
А разве с увеличением количества запросов в вордстате у нас не должна увеличиваться посещаемость?

Зависит от позиций по запросам. Если вы в среднем занимаете 7-15 позицию вы роста даже не увидите.

Кто последнее время закидывал через Телепей - как оно?

А то уже 2 дня жду, до этого мгновенно приходило. В правилах видел до 5 дней, стоит ли беспокоиться раньше?

Игорь11342, а конверсия в продажу отличается от стандартной?

Kitaer:
У Яндекса там что то заглючило и алгоритм выкинул из выдачи половину страниц. Пришлось несколько недель переписываться с техподдержкой

Полгода назад была та же история. Из-за глюка в Вебмастере сайт не перевелся на https и вылетели страницы. Ситуация была осложнена тем что после вылета копипалстеры моих страниц по многим запросам оказались выше меня.

P.S. - переезд делал по всем канонам.

Потом переводил еще 3 сайта - никаких проблем не было. Так что как повезет.

Badmaestro:
что сигналы из соц. сетей и яндексовский ИКС (аналогия ТИЦ) там занимают первые места по Яше

Есть такое понятие как причинно-следственная связь.

Если ИКС производная от посещаемости, то посещаемость производная от позиций или трафика соц сетей. А значит подобные доклады с факторами ранжирования можно выкинуть в топку.

Всего: 9953