Oxem

Рейтинг
52
Регистрация
10.10.2010
adel92:
А вы символьные ссылки используете в структуре каталогов?

У нас не символические ссылки на сайте, а обычные ссылки с get параметрами.

---------- Добавлено 11.10.2017 в 16:26 ----------

dma84:
AcceptPathInfo Off

---------- Добавлено 11.10.2017 в 13:14 ----------



Проблема с base url и урлами вида "images/content", без указания корня

Спасибо, dma84

Настройки apaсhe AcceptPathInfo Off пока не получилось настроить, на локалке сломался апач)

При добавлении следующего кода, страница открылась корректно

<head>

<base href="http://site.ru/"/>

</head>

Добавили в robots.txt Disallow: *.php/* и вроде все нормально.

Самый главный вопрос от куда взялись инъекции в запросах яндекса?

Может нас кто то проверял, а яндекс это проиндексировал?

перестал открываться минуту назад

pimandr:
Идея хорошая, и что важнее - при беглой проверке реальной ситуации не противоречит)
2 вопроса к вам:
- планируется ли вариант исключения из текстов страницы участков, закрытых от индексации?
- если не секрет, что за словарь словоформ используется? И насколько он полон?

Спасибо за интерес, проявленный к нашему сервису.

-Да, такая возможность будет реализована. Мы постоянно дорабатываем и улучшаем наш сервис.

-Используемый словарь - это наша личная разработка. При обработке текста погрешность в районе 10%

site+:
А если взять эту (вторую) страницу топика целиком, то тоже "Оценка качества: 42% (плохо)"....
Выходит тут боты штампуют посты, а мы читаем, находим смысл...

Здесь больше половины рекламных текстов.

У меня на (второй) странице получилось 59% :)

tolika:
Задумка, конечно, интересная.

1. Кстати, по "авторитетным" заявлениям некоторых исследователей, поисковики проводят статистический анализ "естественности" сочетаемости слов (пар слов) (биграмм). Ведутся ли разработки в этом направлении?


2. Во многих технических и научных текстах "переспам" некоторыми терминами просто неизбежен (например, инструкция по применению аспирина) - как поисковики относятся к таким "естественно переспамленным" текстам?

3. При определении релевантности текста (ключевого слова) запросу, частотность ключа (imho) должна быть выше среднестатистической... Или это необязательное условие?

============================================================
В качестве эксперимента отредактировал ГС своего блога согласно вашим рекомендациям. Через месяц отпишусь.

Спасибо за комментарии, постараемся ответить на поставленные вопросы.

1.Данные «авторитетные» исследователи ссылаются, очевидно, на публикацию: «Поиск неестественных текстов». Источник: http://download.yandex.ru/company/A_Kustarev_A_Raigorodsky_poisk_neestestvennih_textov_statia.pdf.

Следует обратить внимание, что авторы статьи позиционируют данный метод как один из возможных вариантов определения «естественности текста» и никоим образом не утверждают, что он используется ПС Яндекс.

2.Согласно закону Ципфа частотность встречаемости слов должна ложиться на некую плавную кривую (диаграмма Ципфа ) Мы поставили несколько экспериментов на технических (математических) текстах. Результаты показали «70%» соответствия, при достаточных объемах.

3.По нашему мнению это не обязательное условие.

P.S. ТС сейчас отсутствует, приходиться отвечать за него :)