AiK

AiK
Рейтинг
257
Регистрация
27.10.2000
Должность
SEO consultant
Интересы
Astronomy

Спасибо.

Интересно, а на Украине продолжают отмечать день рождения Красной Армии?

Не во всех СЕ не все фри хосты забанены.

В рунете так вообще фри хосты не банят.

Написать не сложно. Впринципе пожно обойтись JavaScript-ом. А про такие сервисы я действительно не слышал.

<font face="Verdana" size="2">Originally posted by eXtrime:
Не знаю, как российские поисковики.</font>

По МЕТА тэгам информации нет, но тэг title похоже ничем не ограничен. Я уже нашёл образчики в Яндексе, находящиеся на первых страницах и содержащие чуть более 7000 (семи тысяч!) слов в заголовке.

В Рамблере и Апорте встречались экземпляры с 1000 и более слов в заголовке (см. топик о борьбе со спамом в рунетовских поисковиках). Но если честно, то я там ещё особенно и не искал.

<font face="Verdana" size="2">

процитирован Gray
... меня часто спрашивают, можно ли взять материалы с форума. Однозначно, нет.

</font>

И всё же я спрошу ещё раз:

я собираюсь цитировать (в рассылке, связанной с работой моей программы)

некоторые выссказывания Игоря и Ильи, в основном ответы на мною же заданные вопросы. "Не будет ли столь любезен многоуважаемый джин" (© м/ф Барон Мюнхаузен)

разрешить мне поступать подобным образом?

Если да, то ссылки какого рода размещать:

1. На сайт

2. На форум

3. На конкретный топик?

С уважением,

Артём.

Хм. Хороший вопрос. Я бы сказал что теософский. Знаешь как в хр. религии определяют дьявола? Дьявол - есть обезъяна господа Бога, которая всё делает в темноте сзади и наоборот. Более прямого определения ты не найдешь. Т.е. дьявол есть антитеза.

Так же и со спамом. Цитируя себя любимого :


Релевантность (англ. relevancy) - уместность. Соответственно релевантный - уместный, или относящийся к делу.

... спам - понятие прямо противоположное уместности. Тут надо сделать маленькое уточнение. Некоторые вебмастера ошибочно считают, что релевантность документа поисковой фразе - это частота употребления этой фразы в документе и в, частности, в различных тэгах как то: &lt;TITLE&gt;, &lt;A&gt;, &lt;B&gt;, &lt;H1&gt; и др. Позвольте не согласиться. Я ещё раз напомню русский эквивалент термина - уместность. Так вот, документ, в котором через каждые два-три слова встречается одна и та же фраза (или слово) - не уместен, или попросту является спамом.

И ещё одна цитата:


Вот как описывает спам Дмитрий Тейблюм (Яндекс) в моей с ним переписке:

On 22-Jan-01 Artyem V. Shkondin wrote:
&gt; Здравствуйте!
&gt;
&gt; Хотелось бы узнать у Вас немного больше о том, что поисковик Яндекса считает
&gt; спамом, чтобы второй раз не наступать на те же грабли.

Критерий очень простой. Вы уже могли слышать, что наша поисковая
система занимается поиском в текстах, предназначенных для чтения
людьми. Все остальные тексты (например, предназначенные для
заманивания пользователей www.yandex.ru) считаются спамом.

<font face="Verdana" size="2">Сергей, Артем, тут проблема, на мой взгляд, опять "моральная". Прежде всего, для чего программа предназначена? Если посмотреть на пп. 1,3 вполне можно предположить, что собирались анализировать частоты не только своих, но и чужих текстов. Свои обычно, это doc, txt, а веб-адрес - htm, не так много народу творит сразу в хтмл'e. Тогда и будем исходить из того, что программа нужна для расчета параметров, которые могут иметь значение при расчетном позиционировании.</font>

Технологии двойного применения

Я вопрос собственно задавал потому что, обсуждение функциональности программы к поисковикам не относится, а не потому что кто-то будет использовать программу для спама. Опять-таки прямого определения спама не даёт ни один из рунетовских поисковиков.

<font face="Verdana" size="2">
Самый простой способ, обеспечивающий наглядность - сравнение.

В этом случае прога должна иметь не одно, а два окна и два входных адреса - в одном выводятся данные по тексту, который пользователь собирается, например, подать на индексацию. В другом данные какого-то "эталона". Очевидно, что в качестве эталонов будут использоваться страницы, стоящие на верхних позициях в листах ответов по интересующей пользователя тематике.
</font>

Так и быть, для тех кто не в состоянии запустить два варианта программы, или страдает склерозом, добавлю кнопку save

<font face="Verdana" size="2">
Второй момент, который нуждается в прояснении, - это вопрос о ключевых словах. То, что находится в тэге keywords - не ключевые слова в понимании к нашим поисковикам, это уже давным-давно устарело.
</font>

Извини за тавтологию, но ключевым словом здесь является META. Чёткого определения термина под рукой нет, но метаданные(metadata) в моём понимании - это "управляющие данные, построенные на основе исходных данных". Т.е. поисковик сам строит ключевые слова для страницы. НО, если построенные мета, совпадают с теми, что были найдены в тэге, вес такого ключевого слова повышается некоторыми поисковиками.

<font face="Verdana" size="2">
Далее простейшая процедура - ввод в анализируемую поисковую систему известной формулировки запроса, получение листа ответов переход на сайт, занимающий привлекательную позицию и анализ его текста именно по словам запроса. Т.е. наличие слов запроса в тексте, титуле, тэгах выделения, если очень хочется, то в keywords&description, заголовках, альтах, отношение к общему объему текста (вес), близость к началу текста. То же самое для каждого слова запроса за минусом стоп-слов.
</font>

Согласен, добавлю, но насколько я понял изначально задача была несколько другая - найти при помощи программы те слова, по которым потенциально будет релевантен документ. Очень часто "выстреливает" какое-нибудь весьма неожиданное слово. (Я уже писал, что одна из моих страниц впереди всего рунета по тушёнке )

<font face="Verdana" size="2">
То есть, нужна машинка, которая будет сравнивать параметры двух произвольно выбранных страниц по любому выбранному пользователем поисковому запросу.
</font>

всё же право на сравнение я оставлю за пользователем. Т.е. это будет "машина по определению параметров документов"

<font face="Verdana" size="2">
Его, кстати, и в онлайне можно довольно быстро организовать.
</font>

Не понял. CGI что ли рисовать?

<font face="Verdana" size="2">
Вопрос открытый. Артем, Сергей, будете делать такой софт? :0)
С уважением,
Андрей Иванов.
</font>

Дык уже и делаю

С уважением,

Артём.

<font face="Verdana" size="2">Originally posted by Gray:
Артем, признаться, не понял, почему в общем-то полезную программу нельзя обсуждать здесь.</font>

Ну мало ли, реклама всё-таки, да и напрямую к поисковикам не относится.

Разрешил, так разрешил.

И даже нужно

Я правда обещать не могу, что выполню все пожелания быстро, но постараюсь.

Наверно в этом форуме обсуждать мою программу не имеет смысла (Сергей это тебе принимать решение), но это можно сделать либо почтой (адрес в профайле) или же в моём форуме.

Ты это к чему?

Вообще-то они обещали почистить базу и пересмотреть политику определения спама.

А на прошлой неделе (и сейчас это продолжается), Яндекс колбасит не по-детски.

Одна из моих страниц иногда вываливается на первой странице по словам web, html и деже "перевод" (слово встречается ровно 1 раз). Такая лафа продолжается в течение часа-двух, за которые на сайт заходит 10-15 человек. После чего страница "возвращается" на законные позиции, т.е. где-то в третьем десятке.

Всего: 3256