AiK

AiK
Рейтинг
257
Регистрация
27.10.2000
Должность
SEO consultant
Интересы
Astronomy

Все что Вы хотели знать, но боялись спросить:

http://www.acmebw.com/askmr.htm

отвечает мистер DSN.

знание английского - обязательно

М-да, исходное сообщение в итого распалось на три

Вот ещё что хотел спросить: какие из зарубежных поисковиков можно добавить?

Гугл в рулесах настоятельно не рекоммендует добавлять боковые страницы.

Попробовал сунутся в ивон,хотбот,эксайт - там сабмит везде за бабки

А по-поводу сабмита - переиначивая известную песню 2Unlimited - баги, баги, всюду баги. Подробности можешь узнать на форуме.

Я бы рекомендовал для Яндекса разрешить, а для всех остальных пауков - запретить.

Вот когда Яндекс перестанет выдавать подобные страницы в первой десятке - тогда и для Яндекса закроешь. Кстати, они похоже базу подчистили - у меня за последнюю неделю больше половины посетителей с Яндекса, причём в основном с нормальных страниц, а не с форума.

Хорошо, я попытаюсь найти статистику по наиболее часто употребляемым словам русского языка.

Пока что в Ваших рассуждениях я уловил некоторую неточность - именно из-за больших объёмов текста можно предположить, что речь ведётся не об одном объекте. Возмём к примеру "Войну и Мир". Я не могу себе позволить утверждать, например что это роман о войне и мире. Или к примеру возьмём энциклопедию. На первом месте будут стоять "стоп-слова", а частота всех остальных слов будет примерно одинакова.

Я собственно пытаюсь подвести Вас к мысли о пределах применимости "закона". Тот же закон Бойля-Мариотта справделив только в н.у. т.е. при комнатной температуре и давлении в одну атмосферу.

<font face="Verdana" size="2">Originally posted by Ashmanov:

Надеюсь, в нашем приличном обществе нет ни одного спаммера?

</font>

Ну заспамить вас мы завсегда успеем

А если серьёзно, то меня всегда в подобных списках удивляли отдельные позиции. Например вот такие

<font face="Verdana" size="2">

37 "стульчик"
59 "anchornet"
95 "интердама"
</font>

А интересуют они меня по причине своего выпячивания. Т.е. я могу допускать, что 100 человек за месяц искали скажем mp3, но вот для того, что бы те же 100 дяденек или тетенек искали какой-то AnchorNet (а сайтов о нём или с ней всего-то раз два и обчёлся) должна быть веская причина.

Игорь, можете ли Вы прокомментировать подобные "всплески" отдельных слов?

[This message has been edited by AiK (edited 10-02-2001).]

<font face="Verdana" size="2">Originally posted by funsad:

Лично я успешно использовал закон Зипфа...
С уважением,
Александр Садовский.
</font>

Ловлю на слове. Меня учили не критиковать общепризнанных авторитетов, поэтому я просто задам несколько вопросов/высскажу утверждения которые следуют из закона нумбер оне:

1. Чем длиннее текст, тем вероятнее он соответствует закону Зипфа.

2. Чем беднее язык пишущего, тем менее он соответствует закону, т.к. число слов-паразитов (или стоп-слов) довольно велико, а остальные слова имеют примерно одну и ту же частоту, что соответствует в пределе прямой на графике.

3. Чем богаче язык пишущего (т.е. чем больше он использует синонимов), тем опять-таки он меньше соответствует закону, ибо "весомые" слова будут иметь примерно одну и ту же частоту, за счёт взаимозаменяемости.

Возможно закон и справедлив для скудного английского языка, но что-то слабо верится в действенность этого закона в применении к русскому языку. Кстати, закон подразумевает уменьшение частоты встречаемости второго слова в два раза (+\- константа), что на мой взгляд может быть справедливо по отношению к словарной статье, но ни как к сравнимому по объёму литературному произведению, ни тем паче к стихотворению.

Объясните пожалуйста, что я не так уразумел?

Похоже слегка подчистили Яндекс.

<font face="Verdana" size="2">Originally posted by Kirill:
Originally posted by AiK:
Кому интересно - прогу с новой гуёвой мордой и с некоторыми новыми фичами (типа исправленной сортировки и total words) можно забрать с сайта.</font>

За фиси - огромное спасибо. Облом, правда, при попытке скачать с сайта - выдается Error 404. Беда ... Может, кинешь мылом на realting@mail.ru ? А прогу я юзаю для подгонки текста страниц под соответствие законам Зипфа, по которым, имхо, поисковики релевантность определяют. Индексация похоже улучшается, но статистики пока маловато. Сейчас сайт делаю, через месяц будет понятно, насколько помогает.

Рассказал бы о законе. Я мож статистику удобнее сделаю. Кстати, переделал вырезание JScript - теперь всякие ховосты а ля width href туда не попадают.

А переслать смогу только в субботу - сейчас коннект никакой, а завтра липистричество отрубают.

Сорри, не проверил регистр зипа.

Сейчас всё нормально.

На мыло смогу выслать только поздно вечером (если разумеется ещё будет актуально)

Всего: 3256