Все что Вы хотели знать, но боялись спросить:
http://www.acmebw.com/askmr.htm
отвечает мистер DSN.
знание английского - обязательно
М-да, исходное сообщение в итого распалось на три
Вот ещё что хотел спросить: какие из зарубежных поисковиков можно добавить?
Гугл в рулесах настоятельно не рекоммендует добавлять боковые страницы.
Попробовал сунутся в ивон,хотбот,эксайт - там сабмит везде за бабки
А по-поводу сабмита - переиначивая известную песню 2Unlimited - баги, баги, всюду баги. Подробности можешь узнать на форуме.
Я бы рекомендовал для Яндекса разрешить, а для всех остальных пауков - запретить.
Вот когда Яндекс перестанет выдавать подобные страницы в первой десятке - тогда и для Яндекса закроешь. Кстати, они похоже базу подчистили - у меня за последнюю неделю больше половины посетителей с Яндекса, причём в основном с нормальных страниц, а не с форума.
Хорошо, я попытаюсь найти статистику по наиболее часто употребляемым словам русского языка.
Пока что в Ваших рассуждениях я уловил некоторую неточность - именно из-за больших объёмов текста можно предположить, что речь ведётся не об одном объекте. Возмём к примеру "Войну и Мир". Я не могу себе позволить утверждать, например что это роман о войне и мире. Или к примеру возьмём энциклопедию. На первом месте будут стоять "стоп-слова", а частота всех остальных слов будет примерно одинакова.
Я собственно пытаюсь подвести Вас к мысли о пределах применимости "закона". Тот же закон Бойля-Мариотта справделив только в н.у. т.е. при комнатной температуре и давлении в одну атмосферу.
Ну заспамить вас мы завсегда успеем
А если серьёзно, то меня всегда в подобных списках удивляли отдельные позиции. Например вот такие
А интересуют они меня по причине своего выпячивания. Т.е. я могу допускать, что 100 человек за месяц искали скажем mp3, но вот для того, что бы те же 100 дяденек или тетенек искали какой-то AnchorNet (а сайтов о нём или с ней всего-то раз два и обчёлся) должна быть веская причина.
Игорь, можете ли Вы прокомментировать подобные "всплески" отдельных слов?
[This message has been edited by AiK (edited 10-02-2001).]
Ловлю на слове. Меня учили не критиковать общепризнанных авторитетов, поэтому я просто задам несколько вопросов/высскажу утверждения которые следуют из закона нумбер оне:
1. Чем длиннее текст, тем вероятнее он соответствует закону Зипфа.
2. Чем беднее язык пишущего, тем менее он соответствует закону, т.к. число слов-паразитов (или стоп-слов) довольно велико, а остальные слова имеют примерно одну и ту же частоту, что соответствует в пределе прямой на графике.
3. Чем богаче язык пишущего (т.е. чем больше он использует синонимов), тем опять-таки он меньше соответствует закону, ибо "весомые" слова будут иметь примерно одну и ту же частоту, за счёт взаимозаменяемости.
Возможно закон и справедлив для скудного английского языка, но что-то слабо верится в действенность этого закона в применении к русскому языку. Кстати, закон подразумевает уменьшение частоты встречаемости второго слова в два раза (+\- константа), что на мой взгляд может быть справедливо по отношению к словарной статье, но ни как к сравнимому по объёму литературному произведению, ни тем паче к стихотворению.
Объясните пожалуйста, что я не так уразумел?
Похоже слегка подчистили Яндекс.
Рассказал бы о законе. Я мож статистику удобнее сделаю. Кстати, переделал вырезание JScript - теперь всякие ховосты а ля width href туда не попадают.
А переслать смогу только в субботу - сейчас коннект никакой, а завтра липистричество отрубают.
Сорри, не проверил регистр зипа.
Сейчас всё нормально.
На мыло смогу выслать только поздно вечером (если разумеется ещё будет актуально)