itman

Рейтинг
64
Регистрация
26.05.2001

Слушайте, а ведь отличная идея "свалить" конкурентов.. Поставить на них редирект и тихонечко стукнуть на них Яндексу.

Originally posted by wolf:
Яндекс считает, что злоумышленники на такое не способны. А зря <IMG SRC="" border=0>

Ну если судить по яндексовскому тулбару, то похоже, что Яндекс индекс цитирования для сайта считает.

Originally posted by melkov:
wolf
Вы заблуждаетесь.

Я это тоже наблюдал. Ночью. А утром уже убрали. Похоже, что их захакали.

Originally posted by funsad:
Originally posted by Storm:
А линк-то мертвый.
http://www.compulenta.ru/pubimages/9131.gif

Послушайте, уважаемый spark, но зачем же так злобствовать по поводу worda? В основу проверки офографии этой программы легли идеи десятилетней давности, если не двадцатилетней, уже давно все поняли, что можно делать по-другому, но ведь суть не в этом. Ну и что, что word предлагает много маловероятных вариантов замен, в том числе с разбиением слова пробелом/тире итд? Ведь он же только ПРЕДЛАГАЕТ. зато если Вы а на о спутаете он же ведь правильный вариант тоже ведь предложит? Значит пользоваться можно? А фишечки-то и идеальное качество дорого стоит, никто в него бабки просто вбухивать не будет, тем более, что людей, которые действительно ПОКУПАЮТ ворд в России немного.

Originally posted by spark:
Значит вы такого плохого мнения о профессиональных юмористах? Хочу вам напомнить, что пальцев (если не разувшись) - всего десять, и все они уже осмеиваются со времен аристофана. Хорошо, вы не были в соавторах, но вдохновили кого-то из Мэри Шелли (их там человек десять по-моему под одним ником) на новый жанр человеко-машинного творчества. По моему, музой быть еще более почетно и приятно, чем соавтором
Всяческих вам успехов и непредвиденных "побочных эффектов" от этих самых успехов.

Euhenio, мы с товарищем навскидку придумали три способа редиректа (два из которых и под шкафом работают), которые "не светят" windows.location и прочие радости жизни... в общем-то незачем так стараться и прятать внутрь js файла. Правда всегда можно "отловить" подозрительные функции и направлять адреса соответствующих паг модератору. Боюсь только, что таких паг может быть очень много :-((

забивать нужно все, что meta refresh, windows.location, а модерировать: eval, ExecScript, document.write, возможно, что-то еще, да и вообще любой скрипт с непустым onloadoм и фреймом :-(

Originally posted by euhenio:
Я имею в виду, что window.location= находится в js-файле, который запрещен к просмотру поисковиками и включен на страницу через
&lt;script src="/denied/redir.js"&gt;&lt;/script&gt;
А директорию /denied/ просматривать нельзя. Ведь запреты в robots.txt относятся не просто к записи в базу, но и вообще к скачиванию файлов?

Старо-то, старо, речь сейчас не об этом. Речь идет о том, как такие "обманки", по-крайней мере на JavaScript, отлавливать. Получается, что если не парсить javascript, то невозможно :-(

Originally posted by Professor:
ничего нового ... клоакинг, обманки ... редирект и на флеше можно сделать ... старо как мир ...

Я имею ввиду, что можно написать редирект так, что его никакой автомат никогда не сможет отличить - только человек, а для удобства человека (чтобы он эксплорером не мог открыть и ему приходилось бы делать много лишних движений) засунуть скрипт-редиректер в js файл, который эксплорером не открывается.

То бишь робот на редиректе 100% лажается, а челу лень лезть смотреть js файл :-)

Да, про вероятные опечатки - это все понятно. Другое дело, что хотелось бы как-то еще дополнительно использовать частоту встречаемости слова в БД, а с этим намного хуже, потому, что как Вы правильно заметили, если часто, еще не значит, что правильно :-((

даже PageRank здесь не поможет, потому что есть совершенно разные слова, очень близкие по написанию, но разные по частоте появления.

В основном, это касается коротких слов. То есть тут надо как-то учитывать еще и длину слова.

Originally posted by funsad:
Originally posted by Bamboo:
Беда происходит, так как мы ранжируем пока по частоте вхождений, что неправильно. В Вашем примере слово дети не должно стоять на первом месте.

Я уже писал выше, что анализ расстояния на клавиатуре между клавишами (в данном случае "д" и "й") может помочь исключить многие варианты.

Анализ контекстов, в которых это слово встречается.

Расчет вероятности ошибки такого рода и, после сопоставления частот слов, вывод о том, опечатка это или другое слово. Скажем, "дети" встречается в Яндексе 3794631 раз, а "йети" -- 5516. Даже если считать "йети" неверным написанием слова "дети", то получается, что ошибку делают в одном из 689 случаев. Довольно редкий случай, правда? Даже ошибки вида "Ельцин/Ельцын" имеют соотношение не больше 100-150.

Если выяснены контексты, где встречается данное слово (то есть это заведомо опечатка), "правильную" форму можно попробовать определить, вычисляя вес PageRank страниц с тем и другим словом. Предположительно, более весомые страницы чаще бывают грамотными.

И т.д.

С уважением,
Александр Садовский.

А я могу объяснить почему!

С точки зрения релевантности - не одно и тоже.

Да, есть соответствующая страничка на lib.ru, даже вероятно с более высоким индексом цитирования (но не сильно), но там ключевых слов ОДА К РАДОСТИ в заголовке нет! (ну не старался оптимизировать веб-мастер страничку для поисковки). И это несмотря на то, что автор выделил слова ОДА к РАДОСТИ тегом заголовка h2! А гугл по х№№, у него алгоритм следующий: он сначала ищет по индексу, в котором есть только ссылки из тегов HREF и TITLE, а уж потом все остальное.

Это описано в статье авторов и легко проверяется на практике. А если бы был более тонкий учет тегов &lt;hN&gt; и.т.д, то все было бы хорошо.

Вот и пользуйся после этого кнопкой "О щасливчик" :-(

Originally posted by spark:

По большинству запросов, когда ты знаешь, чего хочешь. Почему с Шиллером не сработало у тебя я не знаю, ....
ЗЫ а с Одой к радости у тебя не сработало из-за плагиатора Натальи Никишиной, котрая позаимствовала название у Шиллера для своего рассказа Хотя с точки зрения релевантности Шиллер или Никишина - никакой разницы
Возвращаясь к нашим родным поисковикам хочется отметить, что слоганы у них все же не те. В сравнении с Гуглем им лучше подошел бы "Бороться и искать, найти и не cдаваться"
[This message has been edited by spark (edited 27-12-2001).]

[This message has been edited by spark (edited 27-12-2001).]

[This message has been edited by spark (edited 27-12-2001).]

[This message has been edited by itman (edited 27-12-2001).]

Originally posted by spark:
Иногда, блин, с Гуглом удары в бубен не помогают! По каким же это запросам можно пользоваться клавишей везунчиков?

По запросу о вопросах президенту искомый сайт занимал далеко не первую позицию, хотя был и на первой странице.

Или вот, еще запрос: ода к радости

Нужно сказать, что с поиском по-немецки все обстоит замечательно и первая ссылка более чем актуальна и взята из каталога.

по-русски - полный слив :-((

И пусть мне кто-нибудь попробует объяснить, что искать нужно было по: Ода к радости Шиллер :-) Я всегда могу ему возразить, что вещь известная можно бы и без упоминания Шиллера ее найти. Так что насчет feeling lucky особенно по-русским запросам (а гугл падежи не понимает :-((( я бы не стал спешить.



Лично для меня "следующий раз" давно уже наступил. Когда я ищу что-нибудь для себя, не претендуя на какую-либо полноту, пользуюсь только клавишей "я счастливчик"
В большинстве случаев срабатывает.

[This message has been edited by itman (edited 27-12-2001).]

[This message has been edited by itman (edited 27-12-2001).]

[This message has been edited by itman (edited 27-12-2001).]

Всего: 444