Две фразы, отвечать не обязательно :
1. Действительно 14 февраля на рынке появились акции PayPal по 13 не наших рублей за штуку. Минимальная цена была 12, максимальная 27.89. Так что втрое цена ни разу не возрастала.
2. Не знаю уж по каким причинам, но PayPal отказалась от работы с Россией.
Поэтому всё вышеизложенное (как мной, так и vmegap'ом) - пустой звук, для
тех, кто живёт не там.
Читай: www.paypalwarning.com http://www.softerra.ru/review/util/golub/15687/page1.html
Ну без знания языка точно не обойтись
Возможно это будет откровением, но в русскоязычных сайтах английские слова тоже попадаются
В простейшем случае алгоритм такой - из слова выкидываются приставка, суффикс и окончание. Их нужно "знать". Самые большие проблемы с определением суффикса.
Этого не знает никто, кроме разработчиков.
Общий принцип такой: за нахождение в определённых тэгах вес увеличивают, за увеличение позиции от начала документа - уменьшают. За черезмерные повторы штрафуют.
Особенно если учесть, что с сабжектом "Re:" приходит вирус...
Как мне кажется, поисковики примерно так и работают.
Только создаётся не таблица уникальных слов, а словоформ.
Дальше, в индексе, по которому производится поиск сам документ не хранится, а хранится "посмертная маска" с него. Т.е. выбираются все значимые словоформы из документа, этим словоформам придаются некоторые веса и запоминаются позиции словоформ в документе, а также добавляются текс ссылок на документ.
Дальше алгоритм примерно такой: производится "грубый" поиск по всем документам, в которых присутствуют искомые словоформы, а уже затем точный поиск ведётся по какому-то проценту "лучших" документов. С учётом того, что в том же Яндексе с первой страницы досутпны только первые 80 документов (при стандартных настройках), то точный поиск ведётся не более чем по 1000 документов (думаю, что гораздо меньше чем по 1000). Кроме того, поскольку физически все документы рассредоточены по разным серверам, то грубый поиск осуществляют сразу несколько машин. Далее, результаты поисков по наиболее часто встречающимся запросам можно кэшировать, а для самых дотошных посетителей (тех, которые что-то захотят отыскать за пределами первых 8-ми страниц) производить уточнение по мере продвижения их в глубь результатов.
Возможно в реальности всё обстоит не совсем так (или совсем не так ), но такой подход избавляет от поиска по текстовым массивам безразмерных объёмов, а поиск по индексу производится существенно быстрее.
Да, следующий шаг по оптимизации поиска - это определение тематических групп сайта и запроса. Причём не обязательно пытаться точно определить группу, главное исключить не относящиеся к делу, что существенно сократит объём документов, по которым нужно производить поиск.
ewspam
А зачем? Из серии написать письмо президенту. В советские времена за письмо к генсеку в лучшем случае ставили на спецучёт, в худшем - в психушку помещали.
Я просто не пользуюсь и не буду пользоваться этой службой, и не из-за боязни Большого брата, а из-за повышенного интереса хакеров к Microsoft. Уже ломали, и будьте уверены ещё не раз сломают. А спама мне итак хватает.
Да по одной простой причине, что без денег нынче ничего не делается. За два с лишним года моего участия на этом форуме я узнал о рождении двух поисковиков
(не участвуй я на этом форуме, то и не знал бы о них вовсе).
Один из них "эволюционный", другой - "революционный". Это Punto и Neiron.
Не смотря на все их достоинства, у них есть два больших недостатка: маленькая база и под стать базе посещаемость. И инвесторы в очередь не выстраиваются, по одной простоя причине - даже Яндекс убыточен (обещали в нули выйти, может это и случилось, не в курсе).
Вот m7 писал, что он 15-ть лет в IT инустрии. Судя по всему, все 15-ть лет были потрачены на написание САПР для какого-то предприятия. И в том режиме работы, когда раз в пол-года начальник IT отдела ходит к директору объяснять, что без IT отдела предприятию не прожить и как всем будет хорошо, когда купят новую технику, обновят софт, добавят новую фичу в САПР и т.п.
Однако, если бы многоуважаемый m7 занимался бы не автоматизацией родного предприятия, или хотя бы поинтересовался у знакомых (или журналы бы почитал), как создаются, скажем компьютерные игры, то он бы знал, что за красивые глаза денег не дают. Сначала появляется на свет alpha-версия (прототип) игры, а уже потом выделяются деньги и ресурсы (профессиональные программеры, художники, дизайнеры и т.д.) Я уже не упоминаю о таких "страшных" словах как спецификация и бизнес-план.
Значит плохо слушал.
Я думаю, что эти профессионалы уже инвестируют в Aport, Yandex, Rambler.
Для того, чтобы с нуля создать хотя бы Rambler понадобится не один год усилий и не один $млн. Как ты думаешь, на этом форуме присутствуют владельцы таких денег?
не обязательно. Можно просто по "старому" адресу открывать "новый" документ.
В Perl CookBook есть подобный пример - там тэги меняют на что-то ещё. Думаю это "что-то ещё" заменить труда не составит.
И ещё, есть прога, которая выдирает "лишние" тэги (например, которые Word городит). Но это за денежку.
О рекламе. Только не понятно, что больше рекламируют - жевачку или сайт http://www.lovushka.ru/
Изменение динамики можно отследить по toplist. 14-го явный всплеск, сегодня о снижении говорить нельзя, т.к. где-то до 12-ти mail.ru был в дауне.