Так о чем разговор пойдет? Ниччо не понял
Вот это имхо главное, потому что для простого смертного юзера -это трындец. Для гиков да, крутая фича. Но в общей серой массе, учитывая, что интернетом сейчас все домохозяйки пользуются - вряд ли это реальное будущее. :)
Да идей действительно много - я вот недавно в один из универов заходил - они там свой поиск ваяют, и идеи здравые есть. Да и люди хоть как-то знакомые с поисковой наукой идеи в любом случае вынашивают. Согласен с Goodman'ом - а в чем интерес? Ну если для себя, то мы вроде как все занимаемся, что-то даже где-то презентуем, а если глобально, то по-моему все уже давно придумано, работает и модернизируется, удовлетворяя потребностям аудитории.:)
Монстры поглазеют на отзывы по этому поиску, и если будет удачным то внедрят у себя, а про этот blekko уже "завтра" все дружно забудут - вот и вся история😂
Ну насколько я понял проблема у GBall такая:
АОТ вполне с этой задачей справляется. Вводим "делал" получаем "делать" и все атрибуты. Зачем изобретать велосипед-то, да еще для дипломной работы:)
А про организацию поиска никто вроде бы и не спрашивал.
Вот это вполне хорошо работает. Выводы делаю из многолетней практики использования.
Купил книгу с русским переводом - очень советую всем, кто так или иначе связан с интернет-математикой. На РОМИПЕ в Казани Павел Браславский руководитель екатеринбургского филиала Яндекс рекомендовал всем почитать. Тираж правда ограничен насколько я слышал - так что спешите.
http://download.yandex.ru/class/lifshits/lecture-note05.pdf - вот эту доку почитайте
Давайте, будем объективны:
Вы открыто хамите: «Походу, Руки вместо химиков стали подтягивать студентов, уже не запинающихся при произнесении математических терминов и прочитавших полкнижки по матстатистике».
Пишете имена классиков :) с ошибками: «…ибо им про Фому, а они всё про Ёрёму»
Равняете статистику с базаром: «Оценки-то давать можно, как угодно. Только вот грош им цена в базарный день получается».
Склонны к схоластике: «с распределением частей речи, связностью падежей, чисел, родов и склонений в словосочетаниях и т.д. и т.п. Это ж серьезная лингвистическая база нужна».
(о значении термина можно почитать здесь http://ru.wikipedia.org/wiki/%D0%A1%D1%85%D0%BE%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%B0)
И снова хамите: «…они худо-бедно формулку запрограммируют».
Тем не менее, я думаю, мы можем продолжить общение по делу, после того, как Вы придёте в себя.
Ещё пока с уважением,
студент, не запинающийся при произнесении математических терминов . :)
Я даже в Бога не верю.:)
Долгая дискуссия была на тему применимости закона Ципфа к решению конкретной задачи.
Уважаемый wolf, и Вам и остальным станет легче, если вы всё же начнёте задумываться над приводимыми цитатами… :)
Читаем вместе:
- есть условие существования достоверной модели распределения. Она давно получена…
Распределение Ципфа по малому (относительно лексической базы модели) является модельным приближением, отклонение которого от точного распределения - случайная величина с дисперсией (дисперсия значений функции невязки, например, среднеквадратичного отклонения), убывающей по мере роста объёма текста. Достаточно очевидно, надеюсь?
Так вот, имея функцию D(v) – дисперсия как функция объёма, можно с фиксированной точностью (не гулким лаем во дворе) давать оценки близости анализируемого текста к естественному.
Ну, это что касается «научпопа».
А так…
желаю удачи, читайте книжки. :)
yanus, насчет noindex - неправда. Если сильно хочется, то будет работать все. Скрин приложил 🚬