vitali_y

vitali_y
Рейтинг
33
Регистрация
23.05.2007
webpavilion:
Думаю банальная экономия ресурсов.

это да согласен. но определение такого сайта человеком - пара секунд.

автоматически это тоже делается легко или достаточно легко - я бы смог написать такую программу - без проблем или без больших проблем. т.е. для 1 или 2 статей на сайте это может оказаться не просто - но для целого сайта... потом сайт банится - т.е. не индексируется, не попадает в поиск.

3000 сайтов - 10$ на регистрацию +хостинг - 30000$ в год - дорогое удовольствие.

G00DMAN:
Не, Вы не поняли, синонимизация захламляет не топ выдачи, а индекс. Яндекс в ру-индексе с этим еще как-то пытается бороться, а гугл походу просто не понимает, что он индексирует кучу хлама.

а зачем это делать? зачем захламлять индекс? с какой целью?

и зачем бороться с этим?

т.е. если бы я писал поисковик - большой для интернета - я бы эту проблемму решал просто - те страницы что открываются наиболее часто и пользователь задерживается на коих большее время - увеличивал бы их коэффициент релевантности - таким образом весь шлак все равно бы уполз вниз...

а имея словопозиции - сколько суперпозиций можно получить!

vitali_y добавил 09.11.2010 в 14:59

webpavilion:

Что еще подчиняется закону Ципфа?

* 80% предложений состоит из 20% слов
* 80% работы выполняют 20% сотрудников
* 80% научных публикаций пишут 20% ученых
* 80% профильной информации находится в 20% источников
* 80% материальных ценностей принадлежит 20% населения
* 80% времени процессора занимают 20% инструкций(команд)
* 80% населения сосредоточено в 20% городов
* 80% общего объема продаж дают 20% ассортимента
* 80% прибыли дают 20% покупателей
* 80% преступлений совершают 20% преступников
* 80% ДТП произошли по вине 20% водителей
* 80% разводов на совести 20% вступивших в брак
* 80% времени вы носите 20% имеющейся у вас одежды

продолжать можно до бесконечности...

выведу и я свой закон :) даже не так я выведу ряд законов используя закон МАТЕМАТИЧЕСКОЙ ИНДУКЦИИ (что это такое посмотрите в ЛИТЕРАТУРЕ)

1)

* 50% предложений состоит из 50% слов

* 50% работы выполняют 50% сотрудников

* 50% научных публикаций пишут 50% ученых

* 50% профильной информации находится в 50% источников

* 50% материальных ценностей принадлежит 50% населения

* 50% времени процессора занимают 50% инструкций(команд)

* 50% населения сосредоточено в 50% городов

* 50% общего объема продаж дают 50% ассортимента

* 50% прибыли дают 50% покупателей

* 50% преступлений совершают 50% преступников

* 50% ДТП произошли по вине 50% водителей

* 50% разводов на совести 50% вступивших в брак

* 50% времени вы носите 50% имеющейся у вас одежды

* 40% предложений состоит из 40% слов

* 40% работы выполняют 40% сотрудников

* 40% научных публикаций пишут 40% ученых

* 40% профильной информации находится в 40% источников

* 40% материальных ценностей принадлежит 40% населения

* 40% времени процессора занимают 40% инструкций(команд)

* 40% населения сосредоточено в 40% городов

* 40% общего объема продаж дают 40% ассортимента

* 40% прибыли дают 40% покупателей

* 40% преступлений совершают 40% преступников

* 40% ДТП произошли по вине 40% водителей

* 40% разводов на совести 40% вступивших в брак

* 40% времени вы носите 40% имеющейся у вас одежды

т.о. закон 1: пусть x % чего то что произошло то причина этого x %

2)

* 40% предложений состоит из 60% слов

* 40% работы выполняют 60% сотрудников

* 40% научных публикаций пишут 60% ученых

* 40% профильной информации находится в 60% источников

* 40% материальных ценностей принадлежит 60% населения

* 40% времени процессора занимают 60% инструкций(команд)

* 40% населения сосредоточено в 60% городов

* 40% общего объема продаж дают 60% ассортимента

* 40% прибыли дают 60% покупателей

* 40% преступлений совершают 60% преступников

* 40% ДТП произошли по вине 60% водителей

* 40% разводов на совести 60% вступивших в брак

* 40% времени вы носите 60% имеющейся у вас одежды

т.о. закон 2: пусть x % чего то что произошло то причина этого 100-x %

vitali_y добавил 09.11.2010 в 15:37

3)

* 40% предложений состоит из 70% слов

* 40% работы выполняют 70% сотрудников

* 40% научных публикаций пишут 70% ученых

* 40% профильной информации находится в 70% источников

* 40% материальных ценностей принадлежит 70% населения

* 40% времени процессора занимают 70% инструкций(команд)

* 40% населения сосредоточено в 70% городов

* 40% общего объема продаж дают 70% ассортимента

* 40% прибыли дают 70% покупателей

* 40% преступлений совершают 70% преступников

* 40% ДТП произошли по вине 70% водителей

* 40% разводов на совести 70% вступивших в брак

* 40% времени вы носите 70% имеющейся у вас одежды

т.о. закон 3: пусть x % чего то что произошло то причина этого y %

закон 1 и закон 2 можно рассматривать как следствие закона 3.

влезу и я в дискуссию...

G00DMAN,

G00DMAN:

Что не говорит о том, что в Яндексе он не используется. Ципфа можно использовать, как один из факторов естественности. Если у документа много отрицательных факторов, то его считают спамным. Вполне рабочий вариант.

тут есть "знатоки Яндекса"... может есть сами Яндекса писатели?

или может кто мне дать нормальное разумное объяснение как с помощью синонимизации можно захламить поисковую выдачу?

т.е. сослаться на определенную математическую модель стоящую за поиском (к примеру Яндексова) и привести пример - вот в таком случае при таком запросе будет в топе.

т.е. если при поиске жилья на запрос "логово для девочек" яндек будет искать "комната для девочек"...

vitali_y добавил 08.11.2010 в 19:32

webpavilion, ну как вы будете получать таким образом эти "коллекции"?

народ может у кого есть эти офигительно ценные "коллекции"?

организуйте уж утечку - посмотрим все вместе - чего там столь ценного...

vitali_y добавил 08.11.2010 в 19:34

могу предположить кстати как организовать утечку юридически не преследуемым образом...

правда ценность этого хлама сомнительная.

spiral, :) blekko не мой проект - мне идея просто понравилась - поэтому и "защищаю" его как свой.

Про персонализацию - были обсуждения раньше и я подробнее писал свое мнение.

Страна и приоритеты - я не отмахнул это, просто в большинстве случаев для меня это скорее ухудшает результат поиска. а вот если есть возможность специализировать страну самостоятельно с помощью специального тега - это класная фича.

да вы ожидаете ИИ тут :) все организовано проще конечно.

делать свои тэги я не пробовал и в этой фиче для себя не вижу смысла.

G00DMAN:
Можно наверное сделать два слэш-тега зАмок/ и замОк/, которые будут выпадать в подсказках, но их же для меня никто делать не собирается.

на все требуются ресурсы - да для вас специальные тэги /зАмок и /замОк сделают еще конечно не скоро. Но принципиальная возможность сделать такое разделение, сделать 2 таких класса, есть. Как я понимаю автоматической классификации и обучение ПОКА не предусмотрено. НО принципиальная возможность сделать такую фичу есть. И есть МЕХАНИЗМ как в удобном для пользователя виде использовать эту фичу.

vitali_y добавил 03.11.2010 в 21:35

у blekko мне нравится:

1) есть возможность редактировать выдачу - спам

2) понравились теги

/seo /links /ip /people /date /relevance

на русский язык blekko пока мало заточена - точнее никак и вряд ли будет - но это другая история.

попытайтесь пользоваться - в качестве контекстных подсказок.

G00DMAN:
Парни фактически заявили, что красиво решают задачу "по куче ключей и сайтов понять, что имел ввиду пользователь и сделать правильный шаблон". Это забавно звучит, естественно эта задача при такой примитивной формализации не решается в общем. Только в локальных простых случаях, типа /news или /reviews, да и в этих случаях решение слегка косопузое.

они разделили на классы (было изначально в самом примитивном yahoo поиске) и позволяют уточнить нужный класс - т.е. для примера замОк и зАмок позволяют спросить у пользователя что тот хотел бы получить в результате - делают это в простейшей форме, все гениальное просто.

А потом, конечно, можно заявить - "это все фенечки"...

spiral, тезисно - в ближайшем будущем - лет 10 период - грандиозных изменений не будет.

Персонализация - это глупость - посмотрите аргументацию в прошлой теме.

Голосовой помощник - вполне может быть.

G00DMAN, вы удивитесь но на большинство моих вопросов не философского и не личного характера есть ответ в энциклопедиях. По некоторым вопросам просто нет информации в интернете - типа определенный телефон в определенном ГАИ трубку которого поднимают - т.е. это не проблемма поиска - это проблемма наличия информации.

G00DMAN:
процент запросов, на которые есть ответы в энциклопедиях - мизерный

ну конечно в энциклопедиях нет ссылок на порно...

G00DMAN:
Массе нужны ответы на вопросы, почему это не понятно?

массе нужны недорогие развлечения (после удовлетворения первых потребностей).

G00DMAN:
всякие фенечки типа слэш-тегов - да, с ними непонятно, нужны или нет.

"фенечки" - экое уничижительное название вы придумали возможности уточнения запроса...

G00DMAN:
Придумано было на примитивном уровне, с тех пор постоянно развивается, и развиваться еще есть куда. Потребности аудитории не удовлетворены, аудитория хавает то, что дают, альтернативы нет. Т.е. качество поиска определяет потребности аудитории, а не наоборот. Т.к. качество растет - растут и требования к поиску, например увеличивается средняя длина запроса.

с этим тезисом согласен.

G00DMAN:
Да новых идей можно много напридумывать, только не очень интересно это. Для меня поиск будущего связан скорее с нахождением ответов на сложные вопросы.

понятно - нет идей - можно сказать что неинтересно :) для нахождения ответов на вопросы все уже давно придумано - энциклопедию не пробовали открывать? а для ответов на философские вопросы компьютер(или поисковик - как вам угодно) не нужен.

G00DMAN:
Ну так количество пользователей гугла сделал бизне

количество пользователей google - сделал качественный поиск, а качественный поиск повлек за собой развитие бизнеса. я стал использовать google с его появлением потому, что это был единственный поисковик выдающий качественный результат.

G00DMAN:
у альтернативных поисковиков, которые вроде есть локально в разных странах.

К примеру у нас в стране (речь о Беларуси) нет своего поисковика. Я использую google - в остальных мне надобности нет.

G00DMAN:
слэш-теги на уровне "как на этих сайтах" решают какую-то локальную задачу, причем не понятно, зачем это нужно массе.

массе вообще непонятно что нужно. первоначально компьтер и интернет не нужны были "массе".

Всего: 92