Речь ведь именно идёт о том, что у Вас -- всего один магазин на Арбате, а Вы всем (тут) рассказываете, что два, что тот, что на Таганке, -- тоже на Арбате.
Исключительно потому, что водка очень плохая -- вся надежда только на бутылку / этикетку.
Хотелось бы уточнения: что такое "отличных по контенту и дизайну"? На 1.5%? На 5%? Погода разная -- или вместо синим по белому Smirnoff везде жёлтым по синему Ivanoff?
Им. в виду главной страницы.
У меня тоже куча вопросов.
Чей "робот сожрет"? AskJeeve's, MSN, или ...?
(Слово "G" не упоминаю, т.к. не по теме...:-)).
"Как теперь попасть в.." - это в смысле сегодня и вчера, или вообще?
Ваш контент обновляется каждый день или раз в год?
"Какой процент дает AskJeeves" кому и за что?
Очевидно, image очень sexy;) А каков PR таки-сайта?
Количество (т.е. некая цифра, ни о чём не говорящая - ведь больше 1000 всё равно результатов никто не получит) сейчас ещё пока играет огромную роль для многих людей при выборе. Тем не менее -- это одна из базовых проблем, я просто неточно выразился, каюсь. Вместо "выбросить" зеркала и дубликаты надо было сказать "уметь находить", достаточно точно и с наименьшими затратами (т.е. желательно без захода робота и постраничного сравнения). А что потом с этим делать -- собирать или выкидывать... дело двадцатое, от маркета зависит, и от того, резиновый ли у вас индекс, чтобы хранить и пропесочивать всякий ненужный хлам.
К сожалению, похоже, что именно "были" неплохие. Выдаётся 404 (как и с корневой).
На тему "что побеждает" и "что умирает" не хочу даже начинать говорить.........
Не понятно только, почему все здесь так увлечены Googl'ом (с идеей PR, которую, кстати, придумали тоже многие, просто названия разные были), и почему создают свои SE, если верят в эту догму "умирания б/поддержки".
Хотел бы уточнить: я делал упор на отношение "всего ко всему". Кажется, даже подчеркнул в двух словах, почему это непрактично (и ==> бесперспективно):
1) "всё" непрерывно растёт;
2) никаких машинных ресурсов не хватит;
3) сигнал слабый, много шума, всё равно надо сжимать и сжимать;
4) это никакой практической проблемы не решает и никому (==>) не нужно.
Попробуйте пронспонсировать нечто, что, возможно, даст эффект лет через 100 (а может, и не даст).
Да нет, просто хотел узнать, знакомы ли Вы. Один из примеров того, что конкретно люди пытаются делать. Что там 80-е: кто-то писал здесь и про Аристотеля. Но речь не о том, в каком году изобрели велосипед, а в том, как используют сейчас особые шины, эксперементируют с маслом, затачивают форму руля... Пока колучается, что анализ ссылок (если их достьаточно много) даёт гораздо лучшие результаты, чем семантические разборы, nlp и иже с ними.
____
(А про новизну я пытался чуть написать в другом месте. Хотя и новизна: пусть уж начилась бы с текущих проблем, которых --немеряно: собрать все документы, выбросить зеркала и дубликаты -- уже как-то легче).
Интересные, обнадёживающие цифры... Хочется уточнить: этого будет достаточно... -- для чего, собственно? На ответы? или на индексирование? или на ботик, обходящий www раз в месяц? или на линки? или на ежечасное обновление самого-самого? или на поиск дубли, spamer'ов и иже с ними же? или -- неужто? --на всё сразу?
(разработку / отладку / улучшение, разумеется, делают чуваки из OpenSoure, долгими бессонными одинокими ночами таращась в свои только что купленные пол-дюймовые мониторы).
Вопрос ещё -- сколько ответов в секунду "это" будет давать, и сколько времени будет уходить на каждый ответ.
Т.е. им нехватило только бабок и "маркетинговой политики", а идей гениальных было пруд пруди? Интересно, каких. Хоть одна, не самая ценная?.. Были ли какие-ниб. статьи, пресс-релизы? (Я просто, извините, до сегодняшнего дня не слышал про такие системы, попробовал - ужаснулся).
Да... Тема "идея новизны":D хороша🤣D🤣, и уже длится пол-года (интересно, много ли здесь таких тем?). Хотя заметно флуктуирует:о). Начали за здравие (т.е. как всё фигово и как всё резко улучшить - "взять всё, да и поделить", а кончили за матрицу всего ко всему).
Мне кажется, проблема надуманная, задачу отношения всего ко всему не надо ставить даже в принципе: жизнь-то идёт, www увеличивается в год на 20%. А вот найти сотню семантически (пардон за выражение) связных документов, -- например, ну хоть сто первых (по современным алгоритмам) результатов по такому-то запросу, -- и среди них уже строить любые матрицы и сжимать их всеми придуманными способами - вроде как имеет смысл. (Вот здесь есть некоторые подробности того, что кто-то потихоньку делает).
_____
А насчёт собственно "Идеи! Новизны!": как вам такое:
Улучшить ЛЮБОЙ отдельный конкретный запрос -- так, что никаким Googl'ам не снилось, -- может практически каждый. Поэтому нужно нанять 100,000,000 граждан, измученных нарзаном и находящихся на грани изнеможения от протёртого места в жизни, и поручить каждому по одному запросу в день. Чем вам не OpenSource?
Обсудить хотелось бы, но:
1) Почему-то через https...:::-о))? причём сертификат негодный ... 🙄 Вы именно **это** предлагаете обсудить?
(Закройте глаза и представьте себе ну хоть Google, работающий через ssl);
2) НОВАЯ ПОИСКОВАЯ СИСТЕМА на любой запрос выдаёт правильный ответ: "An error occured! Can not connect to search daemon",
3) и при этом она powered by ASPseek.
😆
У меня единственный вопрос: о чём диссертация?
((И как насчёт наоборот ("в рамках создания поисковика написать несколько сот кандидатских диссертаций")?))
Напишите книгу - зачем диссертацию?
Это могло бы послужить темой блестящей кандидатской, да и на докторскую вполне бы потянуло. Всё только начинается.
"академический уклон" -- это когда Вы пишете не коммерческую, а университетскую SE. При этом надо отдавать себе отчёт, что разница в поисковике, постороенном на 10 миллионах страниц, и в таком же точно -- на нескольких миллиардах, - принципиальна).
Самому писать поисковик... гм. Что ж, одному чуваку это в каком-то смысле удалось (http://www.gigablast.com), да и Брин с Пейджем начинали в гараже. Но если Вы сегодня хотите написать что-то хоть отдалённо сравнимое с современными SE, Вам надобно будет одного железа накупить на десятки миллионов $$. А иного способа "узнать" "пути развития современных систем и теорий", наверное, увы, нет. Разве что догадаться.
Но возможно, под "академический уклон" подошло бы решение какой-нибудь чуть более частной задачи?
SEOs:-)... -- всё это оч. интересно, хотя этим занимаются уже тысячи людей во всём мире, и у них больше информации / инструментов и т.д. К тому же, каждая из этих тем тоже тянет на десятки диссертаций. К этому можно добавить (или разбавить), ну, например:
--- правильно и дёшево собрать не 5, а 100 миллиардов страниц (или ну хоть 10 миллиардов - как обещает dipsie)
--- индексировать любые типы документов (начиная с почты, и посмеяться заодно над микрософтом)
--- понять, что такое "релевантность", и научиться её измерять
--- по-умному агрегировать результаты (и этим забить alltheweb, vivisimo, mooter, google-labs/sets...)
--- (кстати): научиться умело отвечать на двусмысленные запросы
--- одновременно и делать бабки, и удовлетворять ищущих пользователей (и натянуть нос сами-знаете-кому)
--- искать не только текст (напр: найти название мелодии, которая звучит "примерно так"...)
--- сделать персональный поиск (windows для домохозяйки и для программиста)
--- уметь классифицировать запросы
--- (и разбивать их на связные группы/фразы)
--- учитывать специфику пользователя и контекста (язык, географию, возраст, пол, день недели, близость футбольного турнира...)
--- отвечать на вопросы (на "сколько гигабайт в киловатте?" давать не список страниц, а ответ: "столько".)
--- давать ответы не по ключевым словам, а по смыслу. Научиться понимать смысл запроса.........
--- ... (Продолжать?).
А приятнее всего было бы найти что-то эдакое, чем пока ещё никто не занимается.....:-о!).
И чтобы всем сразу стало хорошо.
Всё равно не понятно. То ли Вы спрашиваете, во сколько бит можно упаковать каждое слово, то ли подразумеваете, что индекс устроен по принципу реляционной БД... Ведь слова - это мизерная часть индекса.
И причём тут русский язык? Вы думаете, существуют поисковики, индексирующие только слова русского языка?
Кстати о появлении в:
http://www.webmasterworld.com/forum35/1790.htm
Обращаю внимание на даты (1 марта и 15 апреля).