Антиоптимизатор

Рейтинг
2
Регистрация
17.02.2004
Должность
по клавишам стучать
Интересы
вокальная музыка
жил-жил. а добра не нажил
Как писал Каширин
Если у меня один магазин на Арбате, а другой - на Таганке, то это жульничество? А если два магазина - на Арбате, но по-разному называются, тогда - жульничество?

Речь ведь именно идёт о том, что у Вас -- всего один магазин на Арбате, а Вы всем (тут) рассказываете, что два, что тот, что на Таганке, -- тоже на Арбате.

Как писал Каширин
Люди одну водку разливают в разные бутылки под разными названиями и это назвается брэнд-маркетинг, никакого мошенства!

Исключительно потому, что водка очень плохая -- вся надежда только на бутылку / этикетку.

Как писал Каширин
но если вы приложите голову и создадите 10 отличных по контенту, и дизайну сайты - ничего кроме щастья вам не будет.

Хотелось бы уточнения: что такое "отличных по контенту и дизайну"? На 1.5%? На 5%? Погода разная -- или вместо синим по белому Smirnoff везде жёлтым по синему Ivanoff?

Им. в виду главной страницы.

У меня тоже куча вопросов.

Чей "робот сожрет"? AskJeeve's, MSN, или ...?

(Слово "G" не упоминаю, т.к. не по теме...:-)).

"Как теперь попасть в.." - это в смысле сегодня и вчера, или вообще?

Ваш контент обновляется каждый день или раз в год?

"Какой процент дает AskJeeves" кому и за что?

Как писал baracuda
ПР сайта тоесть странички(динамическая)bla?bla=bla =0.
альтов нету. image состоит(название) так сложилось =44443.jpg

Очевидно, image очень sexy;) А каков PR таки-сайта?

Как писал Vyacheslav Tikhonov
Не самый лучший вариант, особенно, если учесть, что у конкурентов все дубли находиться будут :) Пользователи будут думать, что поисковая база такого поисковика меньше, и уходить к ним.

Количество (т.е. некая цифра, ни о чём не говорящая - ведь больше 1000 всё равно результатов никто не получит) сейчас ещё пока играет огромную роль для многих людей при выборе. Тем не менее -- это одна из базовых проблем, я просто неточно выразился, каюсь. Вместо "выбросить" зеркала и дубликаты надо было сказать "уметь находить", достаточно точно и с наименьшими затратами (т.е. желательно без захода робота и постраничного сравнения). А что потом с этим делать -- собирать или выкидывать... дело двадцатое, от маркета зависит, и от того, резиновый ли у вас индекс, чтобы хранить и пропесочивать всякий ненужный хлам.

Как писал Vyacheslav Tikhonov
Статьи и идеи были, причем даже достаточно не плохие.

К сожалению, похоже, что именно "были" неплохие. Выдаётся 404 (как и с корневой).

Как писал Vyacheslav Tikhonov

Как я уже говорил, побеждает не технологии, а бизнес-процессы, которые их продвигают. Большинство революционных технологий умирают, не получив никакой поддержки.

На тему "что побеждает" и "что умирает" не хочу даже начинать говорить.........

Не понятно только, почему все здесь так увлечены Googl'ом (с идеей PR, которую, кстати, придумали тоже многие, просто названия разные были), и почему создают свои SE, если верят в эту догму "умирания б/поддержки".

Как писал Vyacheslav Tikhonov
Это простые слова. Где аргументы?
Я что-то не видел, чтобы идею о отношениях объектов кто-то опроверг или раскритиковал.

Хотел бы уточнить: я делал упор на отношение "всего ко всему". Кажется, даже подчеркнул в двух словах, почему это непрактично (и ==> бесперспективно):

1) "всё" непрерывно растёт;

2) никаких машинных ресурсов не хватит;

3) сигнал слабый, много шума, всё равно надо сжимать и сжимать;

4) это никакой практической проблемы не решает и никому (==>) не нужно.

Попробуйте пронспонсировать нечто, что, возможно, даст эффект лет через 100 (а может, и не даст).

Как писал Vyacheslav Tikhonov
И что? Речь там вроде как идет о LSI, методе, который используется с начала 80-х годов. Или это и есть "новизна"?

Да нет, просто хотел узнать, знакомы ли Вы. Один из примеров того, что конкретно люди пытаются делать. Что там 80-е: кто-то писал здесь и про Аристотеля. Но речь не о том, в каком году изобрели велосипед, а в том, как используют сейчас особые шины, эксперементируют с маслом, затачивают форму руля... Пока колучается, что анализ ссылок (если их достьаточно много) даёт гораздо лучшие результаты, чем семантические разборы, nlp и иже с ними.

____

(А про новизну я пытался чуть написать в другом месте. Хотя и новизна: пусть уж начилась бы с текущих проблем, которых --немеряно: собрать все документы, выбросить зеркала и дубликаты -- уже как-то легче).

Как писал Scaramush

....будет вполне достаточно ... Скажем, десяток-полтора двухпроцессорных "компаков" + 72-ую "сиську" на входе...

Интересные, обнадёживающие цифры... Хочется уточнить: этого будет достаточно... -- для чего, собственно? На ответы? или на индексирование? или на ботик, обходящий www раз в месяц? или на линки? или на ежечасное обновление самого-самого? или на поиск дубли, spamer'ов и иже с ними же? или -- неужто? --на всё сразу?

(разработку / отладку / улучшение, разумеется, делают чуваки из OpenSoure, долгими бессонными одинокими ночами таращась в свои только что купленные пол-дюймовые мониторы).

Вопрос ещё -- сколько ответов в секунду "это" будет давать, и сколько времени будет уходить на каждый ответ.

Как писал Vyacheslav Tikhonov

Не думаю. Скорее дело в отсутствии какой-либо маркетинговой политики с их стороны - с одними технологиями, даже революционными, ничего не добъешься.

Т.е. им нехватило только бабок и "маркетинговой политики", а идей гениальных было пруд пруди? Интересно, каких. Хоть одна, не самая ценная?.. Были ли какие-ниб. статьи, пресс-релизы? (Я просто, извините, до сегодняшнего дня не слышал про такие системы, попробовал - ужаснулся).

Как писал Vyacheslav Tikhonov
Теорию изучил. Идея новизны есть? :D

Да... Тема "идея новизны":D хороша🤣D🤣, и уже длится пол-года (интересно, много ли здесь таких тем?). Хотя заметно флуктуирует:о). Начали за здравие (т.е. как всё фигово и как всё резко улучшить - "взять всё, да и поделить", а кончили за матрицу всего ко всему).

Мне кажется, проблема надуманная, задачу отношения всего ко всему не надо ставить даже в принципе: жизнь-то идёт, www увеличивается в год на 20%. А вот найти сотню семантически (пардон за выражение) связных документов, -- например, ну хоть сто первых (по современным алгоритмам) результатов по такому-то запросу, -- и среди них уже строить любые матрицы и сжимать их всеми придуманными способами - вроде как имеет смысл. (Вот здесь есть некоторые подробности того, что кто-то потихоньку делает).

_____

А насчёт собственно "Идеи! Новизны!": как вам такое:

Улучшить ЛЮБОЙ отдельный конкретный запрос -- так, что никаким Googl'ам не снилось, -- может практически каждый. Поэтому нужно нанять 100,000,000 граждан, измученных нарзаном и находящихся на грани изнеможения от протёртого места в жизни, и поручить каждому по одному запросу в день. Чем вам не OpenSource?

Как писал BUFO
Может кому будет интересно - человек написал Punto.ru, первый опыт, имхо, был наверно не самым удачным, но сейчас готовится к выходу другой эксперимент и вы можете обсудить его здесь

Обсудить хотелось бы, но:

1) Почему-то через https...:::-о))? причём сертификат негодный ... 🙄 Вы именно **это** предлагаете обсудить?

(Закройте глаза и представьте себе ну хоть Google, работающий через ssl);

2) НОВАЯ ПОИСКОВАЯ СИСТЕМА на любой запрос выдаёт правильный ответ: "An error occured! Can not connect to search daemon",

3) и при этом она powered by ASPseek.

😆

Как писал HeavenSeven
В рамках кандидатской диссертации занимаюсь созданием поисковика.

У меня единственный вопрос: о чём диссертация?

((И как насчёт наоборот ("в рамках создания поисковика написать несколько сот кандидатских диссертаций")?))

Как писал HeavenSeven
Теорию изучил.

Напишите книгу - зачем диссертацию?

Как писал HeavenSeven
Сейчас главная задача - это понять, какие существуют пути развития современных систем и теорий. Что есть смысл совершенствовать.

Это могло бы послужить темой блестящей кандидатской, да и на докторскую вполне бы потянуло. Всё только начинается.

Как писал HeavenSeven
Интересует академический уклон в посике.

"академический уклон" -- это когда Вы пишете не коммерческую, а университетскую SE. При этом надо отдавать себе отчёт, что разница в поисковике, постороенном на 10 миллионах страниц, и в таком же точно -- на нескольких миллиардах, - принципиальна).

Самому писать поисковик... гм. Что ж, одному чуваку это в каком-то смысле удалось (http://www.gigablast.com), да и Брин с Пейджем начинали в гараже. Но если Вы сегодня хотите написать что-то хоть отдалённо сравнимое с современными SE, Вам надобно будет одного железа накупить на десятки миллионов $$. А иного способа "узнать" "пути развития современных систем и теорий", наверное, увы, нет. Разве что догадаться.

Но возможно, под "академический уклон" подошло бы решение какой-нибудь чуть более частной задачи?

Как писал dimok
- релевантность, PR, дубли, спам,

SEOs:-)... -- всё это оч. интересно, хотя этим занимаются уже тысячи людей во всём мире, и у них больше информации / инструментов и т.д. К тому же, каждая из этих тем тоже тянет на десятки диссертаций. К этому можно добавить (или разбавить), ну, например:

--- правильно и дёшево собрать не 5, а 100 миллиардов страниц (или ну хоть 10 миллиардов - как обещает dipsie)

--- индексировать любые типы документов (начиная с почты, и посмеяться заодно над микрософтом)

--- понять, что такое "релевантность", и научиться её измерять

--- по-умному агрегировать результаты (и этим забить alltheweb, vivisimo, mooter, google-labs/sets...)

--- (кстати): научиться умело отвечать на двусмысленные запросы

--- одновременно и делать бабки, и удовлетворять ищущих пользователей (и натянуть нос сами-знаете-кому)

--- искать не только текст (напр: найти название мелодии, которая звучит "примерно так"...)

--- сделать персональный поиск (windows для домохозяйки и для программиста)

--- уметь классифицировать запросы

--- (и разбивать их на связные группы/фразы)

--- учитывать специфику пользователя и контекста (язык, географию, возраст, пол, день недели, близость футбольного турнира...)

--- отвечать на вопросы (на "сколько гигабайт в киловатте?" давать не список страниц, а ответ: "столько".)

--- давать ответы не по ключевым словам, а по смыслу. Научиться понимать смысл запроса.........

--- ... (Продолжать?).

А приятнее всего было бы найти что-то эдакое, чем пока ещё никто не занимается.....:-о!).

И чтобы всем сразу стало хорошо.

Всё равно не понятно. То ли Вы спрашиваете, во сколько бит можно упаковать каждое слово, то ли подразумеваете, что индекс устроен по принципу реляционной БД... Ведь слова - это мизерная часть индекса.

И причём тут русский язык? Вы думаете, существуют поисковики, индексирующие только слова русского языка?

Кстати о появлении в:

http://www.webmasterworld.com/forum35/1790.htm

Обращаю внимание на даты (1 марта и 15 апреля).

12 3
Всего: 24