Большое спасибо Игорю за подробный ответ. Я знал, что делаю, формулируя тему в виде "не слабо ли, мол, Рамблеру", но первой задачей было именно вызвать на диалог, чтобы прояснить мнения. В принципе, форум для этого и предназначен.
И Грин, и Игорь высказались четко: любая технология, сервис, идея, которая может быть использована спамерами и плагиаторами, будет использована. Причем использована очень быстро. Я переписывался с некоторыми ребятами, которых можно отнести к данной категории вебмастеров - люди вполне нормальные и прекрасно соображающие, просто они не озабочены тем, что Игорь называет "заботой о пользователе", так как заботятся прежде всего о себе. Игорь даже описал ситуацию объединения в группы аморальных личностей. Абсолютно верно.
Но почему в группы не могут объединяться "моральные личности"? Та же Америка начиналась не с лучших представителей человечества, а оружие там всегда продавалось совершенно свободно. И банды там есть. Но государство все же оказалось способным поддерживать баланс и разделять сообщества. Поисковая система по количеству пользователей с самыми разными интересами, относящимися к сфере ее деятельности - то же государство, аналогия самая прямая. И сегодня происходит становление этого государства, с идеологией, лояльными гражданами и преступниками, законодательством и т.п.
Нормальному вебмастеру нужны правила игры и реальные законные механизмы достижения цели. Если вебмастер знает совокупность поисковых запросов, на которые его сайт дает нормальные ответы и полезен пользователям, то что он должен сделать, чтобы ссылки находились на хороших позициях? Интересы вебмастера и поисковой системы в этом случае абсолютно совпадают. Но поисковая система не дает ответа. Тем самым не поддерживает своих же союзников. Вебмастера (минимум, 80%), видя, каковы позиции их сайтов благодаря сегодняшним алгоритмам релевантности, начинают искать способы продвижения и сталкиваются с очень интересной картиной: вся литература по этому вопросу переведена лет семь назад с английского, крайне противоречива, нет никаких реальных методов позиционирования, а поисковые системы хранят глубокое молчание. Тем самым просто подталкивают к "изысканию возможностей", которые потом трактуют как спам. И из вполне нормальных людей делают импотентов. Таким образом, спам порожден самими же поисковиками: возможность дали, альтернативы не предложили, четкой границы не провели, соблазн велик, а ответственности никакой. И сами же теперь теряют деньги на борьбе с ним.
Создание информационного сервиса по анализу поискового спроса - это только первый шаг. Сразу же на его базе можно и нужно организовывать рекламный сервис, где пользователям не только будут предлагаться информация о запросах, но и ответы на них. Таким образом каждый вебмастер сможет не только оценить размеры поискового спроса на любую тематику, но и объем и качество предложения.
Даст это две вещи. Организатору "процесса" - деньги, подобной рекламы еще вообще в интернете нет. Это одна часть ответа на вопрос Игоря, "что можете предложить". Самой Сети - резкое увеличение информационной насыщенности. Кому захочется лезть в области, где информации и так уже достаточно? А вот выявление сферы, где есть устойчивый спрос, но практически нет предложения - это незанятая ниша. Сегодня пользователи поисковой системы, интересующиеся информацией в этой нише, получают облом. Завтра - получат качественные ответы. Т.е. та же любимая всеми поисковиками "забота о пользователях" и релевантности ссылок. Это вторая часть ответа.
Техника борьбы со спамерами в такой системе описана в "Априорно законном кидалове" (http://hisnameis.runet.ru/newsite/p_147.htm). Прошу прощения за ссылку на свой же сайт, но там довольно много, не сюда же переписывать.
Андрей Иванов.
[This message has been edited by andre (edited 18-02-2001).]
Какую машину, Сергей? Рамблеровскую практически никак, то, что нам надо гораздо проще того же "Прямого Эфира" Яндекса.
А сам сервис можно сделать по-разному. Хотя пы по типу "подписки на запросы". Если автомобилиста интересуют запросы по маске "*авто*", то и собирать их можно отдельно. Первичное тематическое деление очень простое.
Это в "дешевом" варианте. В случае поддержки такого подпроекта любым приличным провайдером сервис замечательно и в онлайне работать будет. :0)
Скрипт просто раз в минуту вызывал страницу "Прямого Эфира" и отчищал все, кроме самих формулировок. Далее формулировки поступали ко мне как txt-файл, где каждый запрос был отдельной строкой. Далее автозамена line break на ". " (точка+пробел). Затем полученный кусок добавлялся к старой текстовой базе. Потом подача этого постоянно растущего файла на программу подготовки "Штучки" и обновление файла для подпрограммы выборки запросов.
Методика довольно приблизительная, потому что скорость обновления "Прямого Эфира" была разная, иногда скрипт прихватывал не до конца обновленную страницу, поэтому "парадоксальных" результатов кое по каким запросам хватает. :0)
Сейчас сделал открытое предложение Игорю Ашманову отдавать на сторону каждую n-ную формулировку. Это несложно для любого поисковика. Все остальное просто сделать и самим. Поддержи, Gray. :0)
:0) Очень интересный адрес, только я к нему отношения не имею, узнал как раз из реплики Все ссылки ведут на один-единственный сайт, возможно, он таким образом раскручивается... :0)
Собирать и делать выборки запросов не так уж трудно. Особенно если это касается Рамблера и Игоря Ашманова. Если кого-нибудь интересуют формулировки запросов по любой тематике, вы можете сами сделать эти выборки - база запросов по Яндексу и программа-обработчик свободно доступны. Скачивайте и пользуйтесь - http://hisnameis.runet.ru/newsite/p_151.htm . Другое дело, что онлайн-сервис, который элементарно может организовать любая поисковая система потенциально обладает в десятки раз большими возможностями. Игорь, может сделаете, а? :0)
Андрей Иванов (neiron@bancorp.ru)
Цитирую свою переписку с Апортом по поводу индексации быстрообновляющегося сайта:
- - - -
Попробовал подать на индексацию отдельную страницу сайта и получил ответ администратора, что сайт уже зарегистрирован в каталоге (Апорт не разделяет регистрацию в поисковой системе и каталоге). Вот переписка по теме:
> 07.12.2000 Вы заполнили регистрационную форму в каталоге ресурсов > Интернет Апорт-Каталог (http://www.aport.ru): > > http://hisnameis.narod.ru/p_108.htm > > Наверное, произошла ошибка. Ваш сайт уже зарегистрирован в нашем каталоге.
--------------------------------------------------------------------------------
> Я просто пытаюсь разобраться, каким образом подавать на индексацию в Апорт > новые страницы сайта. Ваша система регистрации не разделяет подачу заявки на > индексацию в поисковой машине и каталоге. > Бы бы очень признателен за любую информацию по этому поводу. И не один я, у > меня куча писем от подписчиков с просьбой разъяснить ситуацию.
Новые страницы уже зарегистрированного сайта добавляются поисковой системой автоматически при очередной проверке сайта роботом. Регистрировать их не нужно.
Спасибо за ответ, Михаил. Не откажите в просьбе, сообщите, пожалуйста, - как часто робот Апорта посещает проиндексированные сайты? - надо ли для быстрообновляющихся (ежедневно) сайтов делать в коде главной страницы какие-то специальные записи в тэгах? Ваш ответ (равно как и его отсутствие) будет полностью процитирован в материалах рассылки, на сайте и на форуме по поисковым системам с указанием всех координат. Если Апорт уже разместил где-либо информацию, которая предназначена для вебмастеров, регистрирующих свои сайты в Вашей системе, дайте, пожалуйста, ссылку. Поверьте, вебмастеров, которые хотят разобраться в ситуации и правильно регистрироваться в Апорте очень много. Я стабильно получаю по письму в неделю, где народ жалуется на "закрытость" Апорта и Рамблера и отсутствие четкой информации по вопросам индексации. Поэтому еще раз благодарю Вас за ответ.
Период посещения роботом Апорта имеющихся в его базе сайтов от недели до двух месяцев, в зависимости от популярности сайта (определяется количеством ссылок на этот сайт в интернете) и его обновляемости (по данным, собранным роботом при предыдущих посещениях сайта). Каких-либо специальных тэгов, информирующих робот об обновляемости страниц, Апорт не поддерживает. Информация о регистрации в поисковой системе размещена у нас на странице http://www.aport.ru/webmast.htm (ссылка "Советы по регистрации" внизу главной страницы).
Собеседником был Михаил Костин из "Агамы".
"Вероятно, Яндекс сначала индексирует только..." Так оно и есть, после подачи страницы вручную по совпадению фразы ее можно находить уже через полчасика. В листе ответов показывается титул и description, цитаты с выделенными ключевыми словами нет. Это появляется лишь через пару недель. Наверное, тогда и стоит считать, что индексация прошла полностью.