Впечатление от поиска на ЧЕРЕПАХЕ

123 4
Григорий Селезнев
На сайте с 25.09.2001
Offline
298
9862

с использованием литературных выражений, черпаха далековато от реальности ... и пользоваться ресультатами поиска тяжеловато ... или я чего-то не понимаю ...

wolf
На сайте с 13.03.2001
Offline
1183
#1

Либо база еще совсем маленькая, либо PageRank'ом и не пахнет. В первой десятке по интересному однословному запросу я обнаружил четыре дорвея, которые сделал более двух лет тому назад в соответствии с тогдашними реалиями рунетовских поисковиков. Реалии изменились - дорвеи забылись. И надо же, когда выстрелили. :D

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
F
На сайте с 15.11.2000
Offline
116
#2
Как писал wolf
Либо база еще совсем маленькая, либо PageRank'ом и не пахнет.

1. База, судя по их заверениям, раза в полтора больше, чем база Яндекса по объему. Похоже, что Тартл использует для расчета "грязный" html (с тегами), а Яндекс "чистый" -- у Тартла средний размер документа 25Кб, у Яндекса -- 17Кб. По числу документов Тартл превосходит Яндекс только на 20%.

2. В Тартл не работает по-умолчанию группировка по сайтам. Странное решение, если большинство ведущих поисковиков (Google, Яндекс, Рамблер и т.д.) давно пришли к выводу, что это более удачный вариант.

3. Ни PageRank, ни ссылочное ранжирование не используются, или им придали крайне малый вес.

4. При запросе из 3 и более слов практически всегда слишком большой вес придается одному из слов, в итоге результаты поиска совершенно нерелевантны. Например, в одном из документов содержатся все слова "коэффициент затухания результат работы PageRank", но результат поиска впечатляет -- ничего похожего.

5. Индексируются xls-файлы и, наверное, другие распространенные форматы.

6. Есть интересная возможность ретроспективы документа -- увидеть несколько его версий.

7. Интересная возможность поиска по фрагменту.

С уважением,

Александр Садовский.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#3
В Тартл не работает по-умолчанию группировка по сайтам.

Кроме того, результаты с группировкой и без довольно сильно различаются

AiK
На сайте с 27.10.2000
Offline
257
AiK
#4

да и работает кривовато

VT
На сайте с 27.01.2001
Offline
130
#5
При запросе из 3 и более слов практически всегда слишком большой вес придается одному из слов, в итоге результаты поиска совершенно нерелевантны. Например, в одном из документов содержатся все слова "коэффициент затухания результат работы PageRank", но результат поиска впечатляет -- ничего похожего.

Гм, странно. По идее для многословных запросов должны по координатному индексу быть просчитаны варианты начиная от "строгого соответствия". Черепаха же необоснованно дает больший приоритет наиболее частотным словам вроде "работа".

euhenio
На сайте с 21.09.2001
Offline
357
#6
Кроме того, результаты с группировкой и без довольно сильно различаются

По моему, группировка вообще не работает.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
M
На сайте с 05.06.2001
Offline
23
#7

По поводу размера базы:

http://www.turtle.ru/db/s.html?page=100&all=1&words=%E0%EF%EE%F0%F2

То есть turtle заиндексировал около миллиона страниц результатов поиска апорта

При таком подходе к индексации динамики можно и гугл запросто обогнать по размеру базы

MA
На сайте с 02.07.2001
Offline
16
#8
Как писал misha
То есть turtle заиндексировал около миллиона страниц результатов поиска апорта
При таком подходе к индексации динамики можно и гугл запросто обогнать по размеру базы

Это интересно... возможно Turtle использовал страницы выдачи резльтатов запросов поисковиков (или только апорта) для первоначального заполнения своей базы для индексации. (;

wolf
На сайте с 13.03.2001
Offline
1183
#9
То есть turtle заиндексировал около миллиона страниц результатов поиска апорта

А какого рожна вы в Апорте не запретите индексацию результатов поиска? Трудно robots.txt составить? Все уважающие себя поисковики не гнушаются этого сделать. И не надо будет себя потом в грудь бить - типа "мои результаты поиска нехорошие ребята индексируют".

M
На сайте с 05.06.2001
Offline
23
#10

Я про "нехороших ребят" ничего не говорил, никаких претензий к turtle нет. Речь о другом: ничем не ограниченная индексация динамики приводит к неограниченному росту объема базы, и надеяться в этом отношении только на сознательность и аккуратность вебмастеров нельзя. А апорт просто для примера...

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий