- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
с использованием литературных выражений, черпаха далековато от реальности ... и пользоваться ресультатами поиска тяжеловато ... или я чего-то не понимаю ...
Либо база еще совсем маленькая, либо PageRank'ом и не пахнет. В первой десятке по интересному однословному запросу я обнаружил четыре дорвея, которые сделал более двух лет тому назад в соответствии с тогдашними реалиями рунетовских поисковиков. Реалии изменились - дорвеи забылись. И надо же, когда выстрелили. :D
Либо база еще совсем маленькая, либо PageRank'ом и не пахнет.
1. База, судя по их заверениям, раза в полтора больше, чем база Яндекса по объему. Похоже, что Тартл использует для расчета "грязный" html (с тегами), а Яндекс "чистый" -- у Тартла средний размер документа 25Кб, у Яндекса -- 17Кб. По числу документов Тартл превосходит Яндекс только на 20%.
2. В Тартл не работает по-умолчанию группировка по сайтам. Странное решение, если большинство ведущих поисковиков (Google, Яндекс, Рамблер и т.д.) давно пришли к выводу, что это более удачный вариант.
3. Ни PageRank, ни ссылочное ранжирование не используются, или им придали крайне малый вес.
4. При запросе из 3 и более слов практически всегда слишком большой вес придается одному из слов, в итоге результаты поиска совершенно нерелевантны. Например, в одном из документов содержатся все слова "коэффициент затухания результат работы PageRank", но результат поиска впечатляет -- ничего похожего.
5. Индексируются xls-файлы и, наверное, другие распространенные форматы.
6. Есть интересная возможность ретроспективы документа -- увидеть несколько его версий.
7. Интересная возможность поиска по фрагменту.
С уважением,
Александр Садовский.
Кроме того, результаты с группировкой и без довольно сильно различаются
да и работает кривовато
Гм, странно. По идее для многословных запросов должны по координатному индексу быть просчитаны варианты начиная от "строгого соответствия". Черепаха же необоснованно дает больший приоритет наиболее частотным словам вроде "работа".
По моему, группировка вообще не работает.
По поводу размера базы:
http://www.turtle.ru/db/s.html?page=100&all=1&words=%E0%EF%EE%F0%F2
То есть turtle заиндексировал около миллиона страниц результатов поиска апорта
При таком подходе к индексации динамики можно и гугл запросто обогнать по размеру базы
То есть turtle заиндексировал около миллиона страниц результатов поиска апорта
При таком подходе к индексации динамики можно и гугл запросто обогнать по размеру базы
Это интересно... возможно Turtle использовал страницы выдачи резльтатов запросов поисковиков (или только апорта) для первоначального заполнения своей базы для индексации. (;
А какого рожна вы в Апорте не запретите индексацию результатов поиска? Трудно robots.txt составить? Все уважающие себя поисковики не гнушаются этого сделать. И не надо будет себя потом в грудь бить - типа "мои результаты поиска нехорошие ребята индексируют".
Я про "нехороших ребят" ничего не говорил, никаких претензий к turtle нет. Речь о другом: ничем не ограниченная индексация динамики приводит к неограниченному росту объема базы, и надеяться в этом отношении только на сознательность и аккуратность вебмастеров нельзя. А апорт просто для примера...