- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Уважаемые КАНДИДАТЫ НАУК, ну поконкретней если можно......
Если у Вас будет пара миллионов страниц, то ставьте Nutch или Dataparksearch. Для второго поставьте режим dbmode=cache. И будет все практически бесплатно. Так, например, на http://www.43n39e.ru/ проиндексировано 400 тысяч сайтов и миллион страниц. Возьмите сервер помощнее 2-4 процессора, быстрые SCSI диски запрягите в рейде и памяти гигабайт 6-8. И будет все очень быстро работать.
ITMAN, моя благодарность.
Если позволите, после ознакомления с означенными Вами движками, я задам еще несколько вопросов, если конечно возникнут.
itman, Чет битая ссылка какая то.
Disell, отнюдь не битая, а рабочая.
itman, сразу бы хотелось добавить сколько я не крутил датапарк да и судя по отзывам никому кроме максима не удавалось проиндексировать такое кол-во документов :), там слишком много нюансов в настройке да и самая большая их беда кроме того что использует Mysql это то что новые билды бывают не поддерживают старую БД и с новым билдом поисковика надо делать ребилд всей базы :(.
CALM, Могу посоветовать поставить Nutch, и не только посоветовать но и поставить, вещь очень серьёзная из примеров на ней работает adre.ru. Есть так же свои модули и наработки. Русская морфология на уровне стэмминга, парсер иконок как на яндексе, определение гегорафическое принадлежности сайта к стране и многое другое. Если заинтересовались велком в личку.
snoopckuu, я отправил в личку
Я, господа специалисты, если позволите несколько сужу вопрос под конкретную задачу
Есть необходимость организовать поиск по заранее заданной группе сайтов (500-1000)
Вопросы:
1. Какой движок необходим ?
2. Где добыть ?
3. Сколько должен стоить ?
Заранее благодарен за ответы
Поищите инфу про Alexa, они недавно решили давать возможность аренды своиъ ресурсов и даже собственного ранжирования сайтов по любой тематике.
А скоро и Google начнет.
Disell, отнюдь не битая, а рабочая.
Ночью электрики чинили подстанцию, вполне возможно, что смотрели сайт в это время...
itman, сразу бы хотелось добавить сколько я не крутил датапарк да и судя по отзывам никому кроме максима не удавалось проиндексировать такое кол-во документов :), там слишком много нюансов в настройке да и самая большая их беда кроме того что использует Mysql это то что новые билды бывают не поддерживают старую БД и с новым билдом поисковика надо делать ребилд всей базы :(.
Последнее изменение, требовавшее полной переиндексации было около двух лет назад, все остальные изменения касались добавления новых таблиц или столбцов в существующие таблицы, что вполне решается средствами SQL-сервера.
Все крупные успешные инсталяции используют PostgreSQL, а не MySQL. Наиболее крупная работающая инсталяция, извесная мне, насчитывает около 19 млн. страниц, правда всреднем примерно в 3 раза меньших по размеру среднестатистиченеской интернет-страницы.
Maxime, звучит убедительно, под рукой есть очень мощная машинка, опять проведу тесты только с PgSQL посмотрим что из этого получится. :)
Кто может дать ссылки на отраслевые поисковики?
Самостоятельные, а не сделанные на базе Яндекс
Основная проблема здесь не столько в самом поисковике, а в его маркетинговой модели. Открыть новую поисковую систему не проблема - проблема ее раскрутить.
Здесь не поможет ни ноу-хау, ни хорошее качество поиска - сделать проект известным и восстребованным может только тематическая аудитория.
Смотрите, как поступает гугл, когда ему нужно вклиниться в новую нишу - он покупает социальные сети вместе со всеми их пользователями, увеличивая собственную аудиторию, которая этими сервисами пользуется, и не вкладывает ничего в раскрутку. Вот почему в большинстве случаев его проекты успешны.