Ищу книги по теме

110

SEManiak

18 октября 2006, 14:29

2927

Привет,

С недавних пор увлёкся созданием поисковой системы на некоммерческой основе,

по большей части для себя. Некоторые знания уже есть и публикаций набрался, но не хватает фундаментальной литературы авторов вроде Baeza-Yates, W.B. Frakes.

Видел, что Managing Gigabytes есть в электронном виде на амазоне.

Может у кого-то есть чем поделиться (пдф) или предложить купить книгу (Киев, Украина)

Ну или посоветовать – так как возможно разорюсь на заказ на амазоне.

Спасибо

VT

130

Vyacheslav Tikhonov

19 октября 2006, 13:14

#1

Для начала можно почитать этот топик пятилетней давности. Теория с того времени не изменилась. :)

SS

141

Seventh Son

19 октября 2006, 14:36

#2

http://community.livejournal.com/ru_ir/25720.html

Здесь большая подборка литературы (названий).

Могу скинуть Soumen Chakrabarti - Mining the Web. Discovering Knowledge From Hypertext Data (pdf, 3.2Mb, 364стр)

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт

S

110

SEManiak

19 октября 2006, 19:25

#3

Vyacheslav Tikhonov:
Для начала можно почитать этот топик пятилетней давности. Теория с того времени не изменилась. :)

Спасибо, обязательно перечитаю.

Seventh Son:
http://community.livejournal.com/ru_ir/25720.html
Могу скинуть Soumen Chakrabarti - Mining the Web. Discovering Knowledge From Hypertext Data (pdf, 3.2Mb, 364стр)

привет, вчера давал свой имейл Вам - а книжки так и не получил

так что жду 🙄

SS

141

Seventh Son

19 октября 2006, 20:43

#4

SEManiak:
привет, вчера давал свой имейл Вам - а книжки так и не получил
так что жду

Скиньте адрес личкой по форуму.

S

110

SEManiak

8 ноября 2006, 20:49

#5

Тут заморские клиенты решили сделать подарок на НГ и ДР и сказали, что можно заказывать книжки на амазоне (самому не удобно платить 😆 )

пока 100% кандидат Модерн ИР от Йейтса

что ещё из супер важного можно?

Из задач IR-а актуальные для меня

- автоматическая классификация и кластеризация (кластеризация результатов запроса)

- собственно поиск (на сайте), особенно с использованием баз данных, MSSQL 2000/2005

- использование платформы .Net 2.0 – так как на ней пишу (оптимизация работы со строками, массивами, работа с памятью, мультипроцессорность, распределение работы в локальной сети)

Объяснюсь.

В Конкуренты для гугла я не мечу – т.е. возвращаться к C и оптимизациям в стиле, как брин и Пейдж рассказывали (3 бита выиграем тут, 4 там) – для себя не вижу смысла. В этом не был никогда силён – и это мне не интересно. Тем более проектирование своей файловой системы, базы данных.

На платформе .Net 2.0/MSSQL 2000 есть несколько развивающихся сайтов, для которых через некоторое время понадобиться полноценный поиск.

Сейчас занимаюсь раскруткой некоторых сайтов и готовлю проект с онлайн-сервисами для неё же (то бишь раскрутки). Для этого есть небольшой кроулер, с постоянно пополняющимися фичами (типа анализ всего сайта по многим пунктам, видимость его в поисковиках, и т.д.)

Ну надеюсь идея ясна, буду рад за советы знатоков ;)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

S

110

SEManiak

8 ноября 2006, 20:51

#6

Seventh Son:
Могу скинуть Soumen Chakrabarti - Mining the Web. Discovering Knowledge From Hypertext Data (pdf, 3.2Mb, 364стр)

Спасибо за книженцию

на многие вещи - особенно на эффективный кроулер и архитиктуру системмы в целом - книга открыла много нового ☝

RO

27

RC(O)OR'

8 ноября 2006, 20:56

#7

Дорогой друг, а зачем изобретать велосипед? "Всё уже украдено до нас";) Вот вам собственный гугл. Даже деньги с ним будете делить ффти-фифти

Ну, а уж если не в терпёж, то сюда

Для Вас, "рубящие с плеча". Всё написанное мной всегда является лично моим мнением, за исключением сообщений с приведением цитат и ссылок на них;-)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

S

110

SEManiak

8 ноября 2006, 21:05

#8

RC(O)OR':
Дорогой друг, а зачем изобретать велосипед? "Всё уже украдено до нас";) Вот вам собственный гугл. Даже деньги с ним будете делить ффти-фифти
Ну, а уж если не в терпёж, то сюда

улыбнуло :)

лично моё мнение, что http://www.google.com/coop/cse/ фуфло, и я знаю о нём не по наслышке - уже пробовал на одном большой проекте его погонять

сам гугл достаточно "интересно" работает, яху всё больше и больше нравится

но это всё не о том.

у меня есть

а) конкретные задачи, которые необходимо решать

б) опыт реализации бешаных проектов (инверсная кинематика, обучающиеся системмы, 3д движок - это всё было ещё в школе и завоевало достаточно наград)

в) самое главное - мне это действительно интересно, и я этим занимаюсь уже ☝

за линку на классы яндекса пасиба, думал там есть только публикации и план курсов, а там ещё и доки.

сенкъю

НО

для меня бумажная литература, это незаменимая весчЪ - очень люблю читать не с компутера (хотя и моник MVA + 19")

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

VT

130

Vyacheslav Tikhonov

9 ноября 2006, 00:00

#9

лично моё мнение, что http://www.google.com/coop/cse/ фуфло, и я знаю о нём не по наслышке - уже пробовал на одном большой проекте его погонять

Очень напрасно. На самом деле Google Custom Search нужен Гуглу не как тематический поисковик для веб-мастеров, а как инструмент для того, чтобы загрузить работой людей, сортирующих и оценившающих наиболее важные сайты.

Другими словами, гугл воспользуется трудом множества экспертов, чтобы улучшить собственное качество поиска. Я как-то об этом уже писал.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

S

110

SEManiak

9 ноября 2006, 00:40

#10

Vyacheslav Tikhonov:
об этом уже писал.

прочитал, согласен

мне предложили юзать сие чудо, как панацею от всех бед - вот поэтому и сказал, что для меня это не подходит (ну почти так сказал :D )

возможно у Вас будут предположения по поводу полезной литературы?

зы. за ссылку спасибо, как раз начинаю обкатывать классификацию

Open AI тестирует память для ChatGPT

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта