В мире есть два вида парсеров XML - разработанный Microsoft и все остальные. Первый вылетает на любой синтаксической ошибке и является наиболее strict парсером - потому что остальные стараются все равно отобразить ошибочный участок.
Нет, мы не планируем. Вряд ли это будет полезно, а трудоемкость операции довольно велика.
Ну почему же? :)
Если я не ошибаюсь, на первый семинар Ашманова пришли год назад самые разные люди, включая Сашу Садовского. И нашли, что делать :).
Выше я лишь констатировал факт - это не конференция, как та, что проходит осенью, а семинар, где акцент сделан на обучении. Вместе с тем, не думаю, что SEO выше среднего будут совсем неинтересны наши доклады или общение в кулуарах.
Я, грешным делом, думал, что конкретно вы, как пользователь этого форума, испытываете определенные неудобства, связанные со спам-атаками на сервер. Но если вам нет никакой разницы, то, конечно, что-то говорить бесполезно.
Скажите, а какая вам конкретно разница, если теракты происходят?
Я все же надеюсь, что мы говорим на одном уровне. Дорвеи к подобной технике имеют крайне опосредованное отношение - это следует знать. Мы всё же находимся на специализированном форуме, а не в чате кружка юных вебмастеров.
Нет, разумеется. Я продаю рекламное место и мне абсолютно безразличны потоки денег, пока они меня не касаются. Завтра (вернее, когда закончится срок размещения Umax) придет Бегун и попросится на это место - я поставлю его. Придете вы и попросите продать место под рекламу своих услуг - и мне будет безразлично, купили вы его за деньги, заработанные обслуживанием клиентов, или ваш дядя-олигарх их дал.
Вас еще не утомила забота о моей нравственности?
Официальный бар Яндекса дает точно такую же информацию. Т.е. точно также опаздывает с трансляцией в бар.
Лев, при всём желании разобраться - при наших ценах на трафик это не всего лишь 300 мег, а целых 300 мег. Качать это и дорого и долго.
Почему бы Вам:
- не сделать веб-интерфейс к своей базе в целях тестирования? Кстати, тогда Вы сможете выложить туда хоть 100 гиг, или
- не провести ту операцию самостоятельно - натравив локальный поиск Яндекса и сравнив его со своим? Я поверю тем результатам, что Вы получите - тем более, что уверен, что ребята из Яндекса их тут же перепроверят.
Погодите, как же так? Вы же говорите - несколькими постами раньше - что поиск похожих работает лучше, чем обычный. Так и сравнивайте с обычным - зачем же Вам особые соперники?
Мы с Вами уже говорили о том, что это plain text, так вроде? Но теперь выходит, что единицей у Вас является документ средним размеров в 150 тысяч символов? Ну, просто для информации - "Капитанская дочка" Пушкина меньше.
Я Вам уже говорил - зависит от качества. Вы так и не отвечаете на вопрос относительно источников базы - как она подбиралась, что за документы в базе и т.д. Вы же должны понимать, что поиск похожих законодательных актов - это одно, а склеивание в сюжет новостных материалов об одном событии - это совсем другое, там и источники разные, и четкость меньше. Это не говоря уже о подавлении дублей в базе, составленной обходом веба.
Какой именно поиск хуже? Я вижу таблицы в тексте similarsearch.doc и понимаю, что речь идет про то, что Ваш "фразовый" поиск хуже, чем Ваш же поиск похожих, так?
Лев, видите, ни мне, ни вот тут Вы не объясняете, зачем Вам (или не Вам) надо искать именно похожие. Никакой реальной задачи, кроме выявления нечетких дублей Вы не приводите, а сравнивать с имеющимися технологиями не хотите.
Ведь есть же метод супершинглов Сегаловича, который успешно работает в Яндексе - как в поиске, так и в Спамообороне. Успешно давит дубли и Рамблер.
Сейчас вот Yahoo! запустил контекстный поиск.
Разумеется, это веб-решения и нет никакого способа их прикрутить сейчас к корпоративному поиску. Но технологии-то вполне сравнимы...
Потрудитесь не править посты, после того, как на них ответили.
Очевидно, что все вопросы следует для начала задать саппорту Яндекса. Если вы подозреваете глюк или ошибку - тем более, только туда вам и следует обращаться.
Как это проявлялось?
ZanderXML, ну что ж вы не договариваете мысль-то?
причем половину, видимо, вы.
1. Видимо, стоит спросить саппорт Директа.
2. А вы не забыли, что показы в Директе идут при вхождении слова - т.е., если кто-то заказал показ по слову "игры", то реклама покажется на "к играм" и т.д.?
3. Не смешно. В самом деле не знаете? Поищите по форуму, ключевое слово - кэш Яндекса.
4. Давайте более предметно - где, как, по каким запосам. Вы не один пользуетесь Директом, но что-то я первый раз слышу о подобном.
5. А еще они у себя свет выключали. Спросите - "Почему?".
6. Без общих слов. Какое конкретно слово имеется в виду?