- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
я имею в виду, что пассаж - найденный кусок, который ищется после того, как расставлены контекстные ограничения (переколдовка), а они расставляются по разному
То есть в твоих терминах есть первичное запросонезависимое разбиение на предложения и вторичное запросозависимое разбиение на пассажи?
wolf, Miha Kuzmin (KMY), странные вы люди - если пассаж запросонезависим, то откуда там возьмутся расстояния (=контекстные ограничения)?
Может я не очень понял.
Но если в Яндексе для каждого слова в документе есть номер предложения и номер слова в предложении, то все расстояния замечательно вычисляются и могут быть учтены в заданных контекстных ограничениях.
-я имею в виду, что пассаж - найденный кусок, который ищется после того, как расставлены контекстные ограничения (переколдовка), а они расставляются по разному
Т.е. если контекстные ограничения "в одном документе", в запросе два слова и первое слово стоит в документе первым, а второе слово из запроса стоит в документе последним, то пассажем является весь документ?!
ИМХО, очень сомнительно.
Что-то я не вижу доводов в пользу запросозависимого пассажа.
То, что пассаж не всегда равен предложению это выглядит правдоподобно. Слишком коротки предложения могут объединяться, слишком длинные - разбиваться.
То есть в твоих терминах есть первичное запросонезависимое разбиение на предложения и вторичное запросозависимое разбиение на пассажи?
-не понял насчет вторичного и превичного.
В моих терминах есть
1. запрос
2. В соответствии с внутренними фишками (частотностью парных запросов, например) между словами запроса ставятся контекстные ограничения. Типа это колдунщик.
3. В соответствии с конт. ограничениями ищутся и находятся пассажи. Т.е., фрагменты, удовлетворяющие ограничениям контекста.
Сэры, если у вас другое мнение-так и скажите. Это ведь все просто.
Но если в Яндексе для каждого слова в документе есть номер предложения и номер слова в предложении, то все расстояния замечательно вычисляются и могут быть учтены в заданных контекстных ограничениях
-согласен, могут. И задаются в контекстных ограничениях в кодунщике. Проблемы не вижу.
Т.е. если контекстные ограничения "в одном документе", в запросе два слова и первое слово стоит в документе первым, а второе слово из запроса стоит в документе последним, то пассажем является весь документ?!
ИМХО, очень сомнительно.
-насчет "весь документ" - это к Вольфу :), он так считает. Я думаю, что только расстояние рулит (а слова в середине не важны).
Что-то я не вижу доводов в пользу запросозависимого пассажа
-уважаемый, вы когда-нибудь слышали о колдунщике? Он это и делает - расставляет ограничения для каждого запроса индивидуально. И результат можно посмотреть.
То, что пассаж не всегда равен предложению это выглядит правдоподобно. Слишком коротки предложения могут объединяться, слишком длинные - разбиваться.
-вам в яндексе работать нада :)
Джон2007, а вы случайно не производитель известных дорвеев или софта для их производства? Тогда я не удивляюсь, почему дорвейщики (вместе с грином) дружно сасуд :)
Если насчет дореев ошибся - извиняюсь :)
В моих терминах есть
1. запрос
2. В соответствии с внутренними фишками (частотностью парных запросов, например) между словами запроса ставятся контекстные ограничения. Типа это колдунщик.
3. В соответствии с конт. ограничениями ищутся и находятся пассажи. Т.е., фрагменты, удовлетворяющие ограничениям контекста.
То есть разбиения на предложения в твоих терминах нет?
-не понял насчет вторичного и превичного.
Если я правильно понял твою логику, то текст таки должен быть сначала запросонезависимо разбит на предложения. А потом, в зависимости от результатов переколдовки запроса, и с учетом уже имеющегося разбиения текста на предлжения, формируются пассажи. Так? Например, колдунщик на говорит, что термины надо искать в одном предложении. Т.е. мы должны уже знать разбивку на предложения, что бы получить пассажи...
Опять, короче, панислось...
Кстати, неужели данный вопрос настолько ключевой и секретный, что первоисточники и носители истины отмалчиваются? Или у них просто спортивный интерес наблюдать за подобными спорами? Не исключено, правда, что обе версии настолько далеки от истины, что тому же Илье Сегаловичу просто лениво влезать и расставлять все по полкам :)
Позволю себе несколько мыслей высказать.
Для иллюстрации Жениных мыслей хорошо подходит использовавшийся уже в прошлом споре документ от Сегаловича: http://company.yandex.ru/articles/romip2004.xml
ИМХО конечно, но при внимательном изучении статьи можно сделать вывод о запросозависимости пассажа. А можно и не сделать - это как кому удобнее :)
Если я правильно понял твою логику, то текст таки должен быть сначала запросонезависимо разбит на предложения.
Где-то яндексоиды писали, что в индексе словопозиции документа хранятся с указанием номера предложения в документе и номера словопозиции в предложении. Причем, если моя память не спит с другим, то использовался именно термин "предложение", а не "пассаж" (хотя, может это для пользователей писалось :) ). Получается, что при парсинге документа все же происходит первичное разбиение на предложения. Но не думаю, что это противоречит мысли о запросозависимости.
Ну абзац просто. Вы вообще понимаете, о чем тут разговор?
Miha Kuzmin (KMY), сдается мне, тут все уже настолько запуталось, что это понять очень непросто. И проблема в том, что даже участвующие в споре не(одинаково) понимают, о чем речь. 8/