orbea

orbea
Рейтинг
24
Регистрация
30.11.2009
Serj27:
Ни для кого не секрет, что социальные сети и вовлеченность в них - тренд, который снежным комом катится на нас уже длительное время.

Многие уже активно используют ВКонтакте и Facebook, но мало кто использует Twitter. Работать в нём на первый взгляд проще, но и в тоже время гораздо сложнее. Ведь необходимо учитывать много нюансов, которые не видны при стандартном подходе.

Мы накопили приличный опыт работы с сервисом микроблогов как для SEO целей, так и для вовлечения аудитории и повышения узнаваемости бренда.

В программе вы НЕ услышите:

- как использовать сервисы по покупке twitt`ов
- какие программы массфолловинга использовать
- где купить фолловеров и прочего спама

Подробную программу семинара и стоимость участия можно посмотреть на странице мероприятия

Спешите записаться кому интересно привлечение трафика из социальных сетей и работа с социальным Seo.

Так о чем разговор пойдет? Ниччо не понял

Alexey Levin:
Не приживется идея вот по чему:
- никто не запомнит столько слэштегов
.

Вот это имхо главное, потому что для простого смертного юзера -это трындец. Для гиков да, крутая фича. Но в общей серой массе, учитывая, что интернетом сейчас все домохозяйки пользуются - вряд ли это реальное будущее. :)

vitali_y:

понятно - нет идей - можно сказать что неинтересно

Да идей действительно много - я вот недавно в один из универов заходил - они там свой поиск ваяют, и идеи здравые есть. Да и люди хоть как-то знакомые с поисковой наукой идеи в любом случае вынашивают. Согласен с Goodman'ом - а в чем интерес? Ну если для себя, то мы вроде как все занимаемся, что-то даже где-то презентуем, а если глобально, то по-моему все уже давно придумано, работает и модернизируется, удовлетворяя потребностям аудитории.:)

Монстры поглазеют на отзывы по этому поиску, и если будет удачным то внедрят у себя, а про этот blekko уже "завтра" все дружно забудут - вот и вся история😂

Ну насколько я понял проблема у GBall такая:

GBall:

Пока я пытаюсь сделать лемматизатор, для приведения к заглавной форме, например, делал -> делать.

АОТ вполне с этой задачей справляется. Вводим "делал" получаем "делать" и все атрибуты. Зачем изобретать велосипед-то, да еще для дипломной работы:)

А про организацию поиска никто вроде бы и не спрашивал.

GBall:
Здраствуйте! Пишу диплом бакалавра на тему "Организация поиска с интеллектуальным анализом запросов". И вопрос сейчас не про саму организацию поиска, индексации и т.д., а про Морфологческий анализатор.

Первое: Стоит ли его вообще писать, я тут где-то читал, что оказывается в некторых субд он есть встроенный. Хотелось бы узнать о качестве его работы в них.

Второе: Если все же писать, как лучше быть? Протые стеммеры я сразу откинул, мне не понравилось что Стеммер Портера при вводе слова "зал" и "зала" выводит один и тот же ответ: "Неизменная часть слова : "за"". Вообщем для поиска не очень походит.

Моя идея пока такая: хранить список всех возможных окончаний, по ним определять что за слово и какое окончание подставить чтобы получить заглавную форму. Но че то это не всегда хорошо прокатывает. А если проводить дополнительный анализ предложения - не слишком ли это долго будет?

Вот это вполне хорошо работает. Выводы делаю из многолетней практики использования.

vitali_y:
Введение в информационный поиск
Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце

http://www.williamspublishing.com/Books/978-5-8459-1623-5.html

вроде как must have - пока не читал, но куплю.

Купил книгу с русским переводом - очень советую всем, кто так или иначе связан с интернет-математикой. На РОМИПЕ в Казани Павел Браславский руководитель екатеринбургского филиала Яндекс рекомендовал всем почитать. Тираж правда ограничен насколько я слышал - так что спешите.

Russeist:
Добрый день.

Подскажите, пожалуйста, хорошие книги или статьи объясняющие фундаментальные принципы работы ПС. Заранее спасибо.

http://download.yandex.ru/class/lifshits/lecture-note05.pdf - вот эту доку почитайте

wolf:
Походу, Руки вместо химиков стали подтягивать студентов, уже не запинающихся при произнесении математических терминов и прочитавших полкнижки по матстатистике. Но смысл остается прежним, ибо им про Фому, а они всё про Ёрёму :) От произнесения магического для нематематиков слова "дисперсия" смысл не меняется - применять закон Ципфа на объемах текста масштаба веб-страницы (и даже веб-сайта) - головотяпство со взломом.
Оценки-то давать можно, как угодно. Только вот грош им цена в базарный день получается. А не "фиксированная точность"

Давайте, будем объективны:

Вы открыто хамите: «Походу, Руки вместо химиков стали подтягивать студентов, уже не запинающихся при произнесении математических терминов и прочитавших полкнижки по матстатистике».

Пишете имена классиков :) с ошибками: «…ибо им про Фому, а они всё про Ёрёму»

Равняете статистику с базаром: «Оценки-то давать можно, как угодно. Только вот грош им цена в базарный день получается».

Склонны к схоластике: «с распределением частей речи, связностью падежей, чисел, родов и склонений в словосочетаниях и т.д. и т.п. Это ж серьезная лингвистическая база нужна».

(о значении термина можно почитать здесь http://ru.wikipedia.org/wiki/%D0%A1%D1%85%D0%BE%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%B0)

И снова хамите: «…они худо-бедно формулку запрограммируют».

Тем не менее, я думаю, мы можем продолжить общение по делу, после того, как Вы придёте в себя.

Ещё пока с уважением,

студент, не запинающийся при произнесении математических терминов . :)

metaContent:
Вы верите в то, что поисковикам важнее всего именно "близость текста к естественному" или, наоборот - заоптимизированному? Хотя никто не запрещает оптимизацию естественного текста, даже рекомендации Яндекса про это есть.

зы уж чего только сеошники себе не придумывают.

Я даже в Бога не верю.:)

Долгая дискуссия была на тему применимости закона Ципфа к решению конкретной задачи.

Уважаемый wolf, и Вам и остальным станет легче, если вы всё же начнёте задумываться над приводимыми цитатами… :)

Читаем вместе:

wolf:
«Корпус состоит из конечного числа текстов, но он призван адекватно … для описания первых двадцати тысяч слов (незатейливый, сердцебиение, роиться) уже требуется корпус свыше ста миллионов словоупотреблений.»

- есть условие существования достоверной модели распределения. Она давно получена…

Распределение Ципфа по малому (относительно лексической базы модели) является модельным приближением, отклонение которого от точного распределения - случайная величина с дисперсией (дисперсия значений функции невязки, например, среднеквадратичного отклонения), убывающей по мере роста объёма текста. Достаточно очевидно, надеюсь?

Так вот, имея функцию D(v) – дисперсия как функция объёма, можно с фиксированной точностью (не гулким лаем во дворе) давать оценки близости анализируемого текста к естественному.

wolf:

Еще раз рекомендую узнать, для каких объемов текста сформулирован закон Ципфа.

Ну, это что касается «научпопа».

А так…

желаю удачи, читайте книжки. :)

yanus:

в сеолибе можно учитывать тег "noindex" в руках нет. после "гонений на портянки" многие оставили текст старый для гугла, а для яндекса прикрыли часть текста этим тегом. не учитывать это глупо

yanus, насчет noindex - неправда. Если сильно хочется, то будет работать все. Скрин приложил 🚬

jpg r_screen.jpg
Всего: 66