G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008
wolf:
Хм... По поводу "что-то там выделяется как-то, ну и гуд" - тут всё зависит от того, кто ставил ТЗ на подсветчик сохраненки. Насколько он педантичен и въедлив.

В Яндексе вроде свободное творчество культивируется, въедливые педанты не особо в почете. Да и по сохраненкам видно, что не было там жесткого контроля.

wolf:
Насчет доработок и прочих нюансов. Насколько я понимаю, задача подсветчика - обеспечить подсветку согласно контекстных ограничений колдунщика. Если переколдовка таки передается в qtree, то все нюансы и доработки должны передаваться в ней :)

Ну скорее всего именно так. Но колдунщик может все время дорабатываться, сегодня на конкретную подсветку пришли одни параметры, а завтра - уже другие. Он и подсветить может по-другому из-за этого. И в этом нет проблемы, ну не выделилось какое-то количество слов, да и пофигу. Выделилось-то достаточно. :)

Dlinnoux:
Есть масса способов "отжать" кол-во звонков

Каким образом, если телефоны у Сима свои?

На самом деле я пока не понимаю, как можно фильтровать спам-звонки. Есть внятные схемы? Кроме контроля за какой-то период, а потом, исходя из статистики, по среднему.

medea, для таких случаев специальный софт должен быть.

Ty1er, скорее всего перейдет со временем.

ThePriest:
Вопрос про пункты 3-4-5 - нужны ли они? (особенно пункт 3).

Я получаю на юр. лица по экспорту, не думаю, что разница большая. Тут Вам никто не ответит точно, потому что у каждого банка своя специфика, как показывает моя практика. Такие операции контролирует не налоговая, которой пофигу, а банк, отдел валютного контроля. В таком отделе конкретного банка сидят конкретные люди, со своими тараканами в голове. И требования у них могут существенно отличаться. Т.е. Вам нужно зайти в отдел валютного контроля того банка, который Вы выбрали, взять у них список документов, которые необходимо заполнять ИП при получении валюты (он стандартный) и по каждому его пункту тщательно переговорить с контролером. Заодно можно свой список 1..8 показать. Бумаги придется оформлять одни и те же в любом банке, а вот содержание этих бумаг будет зависеть от требований конкретного человека. :)

wolf:
И всё-таки позволю себе остаться при мнении, что, по крайней мере, переколдовку подсветчик старается уважать.

Ну вот ни разу не факт, что это так. Отдельная группа программеров написала код для оформления сохраненки по какому ТЗ, которое может и придумала сама. Цели повторить какие-то нюансы ранжирования ставить было бессмысленно, тем более, что нюансы могут меняться или отличаться в регионах, так же может совершенствоваться колдунщик. И что, после каждого изменения заниматься доработкой кода оформления сохраненки? А зачем? Что-то там выделяется как-то, ну и гуд. Вполне нормально смотрится.

С поиском на украинском наверняка есть сложности, т.к. во времена незалежности в обиход ввели немеряно новых слов, которые усвоили и употребляют в документах далеко не все. Потому в частотных базах будут перекосы, явно влияющие на ранжирование.

Любопытно то, что работают только конечные регионы, промежуточные (родительские) влияют слабо или никак.

G00DMAN добавил 16.09.2010 в 16:15

Сергей, а у тебя случайно не сложилось мнения, когда начались первые эксперименты по геонезависимом у нас, на реальной выдаче? В середине августа что-то уже могло считаться по новому?

wolf:
Скажем так, исходя из многочисленных наблюдений и экспериментов. Есть твердая уверенность, что это именно разные формулы.

Я твоих цифр не видел, потому пока буду считать, что формула все же одна. Хотя это вроде в данном случае не сильно принципиально, т.к. мы в итоге получаем одну и ту же конфету (релевантность) в немного разных обертках. Сильное отличие в подходах одна/много может быть только в случае, когда дробление на интервалы по некоторым факторам существенно различны. Если ты такое смог четко доказать, то гуд.

Я просто исхожу из собственного многолетнего опыта решения подобных задач (иногда более сложных, чем матрикснет) в других областях математики. И придерживаюсь мнения, что большая обучающая выборка - хорошо, а меньшая - хуже. Поэтому деление оцененного асессорами на несколько меньших кучек - это как серпом по боллзам. :)

Что касается разбиения множества регионов всего на 3 кучки, то возможно это от мощности асессоров зависит, больше кучек им пока не осилить.

wolf:
Ветвление же факторов (региональных) происходит уже внутри этих формул. Вернее, просто они имеют различное значение. Поэтому построенные на общероссийской формуле выдачи, скажем для Тулы и Орла - различны. Так вот, различия внутри формул (т.е. между теми же Тулой и Орлом) намного меньшие, чем между формулами (т.е. между Тулой и, скажем, Екатеринбургом). Это хорошо видно на тестовых коллекциях, где различия региональных факторов устремлены к нулю.

Я посмотрел только относительное ранжирование "неместных" в этих кучках регионов на небольшой выборке от балды - оно вроде идентично. Или все же иногда это не так и что-то дергается?

sealord, я wolf-а немного о другом спрашивал. Меня в данном случае интересует не ранжирование тульских в Туле, а ранжирование не тульских из разных ветвей классификатора.

wolf:
На самом деле в "Обнинске" сменилось ранжирование не просто по ГНЗ, а вообще общероссийская формула. А на основе этой формулы, кроме общероссийской выдачи, ранжируются все российские регионы, кроме Москвы (у неё отдельная формула) а также Питера, Екатеринбурга и 16 регионов релиза "Арзамас+16" (у них на всех еще одна отдельная общая формула). Волгограда среди нет, так что, получается, что он попал под релиз "Обнинск".

Очень интересное замечание, я с регионами не работаю, сам бы никогда не догадался. :)

А с чего ты решил, что разные формулы? Почему тебя не устраивает вариант с одной формулой, но с ветвлением по этому фактору на 3 ветки? А то ведь так можно и любую кусочно постоянную функцию обозвать "много формул". Или есть еще какие-то соображения?

Я бегло посмотрел - на самом деле похоже на то, что не Москва отдельно, а весь куст дерева, начиная от "Москва и область". Т.е. туда же и Одинцово, и Мытищи, и прочие. Видимо с остальными такая же фигня, весь всписок регионов разбит на слегка бОльшие кучки.

Кстати - мне показалось, что промежуточные (родительские) регионы уже не рулят, и близость с регионом по родителю ниже уровня "Россия" ничего не дает. Т.е. например в Туле московские сайты (близкие по региону "Центр") и питерские (которые гораздо дальше) ранжируются одинаково. Можешь подтвердить такое наблюдение, или я ошибся?

Всего: 1960