HapKOTuK, написать какой-нибудь классификатор - дело не хитрое, написать хороший классификатор - намного сложнее, потому что гораздо больше трудозатраты. Если Вы докажете качество Вашего классификатора - есть шансы кому-то его продать, оптом, или в розницу.
У меня есть уверенность, что Ваше знакомство "шапочное".
Хыыы... :D
Т.е. спам побежден окончательно? Кем же? :D
В общем случае задача безусловно не решаема. Более того - при знании текущих антиспамовых алгоритмов грамотному спамеру не составит труда их обойти с помощью значительно меньших ресурсов. Странно, почему такой очевидный факт не доступен Вашему пониманию. :)
Кстати - обратная задача аналогично имеет решение, на любой алгоритм спамера можно написать антиспам. Потому и борьба между ними фактически вечна.
По форексу во время войн первое место в спец.размещении до 50.00 доходит. Причем ни один из участников такого "аукциона" не захотел мне объяснить смысла этой цены. :)
На форексе все же рулят продвинутые в компьютерах и интернетах люди, а в окнах - строители. Потому должна быть разница. К тому же среди крупных игроков на рынке валютного дилинга в сео понимает только один из. Остальные разбираются существенно слабее, хотя лучше оконных.
Ну так это и делается, только не все так просто, как Вы думаете. :)
Да, причем текущая ситуация стимулирует веб-заводы выдавать ГС для продажи ссылок сотнями в день.
Не только в обработке и хранении информации дело. Не контролируемая несколько лет сео-отрасль увеличила ссылочную массу в рунете минимум в три раза, заодно автоматизировав проверку всей этой массы говноссылок на индексацию после каждого апдейта. Сео-запросы забирают до 30% ресурсов Яндекса, кому из яндексоидов это понравится? :)
Это Вам так кажется, потому что опыта борьбы с текстовым спамом нет. На самом деле все гораздо сложнее, поисковики применяют достаточно навороченные технологии, но окончательно победить не смогут еще много лет. Те же дорвейщики успешно обходят алгоритмы всех поисковиков, спам-технологии развиваются параллельно с антиспамом. :)
Спасибо, но я искал че-нить более манерное... :)
Вот я, как припершийся недавно в науку из-за угла, с этим уже столкнулся. Публикации в трудах РОМИП не особо катят, так как у сборников даже ISDN нет. Поэтому сейчас приходится активно договариваться с людьми из ВАКовских журналов. За разумное бабло я вопрос не смог порешать, придется в каждую статью брать лоббистов соавторами. :)
Не только. В фундаментальной математике мехмат МГУ всегда был в числе знаковых источников настоящей науки.
Не так это просто, кстати. И при жестких реформах сопротивление академического болота будет огромным, со статьями в прессе, передачами на ТВ и прочей желтухой.
Почему безнадега? Вариант 2 в Вашем посте вполне рулит. Если ученый хочет и может двигать науку - он будет двигать, параллельно озадачиваясь грантами и ИЦ.
Формальных критериев для объективной оценки нет. Объективно оценить могут коллеги, но только по-тихому, между собой. Да и то далеко не всегда они объективны. :)
Дык дело не в аферистах - большинство дает псевдовыхлоп. Красивый для грантодателя, но беспонтовый, или почти.
Давно пора. :)
Я попробую, со своей колокольни.
В целом я более-менее согласен с автором.
Это типа как Перельман. Хреновый путь, т.к. по нему идут многие, а удача приходит к единицам. Остальные всю жизнь нищебродят... :(
С этим не согласен. Автор букв видимо еще молод, поэтому слишком категоричен, "или-или". На самом деле способный ученый (а тем более молодой, т.е. немеряно энергичный) вполне может совмещать текущие правила игры, сложившиеся в мировой фундаментальной науке с реальной научной работой. Да, это геморно, а что делать. Так поступают многие сильные ученые, потому что другого пути нет.
Другое дело, что современная фундаментальная наука стимулирует именно имитацию, поэтому настоящих ученых получается маловато. Главное - ИЦ, наукообразие, многабукаф и умение выбить гранты. :(
Можно не ходить в физику "курчатовских дыр", а просто посмотреть на мировую поисковую науку, тематичную данному форуму. Если с инженерной точки зрения все развивается достаточно прилично - хранение данных, быстые индексы, архитектура поиска, машинное обучение, то в фундаментальной части - все гораздо печальнее. В линковой составляющей ранжирования все болтается вокруг идей Брина и Пэйджа середины 90-х, в текстовой - вокруг вероятностных моделей из 80-х. Т.е. на самом деле конечно все как бы не так - имитаторы пишут зачетно, выходят кучи статей и выдается много солидных грантов, формулы новые появляются сложно-математические, слова умные льются потоком. Ну так иначе бы не давали грантов. :)
Достаточно вдумчиво почитать статьи на TREC - везде идеология поиска из прошлого тысячелетия, никакого креатива.
Если брать нашу фундаментальную науку и РАН - ну вот в РОМИПе ежегодно участвует коллектив от ИСА РАН и ни разу не был в лидерах. Ну и зачем он нужен? К РАН я скептически отношусь, финансировать эту структуру в текущем виде особо не стоит.
Писателей из Яндекса на серче почти нет, некому тут писать и не о чем. :)
Не, Вы не поняли, синонимизация захламляет не топ выдачи, а индекс. Яндекс в ру-индексе с этим еще как-то пытается бороться, а гугл походу просто не понимает, что он индексирует кучу хлама.