А кто отвечает за модерацию текстов?
Ощущение что какой-то автомат по определенному проценту тупо рубит все подряд.
Нормальные тексты за переспам отклоняют.
Попробуйте сами написать текст на 5 абзацев про сравнение талой и водопроводной воды, используя словоформы "вода" не более 10ти раз.
Зато какие-нибудь "виртуальные коллиматоры" 9 раз на ура пройдут. Как и тексты с ошибками и нечитаемые.
не те газеты читаете :)
Свист и гул во время воскресного выступления Владимира Путина в спорткомплексе «Олимпийский» стал «неслыханным унижением для человека, который, как ожидается, займет президентский пост в следующем году», пишет Financial Times.
Напомним, что российский премьер посетил бой чемпиона мира по смешанным единоборствам Федора Емельяненко с американцем Джеффом Монсоном. После победы Емельяненко Путин вышел на ринг, чтобы произнести речь. Но трибуны встретили его свистом и гулом. На записи, размещенной на Youtube, шум временами настолько силен, что почти заглушает речь премьера. Выступление Путина транслировалось в прямом эфире канала «Россия-2».
http://www.vedomosti.ru/library/news/1429659/fincial_times_nazvala_neslyhannym_unizheniemdlya_putina#ixzz1eKpYhefY
Скорее всего логика у этих людей другая. Раз все уроды и козлы - нужно мочить самых сильных, уравновешивая силы.
Да, ссылка с сателлита или дорвея может быть очень даже рабочей в момент проверки.
Но если считать что важен возраст и стабильность ссылки, это очень рискованные сайты. Они постоянно рискуют попасть под АГС, в бан, под фильтры. Ведь все равно ж любой ГС, рано или поздно будет забанен? Система не может угадать живучесть каждого конкретного ГС(например мне лень удалять заявки с этих сайтов вручную, я солью всю сеть сайтов саппорт яндекса). Хорошо бы, чтобы была возможность покупать дешево с ГС, или дорого с СДЛ.
И хотя ссылки с дорвеев и порносайтов может быть это и "самые качественные, прошедшие жёсткий отбор ссылки. Это практически «элитные» ссылки Рунета" , но я не жадный и готов заплатить больше не просто за "эффект", а за долгий и стабильный эффект))
Просто размер кода от тега до тега? Или код вычищенный от тегов, скриптов и т.п.?
А если на сайте 100 страниц с сапой "нормальные", скан книги какой-нить или энциклопедии. Зато есть еще 10.000 страниц с порно, тыщи страниц вареза, mp3, проститутки. Это хороший донор в понимании аналитиков системы?
(Отлавливать такие доноры нет большой сложности - искать яндексом гуглом определенные фразы и смотреть какой процент индекса содержит такие страницы)
зато сложно опровергнуть постоянный вой вебмастеров о том что у моего варезного сайта опять выкинули 100500 тыщ страниц из индекса, яндекс не индексирует мои порносайты и т.п.:)
Потестил фильтры. Есть замечания.
Попробовал создать стратегию в системе с самым жестким отбором:
Вайтлист самого высокого уровня (тот что с самой большой надбавкой)
Фильтр спамности тоже самый жесткий.
Выставил все галочки - адалт, форумы, доски, фотогалереи и т.п.
Посмотрел первые 10 доноров на которых что купила система по этой стратегии.
1. Половина доноров - да, с виду реальные сайты вроде.
Вторая половина - сателлиты, сайты с генеренным контентом каким-то ну или сайты явно специально созданные под сапу, контекст, размещение статей. Вторую половину я бы не думая отправил в ГБЛ, при ручной закупке.
(При менее жесткой фильтрации все еще хуже?)
2.
Поставил ограничение по тексту 500симв.
Но 1 страница вообще из трех предложений состоит. (не включая навигацию и ссылки на страницы). Меню и пагинацию получается получается не удаляет из общего размера? Глупо. Винк и то это делает. Параметр ведь "Размер текста страницы".
3.
Одна ссылка из 10ти оказалась со страницы фотогалереи. Практически пустая страница с фото.
Хотя было указано фильтровать такие страницы.
(Кстати ограничение в 500симв тоже не отсеяло ее).
4. Одну ссылку купил с сайта по скачиванию музыки бесплатно(это не варез?). Явно какой-то гс, увешанный рекламой диет бородиной, с всплывающей рекламой и порно-садо-мазо баннером.
Проверил site:порно
и site:варез:
-Жесткое протыкание возбужденной попки шикарной брюнетки
-скачать Весь софт для взлома Wi Fi точек и бесплатный доступ бесплатно
и еще тонны подобного контента.
при том что:
а)стояли галочки отсеивать "порно" и "варез"
б)это самый белый при-белый вайт лист, на который типа потратили кучу ресурсов, серверов, мозгов программистов, seo-гуру и т.п., что за него берется теперь отдельная плата.
P.S. Потестю еще на другом проекте фильтр и полезу разбираться дальше.
потерто...уже разобрался
А как в системе прогноз трафа работает?
В вортстате меньше 200 показов в месяц, в течении года не меняется.
Система показала прогноз 5000 переходов.
И так по приличной доле низкочастотки, которую загнал в систему для теста.
Есть курсы МГЛУ - Лингвистический университет. Там есть полная программа на 3 года и ускоренная за 1год.
Жене нравится.
Ходил смотреть курсы одной распиаренной компании - не понравилось: сидишь за какой-то дурацкой программой, сам обучаешься. Потом с такими же студентами общаешься на языке. Потом только с преподавателем.
частичный перевод
ApokalipsYs, чет я семинара за 40К (или сколько он там стоит). Не увидел в сети. А хотел краем глаза посмотреть хоть)