Metal Messiah

Metal Messiah
Рейтинг
163
Регистрация
01.08.2010
Программистъ

У меня в Яндекс.Вебмастер вылазит капча периодически, причем ввожу верно и это может закончиться еще 2-3 капчами все на той же странице.

Кроме того, в Украине после блокировки Яндекса, при работе через зарубежные прокси или VPN наблюдается еще такая лажа: кидает с *.yandex.ru на *.yandex.com, авторизация через yandex.com работает нормально, а с passport.yandex.ru при отправке данных часто возникает таймаут (похоже на блокировку запроса какими-то фильтрами на их стороне). При этом кука ставится только на *.yandex.com, а в том же Вебмастере есть абсолютные пути на webmaster.yandex.ru которые нужно копировать, менять ru на com и только после этого ссылка откроется. У них много косяков.

Думал это можно как-то хитро сделать одним вложенным запросом, просто чтобы до group был лимит...

Не, today_table не катит. У меня и так 2 таблицы: одна в которую льется огромный поток инфы, вторая в которую копируется только та которую нужно хранить, первая очищается в полночь. Кому-то нужно запрашивать за сутки, кому-то за несколько суток, кому-то за неделю.

Если id и date одно и то же, тут очевидно что лучше по индексу id, просто написал чтобы видно было что он есть.

Почему xid in () не так что бы супер запрос? У меня этих разных xid тысячи, конкретному пользователю нужны выбранные пара сотен а то и десятков.

Глобальная задача вывод статистики количества записей по каждому xid чтобы пользователь мог просмотреть вручную все записи по выбранным xid'ам на следующем шаге (а интересуют его только те где их много, в порядке убывания).

Ладно, вижу пока 2 пути. Либо попробовать цикл на php, это будет повышение нагрузки по всем запросам, но существенное снижение на этих сбойных xid по которым сотни тысяч записей, в среднем надеюсь что нагрузка снизится.

Второй путь делать таблицу today_records с количествами, обновлять их раз в час по всем тысячам xid'ов или даже лучше при добавлении записей, очищать в полночь и ориентировать пользователей исключительно по количеству за текущие сутки, а уже при детальном просмотре выводить то что запросил пользователь...

.tk / .ml / Freenom это вообще мутная контора. Они отжимают ВСЕ посещаемые сайты и ставят их на паркинг, а отжимают под надуманными предлогами и ты не докажешь что ты не верблюд. Можно, правда, съездить в Амстердам и надавать им в рыло, это единственный способ чего-то добиться.

Им зачем-то нужны ИП, возможно отмывание или легализация каких-то средств... Тут нужно бы экономистов подключить к теме они точно скажут кому и для чего это надо

Хотите сказать что показатель "Заспамленность" нужно снизить раза так в 2 в половине текстов чтобы тексты для прогона имели широкий диапазон этого параметра а не все 50%+?

Но подождите, алгоритм смотрит на тексты на сайте, а не тексты на страницах, на него ссылающихся!

Ну было дело, а что? Причем тут Германия? Если под рунет я хоть каким-то продвижением до 2014 года занимался, то по зарубежному вообще не имею понятия что и как.

Проверяли через Роскомнадзор - ограничения отсутствуют.

Нормальный хостинг катает письмецо и ждет реакции клиента, а не блокирует его сайты. Писать в службу по защите прав потребителей, роскомнадзор и еще куда-то для галочки и от всех требовать письменные ответы. Кто там у вас лицензии раздает на ведение определенных видов деятельности (хостинг) - им "к сведению". По крайней мере получишь моральное удовлетворение. Вообще UCOZ контора довольно странная, когда к ним обращаешься по поводу нарушений чего-либо одним из их клиентов они практически посылают. А вообще случай ТС мне напоминает DOT.TK - эти ублюдки отжали у меня раскрученный домен, сославшись на то что по информации их партнеров (Касперский) сайт распространяет вирусы. Понятное дело, что из переписки непосредственно с представителями ЛК выяснилось что мой домен не находится и никогда не находился в их черных списках.

P.S. Основание для блокировки бред бредом - как раз опиши, посмеемся. Хватает у вас в России рачья в органах власти и судах, мосгорсуд выносит решения не разобравшись в деле по сути, РКН блокирует сайты тоже не присматриваясь. Был даже случай совпадения названия зарубежного произведения авторского права переведенного на русский (следует читать на русское название они никаких прав не имеют) с названием произведения опубликованного на сайте, и пришла телега :) После грамотного посылания автора телеги по известному адресу сайт разблокировали. А еще часто приходят телеги от РКН со ссылкой на решение МГС касательно абсолютно других сайтов.

Текст анализировал. Про влияние ссылок и всех остальных факторов я догадываюсь.

Если текст веса не имеет, значит рядом с сео-ссылкой на целевой сайт может быть даже случайный набор тематических слов и фраз?

По поводу читают или рекомендуют - разговор отдельный, на сайтах по которым я собрался гонять (на этих страницах) кнопок поделиться нет, а метрика не на каждом установлена, к тому же в Украине заблокирована :)

Инструкции с %SITE% - дело хорошее, одни пишут что "заспамленность" должна быть низкая, ниже 30, другие что до 60 это норма, а на заборе вообще другое написано. Как я уже написал, тексты готовлю для статейных прогонов, важна внешняя ссылка с тематической страницы не тематического донора (сайты-статейники и блоги обо всем подряд).

Взял очередной текст из той же пачки (какой анализировал вчера - уже не помню). По Pr-Cy Естественность вашего текста: 93%

Всего слов: 189

Отфильтровано стоп-слов: 82

Отображено: 9 Тошнота: 2.83

На 1х позициях таблицы слова "ваш" и "сайт", общее из текста (тот самый "магазин"). Далее "скачать" это уже часть одного из ключей, предлагается сделать -1, ниже пошли слова-части ключей, везде предлагается -1 и слово которое присутствует во всех ключах -2.

Проанализировал несколько текстов целевых страниц (конкурентов) из топа - у всех количество слов выше на 1-2 чем то что должно быть по закону Ципфа. Считаю что с моим текстом в этом плане все в порядке.

Что значит текст передает мало веса? Машины не понимают смысл текста, они анализируют как раз ту же частотность или что-то в этом роде. Есть ссылка, на доноре и акцепторе тема одинакова, ключи совпадают, может быть даже есть совпадение с h1 или title.

P.S. уникальность 80 для текста на сайте - плохо, но для статейных прогонов думаю достаточно будет. После того как размноженные тексты все попадают в индекс она всегда падает.

Почему-то мне кажется что ТС интересовали не наушники, а моторные масла :)

Всего: 570