Хм, а меня начинает напрягать бот Mail.ru. Во-первых, очень активно парсит в самый разгар рабочего дня, когда и без него нагрузка хорошая. Во-вторых, криво выдирает ссылки из javascript. К примеру, есть защита e-mail от спамерских пауков
<script type="text/javascript"> <!-- var mailto = 'info' + '@' + 'site.ru'; document.write('<a href="mailto:'+mailto>e-mail</a>'); --> </script>
Бот с каждой страницы с таким кодом пытается зайти на адрес_страницы'+mt+'
Как его отучить?😕
SeaBreeze, /ru/forum/159175
Любопытно, можно название дата-центра (в личку)?
Не понял. В моем коде $lcase и $ucase - количество букв в нижнем и верхнем регистре, если букв в верхнем регистре больше чем букв в нижнем, значит непорядок.
Обсуждать абстрактные вещи тяжело, поэтому накидал простенькую функцию, которая возвращает для блондинок специальное сообщение
function blond ($text) { $lcase = 0; $ucase = 0; if (preg_match_all("#([a-zа-я]{1})#", $text, $match)) { $lcase = count($match[0]); } if (preg_match_all("#([A-ZА-Я]{1})#", $text, $match)) { $ucase = count($match[0]); } if ($ucase > $lcase) { return "Сделайте глубокий вдох, медленно выдохните, аккуратно отключите клавишу CAPS LOCK, отпустите клавишу SHIFT и напишите сообщение без чрезмерного использования ЗАГЛАВНЫХ БУКВ."; } else { return ; } }
Что тут можно радикально улучшить, сделать производительнее?
Это нормальная ситуация. ТИЦ считается для сайта в целом, ПР для каждой страницы по отдельности.
УК РФ 🙅
Мне не нужно заменять буквы, мне нужно только определить в каком они регистре :)
В определении "блондинки", т.е. регистра текста (в целом).
Очень конкретный совет :)
Возможно, я нечетко сформулировал вопрос, ещё раз, есть лучший способ определения регистра текста (букв какого регистра в тексте больше) в JavaScript и PHP, чем посимвольный перебор?
Русский язык настолько велик и могуч, что всегда можно подобрать свободное звучное нецензурное слово. Поэтому даже под проект ценность домена сомнительна.
Разве что для сайта конкурента :D