Можно попробовать, это идея. ☝
p.s. Хотя с другой стороны, а не добавит ли он ТДС в бан?
Не знаю как он определяет, но фрихи очень лихо залетают в бан. Добавлял *.nichost.ru, даже через короткий урл не добавляет, на сервере видно как бот их приходит чекать. 😒
Он тебе напишет при отправке сообщения.
Так всё-таки. вы считаете, что заинтересовывать рекламой посетителя, должен не рекламодатель, а вебмастер?
Разница в транзакциях, которые проходят через ещё одни волосатые руки.
😮 Что оптимизировать?
P.S. Инструмент даёт посредник.
Разве этим должен заниматься не рекламодатель?
Слушай вот что в голову пришло, кодировка в пределах одной html страницы, то будет тоже одна, почему бы просто не прочитать мета тег кодировки страницы?
Если честно, то нет сейчас ни какого желания изобретать велосипед(только проснулся, да ещё и вечер пятницы надо отдохнуть), если потом будет желание и будет не поздно ещё, то обмозгую.
Ну насчёт кодировки это извечная проблема. Криво работает детекст в php... Но в данном случае, насчёт этого не стоит заморачиваться, т.к текст будет браться из файла, а кодировку файла указываешь уже ты. Т.ч весь текст там будет одной кодировки. Можешь сделать чекбок, добавляющий/убирающий модификтор "u", если он тебя смущает :)
Если ты ссылаешься на мою регулярку, то там это учтено. Естественно она далека от идеала, и в этом я признался честно. Это не защита от дураков и не полноценный текстовый процессор 😂.
[A-Z][a-z]{0,19} - Указывает, что первым будет идти слово из 1-19 букв первая должна быть большой(что указывает на начало предложения)
(?: |,?){1,3} - Дальше, указанно, что должны идти от 1 до 3 пробела или запятых(тут хочу отметить, что я сделал от 1 до 3 потому, что отсекалось много текста, в котором было больше одного пробела вподряд, это можно профиксить, предварительно пройдясь по тексту функцией автозамены "сдвоенных символов", то есть заменит идущие в подряд две запятые на одну, пробельные символы на один и т.д).
(?:[A-z]{1,20}(?: |,|-){1,3}){4,60} Это основная часть, указывающая, что будет браться от 4 до 60 слов, длиной от 1 до 20 букв любого регистра, слова могут иметь такие разделители (?: |,|-){1,3} - тут можно дописывать, например ":" т.д... Я не стал заморачиваться, т.к. контент мне не жалко, собираю не я а программа, пусть режется то, что не подходит 😂
[A-z]{2,20}(?:\.|\?|!) Ну а это уже окончание, которое означает, что перед закрывающим предложение символом(точкой, вопросом, или восклицательным знаком) должно идти слово длиной от 2х до 20ти символов в любом регистре.
Тут конечно можно было, дописать и по умнее, например, учесть сокращения "и т.д." внутри и в конце текста, исключить возможность писать слово "полностью большими буквами", различить дефис от тире, нормализовав отображение слов через тире. Но задача была написать скрипт быстро, чтобы не потратить на его написание столько же времени сколько на чистку в полуавтоматическом режими. Да, я ленивый! 😂