да есть уже такие системы, баян и фигня. Сначала разделяешь на предложения, потом смотришь по скоплению предложений. Плюс-минус работает, дальше можно даже не запариваться. Тут просто сам подход ацтой - тырить plain-текст нецелесообразно. Мыслите ширше.
блин. вменить бы каждому подключающемуся к интернету читать "компьютерные сети для чайников".. читаешь, вроде раздел дорвейщиков - люди должны знать, что говорят ) ну ладно, стандартный цирк это понятно, куда без этого, но серверный олсабмиттер - это такая каша ляпов, что даже ощущение красивого появляется - как лаконично ТС уложился в два слова 😂
я сказал одинаковый?
паливо, говорите? если тот товарищ упертый, не оставь вы возможности для связи, возможно уже смотрели бы на заблоченный фтп, а так есть возможность убить интересующие его кеи и оставить целой основную массу страниц.
блаблабла. С заверенным содержимым сайта, без которого, в общем-то, немыслимы разборы подобных ситуаций, твой "нормальный адвокат" сольет.
На самом деле нет причины парсить все фамилии - просто оставляй реально рабочие контакты на дорах (хотя бы хуиз). По-любому первым пойдет предупреждение, после чего берешь и убираешь конкретно взятую фамилию.
1. Такие вещи за пару дней не пишутся. факт.
2. Если нет возможности отдать под инвестиции пару суток человеко-часов, не совсем ясно, а есть ли вообще что терять.
я говорю отчасти о том, о чем говорил wmz - о том, что для дорвеев это все нецелесообразно.
если платон щукин начнет смотреть каждый сайт, его порвет.
еще раз: возьмите не мир (что сложнее), а описание сущности (суть каталог). Ты станешь отрицать, что в топе яши полно перепертых каталогов? Ну там плюс-минус какие-то общие слова в описании.
В принципе если сделать хорошо (я говорил про границу с белым сео), т.е. не оставить голую страницу с табличными данными, поменяв слово-два, то это даже как МФА не будет квалифицированно. Еще раз подчеркиваю - проблема в грамотном оприходовании контента, но получить груду уникального контента из одних и тех же сущностей - это не то чтобы реальная теоретическая задача, это уже реализовано на практике как зарубежными, так и нашими мастерами.
Я щас смотрю хистори, не нашел пока урл, дело было еще зимой. Если найду - скину.
а вы таки пробовали? предвосхищая ответ скажу, что если нормально озадачиться, то текст того же каталожного описания получается на порядки лучше того, что пишут увлекшиеся работой с плотностью копирайтеры.
Главный момент - быть реально готовым все это оприходовать. Скажем так, если у вас обычный лезвиевский дорген (ничего личного, просто как пример), со стандартными шаблонами, вы тупо просрете весь контент, и смысла запариваться реально не будет. Тут уже граница с белым оптимизаторством становится слаборазличимой.
где-то у меня даже валялся линк на урл одного пиндосского товарища, снимающего с гугла автотраф по каталогу, построенному по этой системе. У нас есть аналоги, возможно превосходящие пиндосский вариант, о котором я говорю, но они пока не очень удачны, хотя проблема не в системе как таковой. Проблема именно в оприходовании контента. Короче, пока не сделаешь, не поймешь.
ну, общий принцип я сам указал, просто подумал может просмакуюешь интересные детали.
кстати, схожим образом классно оформлять описания к каталогам сущностей - это реально рабочее направление.
нашел, но букф много - нереально в пятницу вечером читать. дашь краткую выдержку за симпу? :)