Э...
Вобщем-то я сейчас такой пишу :)
И таки остается читабельный вариант текста - поскольку строится дерево связей в предложении.
А, еще HKEY такое умеет :)
http://bajron.od.ua/bez-rubriki/svyazi-slov-po-chislu-rodu-i-padezhu.html
http://bajron.od.ua/bez-rubriki/sintaksis-universalnogo-parsera-yazyika.html
Исключения у Яшки могут быть всегда и во всем.
То он на ура кушает 100% копипаст, то рукописный уник 3 месяца не ест...
В аддурилку добавляются? Попробуйте ссылочками подкормить (например, из закладок, блогов своих на бесплатных блогохостингах). Пингатор заюзайте...
:)
Если бы кто-то показал результаты экспериментов... ;)
А так с одной стороны - "тематика сама по себе не влияет", с другой - фактов-то и нет.
Нет, с тем что 100 "нормальных" нетематических ссылок волне делают свое дело я не спорю - это факт. А вот не 100, а 20, но "супернормальных", которые тоже "рулят" - было бы хорошо. И автоматизировать их вылавливание :)
Это потому, что он не на ЯКе научен :)
Хотя вобщем-то мысль обучить такого на ЯКе и потом при выборе страниц для размещения ссылки юзать есть...
Винковский плагин "навернуть" можно - брать "тематику" урла, на который ссылка ставится будет и для каждой предложенной биржей страницы считать "% совпадения тематики"...
Вобщем, пробовать это надо :)
А то вдруг окажется, что таки 11 сылок = 10 ТИЦ :)
Хм. Определить примерно тематику страницы для показа обьявлений вобщем-то можно и программно неплохо. Например, так:
http://keva.ru/cgi-bin/docThema?url=http%3A%2F%2Fauto.slando.ru%2F&run=++%3E%3E%3E++
http://keva.ru/cgi-bin/docThema?url=http%3A%2F%2Fnedvizhimost.slando.ru%2F&run=++%3E%3E%3E++
Только вот это просто анализ "ключей" на странице и сравнение с базой "ключей" в каждой тематике. Где хорошо совпали - значит вполне попадаем в эту тематику.
Но вот страница - это страница. А сайт (или кластер) - тут сложнее. И определять "тематичность" страницы, на которой будет стоять ссылка не так просто.
Позволю не согласиться :)
Те, кто идет простой дорогой - просто базу синонимов готовят.
Те, кто идет правильной дорогой - наворачивают именно движок - перестановка слов в предложениях (разумная!), частотный анализ встречаемости слов... Роль качественной базы синонимов конечно никто не уменьшает :)
По версии уважаемого форумчанина, если ПС находит что-то типа div class="post" и еще несколько, то все, это почти 100% wp. И его в бан автоматом :D
Вобщем, бурные СЕО-мифы, как всегда.
ПС плевать на то, что у вас на сервере крутится. На выходе получается HTML. Вот с ним и работает ПС. Так что читайте лучше, что умные люди написали - Беобахтер например 🍻.
ПыСы. Желающим пофлудить на тему "Банят за ЦМС" сразу предлагаю купить у меня несколько CMSSimple сайтиков, которые уже больше года замечательно сидят в индексе и помогают сапе наращивать циферки ;). Очень дорого. :D
Хм. Вполне нормально измененный текст, ИМХО. И уж точно проблем с индексацией такого текста не будет.
Да и 100% неуник вполне себе индексируется.
Хм. Заказчик хочет паука, который соберет "все" домены в нете, и будет проверять их на занятость?
Какие-то критерии для перехвата все-таки есть же. Может, с этой стороны посмотреть вначале?
Толку-то особо от базы в ...ГБ доменов, из которых экспайрятся(даже не освобождаются!) в течении недели - от силы 1-2% нет.
И к тому же паук - это одна часть. А сам перехватчик (еще и для разных зон) - это уже не совсем "простенькая программа" :)
0.
Потому как штук 5-6 ссылочек с ПР6 и ПР5 сделают свое дело.