sokol_jack

Рейтинг
78
Регистрация
16.03.2008
Dozor:
Покажите мне синонимайзер у которого после перестановки слов в предложениях останется читабельный вариант текста. Сильно сомневаюсь в существовании такого:)

Э...

Вобщем-то я сейчас такой пишу :)

И таки остается читабельный вариант текста - поскольку строится дерево связей в предложении.

А, еще HKEY такое умеет :)

http://bajron.od.ua/bez-rubriki/svyazi-slov-po-chislu-rodu-i-padezhu.html

http://bajron.od.ua/bez-rubriki/sintaksis-universalnogo-parsera-yazyika.html

piracy:
У меня такие данные.
10 сателлитов с контентом только от xap.ru не могут попасть в индекс уже 2 месяца. А еще примерно столько же, с таким же количеством контента от ксапа, но с несколькими нормально синонимизированными статьями уже давно в индексе.
Мои выводы: сателлит с читым ксаповским контентом яндекс скорее не проиндексирует, но могут быть исключения.

Исключения у Яшки могут быть всегда и во всем.

То он на ура кушает 100% копипаст, то рукописный уник 3 месяца не ест...

В аддурилку добавляются? Попробуйте ссылочками подкормить (например, из закладок, блогов своих на бесплатных блогохостингах). Пингатор заюзайте...

<!--WEB-->:
Может и окажется, только тематика сама по себе не влияет (если сайт не из ЯК).

:)

Если бы кто-то показал результаты экспериментов... ;)

А так с одной стороны - "тематика сама по себе не влияет", с другой - фактов-то и нет.

Нет, с тем что 100 "нормальных" нетематических ссылок волне делают свое дело я не спорю - это факт. А вот не 100, а 20, но "супернормальных", которые тоже "рулят" - было бы хорошо. И автоматизировать их вылавливание :)

iolanta:
sokol_jack, да и этот сервис определяет некорректно. Например, сайт из рубрики "Аквариум" Яндекс-каталога, сервис предложил в рубрику "Животные". В общем, даже не очень и близко, учитывая, что аквариумистика - занятие намного более широкое, чем просто содержание рыб в стеклянных банках. :)

Это потому, что он не на ЯКе научен :)

Хотя вобщем-то мысль обучить такого на ЯКе и потом при выборе страниц для размещения ссылки юзать есть...

Винковский плагин "навернуть" можно - брать "тематику" урла, на который ссылка ставится будет и для каждой предложенной биржей страницы считать "% совпадения тематики"...

Вобщем, пробовать это надо :)

А то вдруг окажется, что таки 11 сылок = 10 ТИЦ :)

Мастер Йода:
гм... пример - доска объявлений slando.ru. в разделе авто объявлений идет реклама авто, разделе недвижимости - реклама недвижимости и т. д.

т.е. судя по вашей логике для сайта slando.ru модераторы яндекса отмодерировали КАЖДУЮ страницу и КАЖДОЙ странице присвоили тематику ?

Хм. Определить примерно тематику страницы для показа обьявлений вобщем-то можно и программно неплохо. Например, так:

http://keva.ru/cgi-bin/docThema?url=http%3A%2F%2Fauto.slando.ru%2F&run=++%3E%3E%3E++

http://keva.ru/cgi-bin/docThema?url=http%3A%2F%2Fnedvizhimost.slando.ru%2F&run=++%3E%3E%3E++

Только вот это просто анализ "ключей" на странице и сравнение с базой "ключей" в каждой тематике. Где хорошо совпали - значит вполне попадаем в эту тематику.

Но вот страница - это страница. А сайт (или кластер) - тут сложнее. И определять "тематичность" страницы, на которой будет стоять ссылка не так просто.

Dozor:
Дело не в синонимайзере (по функционалу и принципу работы все они похожи друг на друга), а в качестве базы синонимов.

Позволю не согласиться :)

Те, кто идет простой дорогой - просто базу синонимов готовят.

Те, кто идет правильной дорогой - наворачивают именно движок - перестановка слов в предложениях (разумная!), частотный анализ встречаемости слов... Роль качественной базы синонимов конечно никто не уменьшает :)

medea:
Не понял, можно конкретнее, о чем речь?

По версии уважаемого форумчанина, если ПС находит что-то типа div class="post" и еще несколько, то все, это почти 100% wp. И его в бан автоматом :D

Вобщем, бурные СЕО-мифы, как всегда.

ПС плевать на то, что у вас на сервере крутится. На выходе получается HTML. Вот с ним и работает ПС. Так что читайте лучше, что умные люди написали - Беобахтер например 🍻.

ПыСы. Желающим пофлудить на тему "Банят за ЦМС" сразу предлагаю купить у меня несколько CMSSimple сайтиков, которые уже больше года замечательно сидят в индексе и помогают сапе наращивать циферки ;). Очень дорого. :D

Хм. Вполне нормально измененный текст, ИМХО. И уж точно проблем с индексацией такого текста не будет.

Да и 100% неуник вполне себе индексируется.

Хм. Заказчик хочет паука, который соберет "все" домены в нете, и будет проверять их на занятость?

Какие-то критерии для перехвата все-таки есть же. Может, с этой стороны посмотреть вначале?

Толку-то особо от базы в ...ГБ доменов, из которых экспайрятся(даже не освобождаются!) в течении недели - от силы 1-2% нет.

И к тому же паук - это одна часть. А сам перехватчик (еще и для разных зон) - это уже не совсем "простенькая программа" :)

0.

Потому как штук 5-6 ссылочек с ПР6 и ПР5 сделают свое дело.

Всего: 1527