Тут сложнее, имхо, придется делать полный разбор текста. Идете по html-коду от начала до конца.
Натыкаетесь на открывающий тэг, заносите в список активных.
Натыкаетесь на закрывающий тэг, если тэг в списке активных, вычеркиваете из списка.
Натыкаетесь на слово, проверяете не находится ли оно в списке тех которые скрипт должен обрамить тэгом. Если находится, проверяете какие тэги сейчас в списке активных. Если нужного нет, обрамляете.
Проблем с кривым html-кодом будет туева хуча.
или не заморачиваться, и обрамить каждое слово по отдельности ;)
Valeriy, не все умеют искать. Не у всех есть добрый друг который найдет за них.
agent-707, я уже в ужасе от того что там "напалят".
Даже не от того что "темы" не будут работать - в большинстве случаев тема "спаленная" там работать будет. Но при этом сам спаливший не будет толком понимать отчего. И будет придумывать объяснения, рассказывать про алгоритмы ПС сказки.
Посты оцениваются по полученной пользе - и его пост будет оценен высоко. А выдуманные им слова будут сочтены общей массой как истина в последней инстанции. Как бы они не оспаривались хоть что-то знающими людьми, как же, работает значит автор точно знает о чем говорит и почему работает.
А потом произойдет небольшое изменение в алго ПС и вся свежевыдуманная теория улетит в тартарары. И автор разведет руками, а толпа найдет себе нового "гуру". Но долго будут еще гулять отголоски псевдотеории, становясь рабочим мифом для начинающих оптимизаторов.
Что собственно на форуме вот давно уже и происходит :)
ТС просто систематизирует сей процесс.
PS. ТС не старайтесь темы намного выгоднее палить не публично, а приватно, так с них можно заработать много раз и не быть закиданным помидорами когда тема обвалится.
Miracle, http://morphology.ru/
А дальше уж как удобней, если слово одно, то в ворде руками несколько замен, по одной на каждую форму.
Или пишете на PHP обращение к этому сайту, копирование словоформ в массив и уже автоматическую замену каждой словоформы в отдельности.
Вменяемого лингвистическо-вариативного выражения всех словоформ для любого слова не найдете - могуч наш родной язык.
Есть контакт! Обмен прошел без проблем на сумму ~10К Яда.
Жду предложения получше...
ИМХО добавил 03.04.2008 в 22:06
Обменял, спасибо за предложения.
Через некоторое время понадобится обменять еще 10К ЯДу, спрашивайте.
Valid, не страдайте паранойей.
В рунете десятки если не сотни миллионов внешних ссылок. Казалось бы что можно на этом фоне изменить, купив на свой проект в Sape пару сотен жалких ссылок? А позиции меняются. Почему? Потому что если брать отдельно взятую выдачу топ-10 то у тамошних сайтов внешних ссылок тоже будет в пределах сотен или тысяч. Сотни миллионов внешних ссылок распределяются по миллионам сайтов-получателей, и на каждого отдельного получателя приходится вполне небольшое число ссылок. Которое несложно увеличить в несколько раз используя биржу. Тоже будет и с закладками.
Сейчас человек тоже влияет не один. Как в вашем варианте человек будет платить школьникам-листальщикам, так сейчас он платит вебмастерам-ссылкоторговцам, которые также выполняют необходимую работу для продвижения, делая сайты под ссылки. Изменится лишь услуга необходимая для продвижения сайта.
Персональные блоги это по-вашему тоже магазины? Ссылки с форумов? Многое, многое другое? Весьма большая область интернета это самовыражение его посетителей, "покупателей" по вашему. И с развитием интернета "покупателю" надо все меньше специальных знаний чтобы оставить свое мнение в сети.
А вы предлагаете схему в которой одна часть бюджета будет тратиться на контент, а 4 части на листальщиков. Принципиальная разница лишь в том сейчас вебмастер должен иметь какие-то знания и минимальную квалификацию, чтобы его ссылка что-то значила для яндекса. Школьникам этого не понадобится.
Все поисковые системы собирают информацию о поведении пользователей. И наверняка ее используют. Просто пока для яндекса этот фактор недостаточно надежен, чтобы на нем основывать выдачу.
__SPiRiT__, вы про непрямую зависимость слышали?
Какой по вашему средний возраст домена в рунете? Добавьте к этому еще необходимое условие быть проиндексированным и бонус от естественной ссылочную массу на сайт которая копится со временем в зависимости от частоты показов в ПС.
Советую получить аналогичные числа для поисковика у которого возраст домена роли не играет. Боюсь результаты будут примерно равны яндексовым.
Хм, вы правы. Видимо "г" не является игнорируемым словом. Чтобы убедиться что игнорируемые слова есть наберите "знакомства в тюмени".
Может быть "г" используют только в очень длинных запросах? Каждый запрос в отдельности очень низкочастотен, и яндекс его в статистике не покажет, так как он не преодолел барьер в 7 минимальных показов в месяц. Но сумма всех подобных запросов и составляет обычно основную массу статистики тех запросов которые мы и считаем высокочастотными.