ИМХО

ИМХО
Рейтинг
42
Регистрация
05.01.2008
Miracle:
Ребята, реализовую подобное на пхп., но столкнулся с проблемой, если в тексте уже есть тег <b> смысл ставить еще один, как обойти не знаю

Тут сложнее, имхо, придется делать полный разбор текста. Идете по html-коду от начала до конца.

Натыкаетесь на открывающий тэг, заносите в список активных.

Натыкаетесь на закрывающий тэг, если тэг в списке активных, вычеркиваете из списка.

Натыкаетесь на слово, проверяете не находится ли оно в списке тех которые скрипт должен обрамить тэгом. Если находится, проверяете какие тэги сейчас в списке активных. Если нужного нет, обрамляете.

Проблем с кривым html-кодом будет туева хуча.

Miracle:
разбивать на кол-во слов и делать разные варианты

или не заморачиваться, и обрамить каждое слово по отдельности ;)

Valeriy, не все умеют искать. Не у всех есть добрый друг который найдет за них.

agent-707, я уже в ужасе от того что там "напалят".

Даже не от того что "темы" не будут работать - в большинстве случаев тема "спаленная" там работать будет. Но при этом сам спаливший не будет толком понимать отчего. И будет придумывать объяснения, рассказывать про алгоритмы ПС сказки.

Посты оцениваются по полученной пользе - и его пост будет оценен высоко. А выдуманные им слова будут сочтены общей массой как истина в последней инстанции. Как бы они не оспаривались хоть что-то знающими людьми, как же, работает значит автор точно знает о чем говорит и почему работает.

А потом произойдет небольшое изменение в алго ПС и вся свежевыдуманная теория улетит в тартарары. И автор разведет руками, а толпа найдет себе нового "гуру". Но долго будут еще гулять отголоски псевдотеории, становясь рабочим мифом для начинающих оптимизаторов.

Что собственно на форуме вот давно уже и происходит :)

ТС просто систематизирует сей процесс.

PS. ТС не старайтесь темы намного выгоднее палить не публично, а приватно, так с них можно заработать много раз и не быть закиданным помидорами когда тема обвалится.

Miracle, http://morphology.ru/

А дальше уж как удобней, если слово одно, то в ворде руками несколько замен, по одной на каждую форму.

Или пишете на PHP обращение к этому сайту, копирование словоформ в массив и уже автоматическую замену каждой словоформы в отдельности.

Вменяемого лингвистическо-вариативного выражения всех словоформ для любого слова не найдете - могуч наш родной язык.

Есть контакт! Обмен прошел без проблем на сумму ~10К Яда.

Жду предложения получше...

ИМХО добавил 03.04.2008 в 22:06

Обменял, спасибо за предложения.

Через некоторое время понадобится обменять еще 10К ЯДу, спрашивайте.

Valid, не страдайте паранойей.

_Chaser_:
Я и не говорил что алгоритмы будут простыми, но уж не сложнее существующих, когда один человек реально может повлиять на выдачу сайта, а сто школьников... даже без фильтров, на фоне миллионов пользователей.

В рунете десятки если не сотни миллионов внешних ссылок. Казалось бы что можно на этом фоне изменить, купив на свой проект в Sape пару сотен жалких ссылок? А позиции меняются. Почему? Потому что если брать отдельно взятую выдачу топ-10 то у тамошних сайтов внешних ссылок тоже будет в пределах сотен или тысяч. Сотни миллионов внешних ссылок распределяются по миллионам сайтов-получателей, и на каждого отдельного получателя приходится вполне небольшое число ссылок. Которое несложно увеличить в несколько раз используя биржу. Тоже будет и с закладками.

Сейчас человек тоже влияет не один. Как в вашем варианте человек будет платить школьникам-листальщикам, так сейчас он платит вебмастерам-ссылкоторговцам, которые также выполняют необходимую работу для продвижения, делая сайты под ссылки. Изменится лишь услуга необходимая для продвижения сайта.

_Chaser_:
И еще. По нынешней схеме, если сравнивать сайт с магазином, а пользователя с покупателем, за магазин голосуют другие магазины, получается что даже при честной игре объективной картины со стороны "покупателя" не получится, а выдача то формируется для него, но он на нее, практически повлиять не может :(.

Персональные блоги это по-вашему тоже магазины? Ссылки с форумов? Многое, многое другое? Весьма большая область интернета это самовыражение его посетителей, "покупателей" по вашему. И с развитием интернета "покупателю" надо все меньше специальных знаний чтобы оставить свое мнение в сети.

_Chaser_:
Настоящая схема, при которой, утрировано, оптимизатору, чтобы продвинуть сайт нужно потратить 1 часть бюджета на контент, а 4 части (!) на ссылки, а поисковой системе включить кучу костылей, чтобы эту схему задавить (и при этом в топку улетают и хорошие сайты), мне кажется долго не проживет.

А вы предлагаете схему в которой одна часть бюджета будет тратиться на контент, а 4 части на листальщиков. Принципиальная разница лишь в том сейчас вебмастер должен иметь какие-то знания и минимальную квалификацию, чтобы его ссылка что-то значила для яндекса. Школьникам этого не понадобится.

_Chaser_:
Может быть, имея на руках кучу механизмов слежения за пользователем - тулбар, гугл аналитикс, десктоп сёрч, гугл уже использует эти данные. Сужу по выдаче 3 молодых сайтов с хорошим, уникальным контентом и которые никак не раскручивал и 1 одним "плохим" - на фоне Яндекса, который подозрительно относится ко всем четверым (ну и кому от этого лучше?) разница очевидна, но возможно, здесь другое.

Все поисковые системы собирают информацию о поведении пользователей. И наверняка ее используют. Просто пока для яндекса этот фактор недостаточно надежен, чтобы на нем основывать выдачу.

__SPiRiT__, вы про непрямую зависимость слышали?

Какой по вашему средний возраст домена в рунете? Добавьте к этому еще необходимое условие быть проиндексированным и бонус от естественной ссылочную массу на сайт которая копится со временем в зависимости от частоты показов в ПС.

Советую получить аналогичные числа для поисковика у которого возраст домена роли не играет. Боюсь результаты будут примерно равны яндексовым.

0verdrive:
ИМХО, спасибо. Логика предоставления запросов Яндекса, мне, в принципе, понятна. Но есть некоторые спорные моменты:

Если брать по яндексу, то количество показов по запросу "знакомства" с буквой г, и без неё, очень сильно отличается:
знакомства тюмень - 4590
знакомства г тюмень - 223
Видно, что второй ключевик - это явно не сумма всех словоформ от "знакомство тюмень", иначе число показов по нему было бы гораздо больше.

Хм, вы правы. Видимо "г" не является игнорируемым словом. Чтобы убедиться что игнорируемые слова есть наберите "знакомства в тюмени".

Может быть "г" используют только в очень длинных запросах? Каждый запрос в отдельности очень низкочастотен, и яндекс его в статистике не покажет, так как он не преодолел барьер в 7 минимальных показов в месяц. Но сумма всех подобных запросов и составляет обычно основную массу статистики тех запросов которые мы и считаем высокочастотными.

Всего: 468