pervius

pervius
Рейтинг
68
Регистрация
17.07.2007
Kost:
Так не бывает. Если у кого-то идут вверх, значит у кого-то идут вниз.

А я и не говорил, что у всех должны идти вверх.

Я сказал лично про свои проекты.

В период апрель-май все позиции только вверх идут.

Подобных проблем пока не замечал.

Если возможно, то урлы в личку киньте.

Улыбнуло))

скорее всего глюк

так же не работает сохраненная копия.

яшу сейчас глючит по полной и каждый день, видать подкручивают всякие фичи после запуска магадана

newseoo:
Не нужно создавать эти темы!
Сейчас апы будут каждый день, а то есть это вообще продолжение апа 9 мая.... сначала почитайте последние темы, а потом думайте стоит ли создавать тупые темы

Ну тогда уж продолжение апа 6 мая, а не 9-го, потому как выдача уже тогда была похожа на текущую.

Смотря какого результата вы хотите добиться.

Если просто разместить статью и чтобы она не склеилась с источником, то достаточно будет разместить на этой странице дополнительный блок текста, а лучше несколько блоков.

Объем этих блоков должен быть не менее 25-30% объема статьи.

А если же хотите, чтобы статья претендовала на оригинальность, то проще статью переписать, т.к. если будете даже изменять статью, то статья все равно определится как нечеткий дубликат.

cymax:
Корпус и коллекция - это одно и то же, т.е. синонимы См., например, здесь http://en.wikipedia.org/wiki/TFIDF
Цитата:
The tf–idf weight (term frequency–inverse document frequency) is a weight often used in information retrieval and text mining. This weight is a statistical measure used to evaluate how important a word is to a document in a collection or corpus.

В википедии сказано, что вес - статистическая мера, используемая, чтобы оценить, насколько важно слово к документу в коллекции или корпусе.

Все таки коллекция и корпус здесь рассматриваются ни как синонимы, а как разные вещи.

cymax:
pervius, корпус - это не индексная база, он значительно меньше по размеру. Что касается пересчета, то изменение корпуса (дополнение, сокращение, изменение состава документов) влечет за собой пересчет idf. Это и имел в виду Константин, говоря о пересчете корпуса.

да, вы правы...ошибся

индексная база - это коллекция

Каширин:
Корпус пересчитывают произвольно, а не по мере добавления новых документов в индекс.

Константин, что вы имеете ввиду под произвольным пересчетом?

И на сколько я понимаю, корпус (текстовый корпус) - это множество текстов (в данном случае индексная база Яндекса), на основе которых уже производится расчет и перерасчет различных показателей и коэффициентов (в нашем случае мы рассматриваем idf) для каждого слова и словосочетания. Как же тогда можно пересчитать корпус, его можно изменить (дополнить или сократить), но никак не пересчитать.

В принципе логичным было бы предположить, что с ростом индексной базы Яндекса, что приводит к смещению относительных и количественных показателей каждого слова (статистика слов) и увеличению корпуса и учитывая темпы развития интернета в стране, то пересчет пересчеты idf придется делать все чаще и чаще или применять инные алгоритмы.

hero:
а вообще же раньше вроде чаще пересчитывались или разВполгода это стандартно?

Ну так у MiRajа данные собраны за 29.11.2007, с этого момента прошло 4-е месяца.

Коллекция с того момента изменялась уже 2-а раза, на сколько я помню.

Вот изменялся ли вес с того 29.11.2007 еще раз, к сожалению, не могу сказать...по моему менялся один раз.

Поздравляю, закрыли !about — 53 327, !author — 58 76

Теперь просто в title yandexa видно: нашлось НН-ое количество страниц

Всего: 192