Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science
Только если вы не участник Я.Новости

Да, для серьезных новостных изданий Я.Новости могут дать несколько тысяч хостов в день. На ровном месте.

Так что имеет смысл туда попасть :)

но чтобы все отражалось у меян в виде моего собственного посиковика... т.е. чтоыб все было уже ен с яндекса а с моего сайта

Сколько на сайте страниц и каков общий объем текста (примерно, в Мб)?

Антон, тут Рамблер начал уже по-украински искать. Я по этому радостному поводу даже их пресс-релиз у себя выложил.

Не могу перейти на 2ю страницу результатов поиска - выбрасывает на дефолтный пример (яндекс).

Какой запрос и версия броузера?

Fitis, ну и причем же здесь поисковые технологии? Переношу топик в 'Вопросы для новичков'.

Извините, а когда в поиске будет поиск по автору? Очень хотелось бы поскорее

Andryuha, я давно обещал выпустить новую версию с поиском по автору, но пока, к сожалению, абсолютно нет времени - загружен сразу несколькими проектами. Надеюсь, в ближайшее время все-таки удастся ее добить.

сделали файл с раширением .xml однако через браузер показывается билиберда, программист говорит, что проблемма в индивидуальном теге Яндекса: <yandex:full-text> он мол не является стандартным для RSS, в этом ли может быть проблемма?

Расширение никакой роли не играет.

Просто первая строка должна быть Content-type: text/xml\n\n, а не Content-type: text/html\n\n.

Кстати, мы на

Подробностях тоже открыли RSS-экспорт , кому интересно.

Vyacheslav Tikhonov, тогда бы уж grep советовал, чего уж там мелочиться-то

Человек просил скрипт, значит он по крайней мере должен знать, как его использовать. По крайней мере теоретически :)

Или может скрипт кто-нибудь подкинет, вроде несложный скрипт должен быть...

Мда... масштабы задачки просто впечатляют. :)


#!/usr/bin/perl

while (<>)
{
~s/\n|\r//g;
~s/^\s+|\s+$//;
$unique{$_}++;
}

foreach $phrase (sort {$unique{$b} <=> $unique{$a}} keys %unique)
{
$counter++;
print "$counter $phrase $unique{$phrase}\n";
}

Теперь можно сохранить этот скрипт, например, как unique.pl и прогонять через него свои файлы с фразами:

./unique.pl phrase.log > unique.log

В результате в unique.log будет:

номер_фразы фраза частота_фразы

Где можно найти список самых популярных кейвордов в рунете?

Ну до чего ж ленивый народ. :)

Всего: 847