Напугали, я уже думал тема про группу быстрого реагирования :)
Эх...до боли знакомая тема.
На самом деле спонсор спонсору рознь, если хватит денег на TV, то шансы есть, остальное от лукавого. У моей группы был спонсор - строительная фирма. Хватило спонсорства на аппаратуру, запись на студии, ротацию на некоторых региональных FM-станциях. Теперь я в SEO - более перспективно, хотя музыкой все еще балуюсь:
http://www.abilogic.com/music/mp3/epilz_muskatny_oreh/epilz_goroda.mp3
http://www.abilogic.com/music/mp3/epilz_muskatny_oreh/epilz_drugie.mp3
http://www.abilogic.com/music/mp3/epilz_muskatny_oreh/epilz_zhdat_zvonka.mp3
Этот способ не у всех хостеров работает при вызове скрипта через cron, а так все правильно.
Еще, как вариант, есть надежный способ использования относительных путей:
include(dirname(__FILE__).'/inc.shtml');
Ну и не забываем, что если нам не нужен результат подключаемого скрипта, испозьзуем директивы require или require_once 🚬
На здоровье - Extended StatusBar:
https://addons.mozilla.org/firefox/1433/
Если можно, сайт в личку. Погоняю :)
Полностью согласен, для online сервиса, это необходимо. Похоже придется написать полноценный сервис для демонстрации работы скрипта :)
Я же не знаю их алгоритм извлечения контента. У меня анализируется только контент заключенный между тегами <body>...</body> (есть вариант анализа всей страницы с title и мета-тегами). Может у них не анализируется содержимое alt, может не включается noindex-контент. Так что тут речь не про неправильность работы скрипта, а про идентичность анализируемого материала.
Я не увидел там фраз, только слова... К тому же там в список включены все стоп-слова, что не есть правильно...
Что непонятного? :)
Берем текст (html-исходник, URL) и получаем список фразы, наиболее характеризующие этот текст. Далее эти фразы можно употреблять как душе угодно, хоть title из них составляй, хоть keywords.
А ссылка, которую я дал - это лишь пример сервиса, построенного на моем скрипте.
Можно вместо текста в textarea ввести URL, начинающийся с http://