Я не совсем понял такой момент. Если в одном списке ссылок находятся ссылки на разные сайты, это нормально? (И как связано с заполнением общего для задания поля сайта фида, и как к этому относятся пингуемые серверы?)
Разместился - было выполнено мгновенно и качественно. Площадка нравится.
Вот потому и просил агрументы. У меня ни одной мысли, чем это может быть лучше, чем на одном домене (на котором по кр мере все внешние ссылки суммируются в одном месте).
Я чувствую себя самым тупым в этом сборе слов - почему-то никто не задает вопросы о проблеме, которую реально не могу решить: эффективный отсев слов. У меня при любых начальных данных все время получаются портянки из многих тысяч и десятков тысяч слов. И приспособиться эффективно отсеять ненужное, а потом отобрать более ценное никак не могу - уходит уйма времени, а результаты все равно не очень.
Может быть авторы или продвинутые пользователи поделятся советами из серии "бест практис", как это лучше делать? И хорошие формулы оценки (хоть в приват, если это ноу-хау)...
И еще, раньше предлагалось похожее нововведение, но сейчас как-то затихло, а мне кажется оно было бы актуальным - иерархическая сортировка слов. (потому что сходные слова оказываются разбросаны по всему объему). Алгоритм мог бы быть примерно такой:
1. Берем однословные ключи (по возможности в исходной грамм.форме). Под такое слово первого уровня добавляем:
2а. Другие словоформы, если есть транслиты и т.п.
2б. Двухсловные ключи, содержащие исходное слово. При этом из двухсловников, различающихся словоформами и порядком слов, выбирается основной один, а остальные - записываются в третий уровень под этот основной двухсловник.
Если двухсловный ключ можно подписать под два однословных, то выбирается "более ценный" однословник (в смысле какой-то частотности и т.п.).
И так далее по всем уровням.
Вместо определения исходной грамматической формы можно использовать просто какую-то из частотностей.
В результате получится структурированный список, в котором, с одной стороны, будет значительно удобнее отбирать слова из близких аналогов (теперь уже стоящих рядом), а главное - получится прототип структуры сайта с иерархией ключей-разделов.
Зарегился Mike05 - вроде еще попадаю в акцию?
Я обычно в крон пишу такую двойную команду:
cd /home/путь к дир.скрипта/ ; /usr/local/bin/php скрипт.php
Вы, видимо, просто неправильно задали исходную папку для сканирования в строке:
$dirfrom='../'; // путь к верхней дир. начала сканирования от места скрипта
Можно положить куда угодно, задать путь к верхней папке, начиная с которой он будет сканировать все внутри нее (кроме вписанных в скрипт исключений).
Статистику вебмастера посмотреть не получится, поскольку сайт как раз конкурентов. :)
А соломоно, как и пр-си, дают странноватые результаты (тестил уже на своем сайте, по которому как раз мало общего с реальностью они показывают).
Сервис может быть полезным. Особенно если найдется достаточно адекватных комментаторов недорого. :) (может предлагать старшеклассникам?:)).
Обязательно надо прикрутить пакетный ввод заданий (урл/кол-во/ключи), цены-объемы можно общей настройкой или даже добавлять в эти записи ввода не проблема. Но без этого вручную замучаешься добавлять каждую страницу. Ну и какой-то рейтинг комментаторов (и возможность ограничения минимального для себя).
Еще полезно было бы добавить в скрипт интеграцию с естественными комментами, т.е. вывод формы и возможность работы с естественными комментами на общих основаниях. Это прибыли не даст, но пользователям удобство.
Все непонятно:
а) урлы, с которых пришли писать в файл? Так это-то легко, но я хотел в аналитикс чтоб это было (всякие цепочки и т.п. смотреть).
б) Вот чую, что это то, что мне надо, но не знаю, что такое ББС, и как это сделать? (сейчас в php написано хедер локейшен и адрес, а что должно быть?)