Mike05

Рейтинг
91
Регистрация
10.06.2009

Я не совсем понял такой момент. Если в одном списке ссылок находятся ссылки на разные сайты, это нормально? (И как связано с заполнением общего для задания поля сайта фида, и как к этому относятся пингуемые серверы?)

Разместился - было выполнено мгновенно и качественно. Площадка нравится.

gvv3:
На больших сайтах лучше так:

сайт.ком - англ
сайт.ру - рус

Вот потому и просил агрументы. У меня ни одной мысли, чем это может быть лучше, чем на одном домене (на котором по кр мере все внешние ссылки суммируются в одном месте).

Я чувствую себя самым тупым в этом сборе слов - почему-то никто не задает вопросы о проблеме, которую реально не могу решить: эффективный отсев слов. У меня при любых начальных данных все время получаются портянки из многих тысяч и десятков тысяч слов. И приспособиться эффективно отсеять ненужное, а потом отобрать более ценное никак не могу - уходит уйма времени, а результаты все равно не очень.

Может быть авторы или продвинутые пользователи поделятся советами из серии "бест практис", как это лучше делать? И хорошие формулы оценки (хоть в приват, если это ноу-хау)...

И еще, раньше предлагалось похожее нововведение, но сейчас как-то затихло, а мне кажется оно было бы актуальным - иерархическая сортировка слов. (потому что сходные слова оказываются разбросаны по всему объему). Алгоритм мог бы быть примерно такой:

1. Берем однословные ключи (по возможности в исходной грамм.форме). Под такое слово первого уровня добавляем:

2а. Другие словоформы, если есть транслиты и т.п.

2б. Двухсловные ключи, содержащие исходное слово. При этом из двухсловников, различающихся словоформами и порядком слов, выбирается основной один, а остальные - записываются в третий уровень под этот основной двухсловник.

Если двухсловный ключ можно подписать под два однословных, то выбирается "более ценный" однословник (в смысле какой-то частотности и т.п.).

И так далее по всем уровням.

Вместо определения исходной грамматической формы можно использовать просто какую-то из частотностей.

В результате получится структурированный список, в котором, с одной стороны, будет значительно удобнее отбирать слова из близких аналогов (теперь уже стоящих рядом), а главное - получится прототип структуры сайта с иерархией ключей-разделов.

Зарегился Mike05 - вроде еще попадаю в акцию?

vtomas:
путь указан верно, проверяет согласно указанного пути, но chfiles.tmk и chfiles.log кладет в корень пользователя, а не в свою папку, видимо косяк кроется в вызове крона и не понимании им (абсолютные\относительные) пути в скрипте.

Я обычно в крон пишу такую двойную команду:

cd /home/путь к дир.скрипта/ ; /usr/local/bin/php скрипт.php

vtomas:
в моем случае речь не о сайте, а целиком vps, сканит он правильно, но вот пишет свои результаты не к себе в папку, а в корень vps.

Вы, видимо, просто неправильно задали исходную папку для сканирования в строке:

$dirfrom='../'; // путь к верхней дир. начала сканирования от места скрипта

FaniKaplan:
Скрипт нужно в каждую папку сайта пихать и настраивать или можно в корень положить и он будет отчет сразу по всей сотне доменов создавать?

Можно положить куда угодно, задать путь к верхней папке, начиная с которой он будет сканировать все внутри нее (кроме вписанных в скрипт исключений).

Статистику вебмастера посмотреть не получится, поскольку сайт как раз конкурентов. :)

А соломоно, как и пр-си, дают странноватые результаты (тестил уже на своем сайте, по которому как раз мало общего с реальностью они показывают).

Сервис может быть полезным. Особенно если найдется достаточно адекватных комментаторов недорого. :) (может предлагать старшеклассникам?:)).

Обязательно надо прикрутить пакетный ввод заданий (урл/кол-во/ключи), цены-объемы можно общей настройкой или даже добавлять в эти записи ввода не проблема. Но без этого вручную замучаешься добавлять каждую страницу. Ну и какой-то рейтинг комментаторов (и возможность ограничения минимального для себя).

Еще полезно было бы добавить в скрипт интеграцию с естественными комментами, т.е. вывод формы и возможность работы с естественными комментами на общих основаниях. Это прибыли не даст, но пользователям удобство.

Все непонятно:

а) урлы, с которых пришли писать в файл? Так это-то легко, но я хотел в аналитикс чтоб это было (всякие цепочки и т.п. смотреть).

б) Вот чую, что это то, что мне надо, но не знаю, что такое ББС, и как это сделать? (сейчас в php написано хедер локейшен и адрес, а что должно быть?)

Всего: 181