Hkey

Hkey
Рейтинг
222
Регистрация
30.09.2006
Интересы
Java
Gen.Oksana:
Hkey, подскажите как решить задачу.
Установлена актуальная версия HTracer на WP. Используются ссылки в конце поста с alt.
Недавно обнаружили, что появились ссылки на страницы вида uploads/2010/06/nazvanie.jpg
Таких страниц несколько десятков.

Подскажите, каким образом сделать полный запрет на простановку ссылок на такие страницы? Мне не нужны внутренние ссылки на фотографии к постам...

Есть две причины:

1. Вы их импортировали или вручную добавили.

2. HTracer их сам словил. А чтобы скрипт их словил должен запускаться пхп и вордпресс при загрузке картинок. Проверьте ни нахимичили ли вы хтацесс. Дело не только в HTracer. Дело в том что нагрузка на сервер большая. Вместо того чтобы просто отдать картинку с диска, апач должен загрузить интерпритатор пхп, интерпритатор должен спарсить весь код ВП и загрузить его и запустить, вп инициализруется загрузит свои настройки из MySQL и отдаст части плагинов такуе-же комманду, а потом просто отдаст картинку с диска. И при этом он полностью не освободит память пока загрузка пользователем картинки не завершиться. Т.е. процессорное время и память тратиться на холостой ход.

Если причина во второй, то в следующей версии скрипт не будет добавлять картинки и подобные вещи. Но проблема в том, что у вас запускается вп перед тем как отдать картинку никуда не денется.

---------------------------------

Пока эту проблему можно так из админки HTracer перейти на ключи, ввести фильтр uploads снять СЯ со всех ключей. Аналогично в разделе Страницы. Затем перейдите в опции, включите показать все и в Основные-исключения добавьте /uploads. Синхонизируйте фильтры и отчистите кеш.

---------- Добавлено 07.02.2012 в 21:12 ----------

Last hErO:
1. Скрипт создал ссылки без www хотя на сайте все ссылки с www думаю потому что вошел в админку без www сразу.Можно ли исправить ссылки?
2. Предлагаю сделать инструкцию более юзабильной в плане вставок.К примеру написать пунктом 8 - для вставки облака тегов вставьте <!--the_keys_cloud-->, для вставки ссылочной перелинковки на другие страницы вставьте <!--the_keys_cloud style=ul_list 3/300--> кроме вордпресса где все автоматом. Где 3 то то то, а то терминами написано техническими, искал долго.
3. В Джумле контекстные ссылки из текстов статей не генерируются или еще что-то надо вставить для этого? Стоит "генерировать везде" в настройках скрипта, там в инструкции видел теги, но как эти теги вставить не открываю статьи вручную? (их больше 1тыс).

1. ВВВ и с и без зависит от того домена на котором находиться посетитель. Если он находиться на ввв то ему ссылки будут показывать с ввв. В противном случае без ввв.

2. Посмотрю

3. Нужно поставить в опции -> вставка. Контекстные ссылки:в диапазоне. и в шаблон вставить код, который показывает куда нужно вставлять ссылки (кликните на строку "Контекстные ссылки" для вывода справки)

fanat85:
я не знаю писали решение проблемы в топике раньше или нет, я покрайней мере не нашел ...
вообщем поставил скрипт .. запустил .. и саит стал полностью крякообразным ( проблема с кодировкой )
хотя везде стоит cp1251 =(


амм такое дело ...

НАСТРОИЙКИ -> Быстродействие -> Способ разбора HTML , если выбрать "быстрый" то кодировка на сайте летит ( саит становиться крякообразным ), если выбрать "надежный" , то все норм ...

Часто быстрый разбор глючит, если бы он был бы таким-же надежным, то он стоял бы по умолчанию. Либо был бы единственным методом разбора. Но стандартная библиотека PHP Dom благодаря которой и происходит быстрый разбор глючная, но очень быстрая поскольку она не на ПХП написана, а на C++.

Если вы откроете, HTracer.php, функцию static function Insert, то в блоке if($UsePhpDom && class_exists('DOMDocument')) большинство строк не работают с PHP Dom, а стараются исправить ее ошибки.

---------- Добавлено 06.02.2012 в 22:13 ----------

kan99:
Уважаемый автор мои проблемы так и не решились.
Все так же выдает ошибки, в таком роде
Вы рекомендовали
Так же я увеличил место на диске (2 гига добавил свободного места), не помогло.

Значит нет доступа. Проверьте доступы на папке кеш и ее файлах. Обратитесь в суппорт хостинга чтобы отключили сейф мод.

kodges:
Hkey, сделайте плизз чтобы в титлах контекстных ссылок был не просто ключевик а title страницы на которую ссылается ссылка. Такие ссылки имеют бОльшую кликабельность, и соответственно передают больше веса так как ПС учитывают и поведенческий фактор. Вес ссылок же по которым не кликают вообще, стремится к нулю!

От титла ссылки разница в кликабельности несколько процентов, для того чтобы статистически достоверно отследить такие изменения нужно очень большое число кликов. Далеко не факт, что поисковики оценивают кликабельность внутренних ссылок.

Более того на большинстве сайтов титлы в стиле "Одесский оперный театр << театры Одессы << Одесса" и ставить такие титлы у ссылок глупо.

---------- Добавлено 05.02.2012 в 21:13 ----------

vtomas:
Хотелось бы из админки править файл словаря, частенько отчества и города попадаются с маленькой буквы.

скоро можно будет, но через блокнот. В словаре программы сильно много разных групп, чтобы это можно было бы вывести в админку. Абривиатуры, Имена собственные, признаки имен собственных, стоп-слова, популярные слова (скачать, купить), тезариусы по фильтрам разным, признаки мата. Левые и правые уточняния при импорте в сапу, опирающиеся на первое и последнее слово. Причем в части словарей больше нескольких тысяч слов - редактировать все через админку сложно.

respekto:
Сам не один перечитываю, и ответов многих не нахожу. Хоть кто-то может сравнительные тесты показать? До - после. Сервак, движек, посещаемость?

Смотрите на сайте там есть пару примеров графиков, пару страниц назад я выкладывал график "падения".

DLEJoin:

Зачем мне лгать?

Этого я не знаю. Но факт есть фактом я вас два раза словил на лжи.

DLEJoin:

Ну конечно,вы один разбираетесь

Этого я не говорил, но вы точно не разбираетесь в том о чем говорите.

DLEJoin:

Вы же сами написали что Альты берутся из кеша,теперь утверждаете обратное?

Вы не внимательно прочитали.

DLEJoin:

Откуда же берутся альты да ещё и как вы выразились "на лету"?

Из БД.

DLEJoin:

Я просто задаю конкретные вопросы, но получаю размазанные ответы.

Ответы на эти вопросы вам кажутся непонятными, поскольку у вас не хватает компетентности их понять и вам лень погуглить (например, что такое кеш). Почему вы их задаете и не отвечаете на мои вопросы и не на чьи другие? Вот в чем вопрос.

DLEJoin:

Одно неверное движение и из яши выкидывает очень даже легко, это знают даже дети.

Если открыто не спамить и сервер доступен, то из индекса Яша не выкинет. Иногда конечно у серверов Яши бывают проблемы. Так что это ваше голубиное суеверие, как и большинство вами утверждаемого.

Яша намерено выкидывает из индекса только совсем доры либо полудоры с очень большим числом страниц, чтобы освободить место на серваках, для других сайтов есть фильтры.

DLEJoin:

Вы не сотрудник Яндекса и не Платон, поэтому не можете знать всех тонкостей работы поисковика.

А вы наверное Платон Шукин?

DLEJoin:

Дело в том что в DLE прописываются 4 поля - Keywords,Tags,Description,Metatitle. Т.е. их 4! и все они были у нас прописаны. В итоге у нас переходы были с яндекса по фразам которые прописала программа, но самих фраз в тексте новости нет и не было.

Если в титле есть ключ, то страница ранжируется по этому ключу. Титл автоматом формировать в большинстве случаев - спам. Что такое Tags (где он выводиться)?

Из кеша у вас получаются Альты для картинок, а если кеш очистить? тогда Альты умрут?

Абсолютно глупое предположение. Просто кеш создастся заново. Кеш это дополнительная копия данных в несколько ином виде, нужна только по оптимизации по скорости. Альты из кеша не берутся берется контекстные ссылки и облако.

Основное время занимает парсинг(разбор) хтмл кода. Я это понял сразу, по-этому и возник ряд вопросов.

Опять лжете, как человек не знающий что такое кеш мог это понять? До профайлинга второй версии я сам этого не понимал.

---------- Добавлено 04.02.2012 в 14:32 ----------

Это нормальная дискуссия. Но вы как то странно воспринимаете критику.

Просто вы пытаетесь продемонстрировать свою компетентность в той сфере в которой не разбираетесь и это меня раздражает.

---------- Добавлено 04.02.2012 в 14:38 ----------

Кстати если резко отключить скрипт то яндекс может вообще выкинуть сайт из индекса, а это значит что безопасным скрипт не назовёшь.

Опять таки ваши утверждения голословны. Из Яши никого не выкидывало. Откуда вы это взяли?

DLEJoin, Приведу два ваши цитаты

Как показывает опыт - прописав грамотно ключевые слова, новые страницы появляются в выдаче гугла.
Ключи это Keywords к новости

Следовательно, вы утверждаете, что прописал МетаКейвордс к выдаче вы подняли запрос в Гугле. А вот это наглая ложь! Гугл МетаКейвордс не учитывает в отличии от Яши.

идем дальше

Именно с Яндекса увеличиваются переходы если грамотно подобрать ключи для новостей, появляются новые фразы (запросы) по которым были переходы.

Яша не учитывает те слова из метатега кейвордс, которые не присутствуют на странице. Назовем это опорой, действует не только на метакейвордс но и на внешние ссылки (чтобы избежать ликбомбинга), если ни одного слова анкора нет на странице - то ссылочное, как правило, будет проигноровано. Бытует мнение что, даже для слов в титле нужно иметь опору, а ссылочное без полной опоры передается хуже. Если говорить в общем, то без опоры страницу лучше не продвигать, если опора есть то почти наверняка страница будет в Топ-50 выдачи, хотя-бы по одному из подзапросов.

---------- Добавлено 04.02.2012 в 14:13 ----------

У вас на сайте написано, что база данных не меняется, а всё выполняется "на лету".

Да база не меняется, страница генерируется на лету, но причем тут Гугл Аналитикс.

DLEJoin:
1. Не соглашусь. Как показывает опыт - прописав грамотно ключевые слова, новые страницы появляются в выдаче гугла.

Опять 25. Если страницы нет в Топ-50 выдачи ни по НЧ или СЧ запросу, ни по его уточнениям продвигать ее не имеет смысла.

"Как показывает опыт". Чей? У вас был опыт когда проиндексированная страница не была по СЧ или НЧ и ни по одному из его утонений в Топ-50 , а потом благодаря внутренним факторам появилась, без редактрирования ее текста?

Как показывает опыт - прописав грамотно ключевые слова, новые страницы появляются в выдаче гугла.

Где прописав?

Можно, конечно, напихать тупо простыню из ключей в конце поста(как в соседней теме) - но это будет работать, в лучшем случае, до первого стука. В худшем - яша сразу наложит фильтр.

DLEJoin:

Каким образом вы "на лету" можете проанализировать гугл аналитикс? Эта страница в гугле
открывается несколько секунд.

Я разве говорил что-то о полетах.

DLEJoin:

Ключи и запросы это не одно и то же.

Просветите меня, сенсей ))) Чем отличаются ключи от запросов? Только не говорите, ключи это от дверей, а запросы в прокуратуру шлются!

DLEJoin:

Автоматика у вас по тем запросам по которым уже пришли юзеры, но не по тем по каким могли бы прийти.

Опять 25... Если страницы нет в выдаче по НЧ или СЧ запросу или по любому из уточнений в Топ-30 или в Топ-50 выдачи поисковых систем, значит текст этой страницы не релевантный либо страница не проиндексирована либо наложен фильтр. Это говорит о том, что страницу приложив разумные усилия, не редактируя ее текст и не добавляя спамныю простыню, продвинуть либо нельзя либо нужно огромное число ресурсов, которые лучше потратить на более адекватный запрос.

Либо пойдем с другой стороны есть два СЧ запроса один на 1000ной позиции выдачи, другой на 20. Какой из этих запрос нужно двигать?

DLEJoin:

5. Если всё вводить Ручками, тогда до пенсии можно вводить.
Вообще у вас многое делается "на лету". Идея может быть и интересная, однако это довольно трудоёмкий процесс для процессора, а следовательно скрипт будет жестоко нагружать хостинг.

Если настроить быстродействие, то скрипт грузит хостинг меньше, чем большинство плагинов к CMS. Например, при настройках (кешировать общие данные - около 1мб кеша), быстрый разбор (или отключить Альты ссылок) и не создавать таблиц скрипт использует только 1 или 2 запроса к БД.

1. Облако берется общего кеша, при необходимости (если рандомность больше 1), часть ссылок удаляется.

2. База контекстных ссылок берется из общего кеша.

3. Простым запросом из базы запрашиваются все ключи для этой страницы. Из них получаются альты и метакейвордс и часть опциональных функций их использует (например, титлы страниц).

4. Если титлы включены мы запрашиваем информацию по первым двум ключам всех страниц на которые ссылается эта страница.

Санитаризиция запросов (перевод нужных слов в верхний регистр) происходит при записи в базу. Основное время занимает парсинг(разбор) хтмл кода.

Это по третей версии, вторая версии совершенно по другому работала, по ней были нарекания. По третьей с правильными настройками никто не жаловался.

P.S. То вы ругаете автоматику, что она жрет ресурсы и не двигает все запросы. То вы ругаете ручной режим, что он долгий. Если хотите все поругать - то идите на форум о политике.


---------- Добавлено 04.02.2012 в 02:38 ----------

DLEJoin:
Да причём тут эта программа?

Вот вы и спалились ) Я не к вам обратился а к вашему боту.

useram:
Не соглашусь с вами. WebSin не только синомайзер. Не зачтите за рекламу но ней я пользуюсь давно. В ней есть пунктик который подбирает для каждой новости ключевые слова в совместимости с yandex Wordstat . Работает быстро и самое главное с толком.

Задолбали офтопить и рекламировать прогу. Если название программы по морфологии написано не правильно - этим все сказано.

---------- Добавлено 04.02.2012 в 01:19 ----------

worldgaysex:
Hkey, есть предложение вынести фильтр по матерные словам в админку, что бы можно было отключать и включать, а также добавить 'www' 'com' 'net' в bad_words

Если запрос похож на домен или адресс по нескольким признакам он фильтруеться. По одному он не фильтруется.

DLEJoin:
1. Данные о переходах с поисковых систем мне дадут фразы по которым уже сайт нашли, но не дадут фразы по которым могли бы найти. Эти фразы нужны для продвижения по новым фразам.
2. Гугл аналитикс содержит разную инфу. Какую инфу использует скрипт?
3. Что значит "построчный список запросов"? Речь идёт о ключах. При чём тут запросы?
4. Вордстат для каждой новости руками вводить - это не выход.
5. Что значит "Ручками"?

1. Опять 25. Жаль нельзя в подписи это все написать чтобы каждую неделю не отвечать.

Со второй, третьей и даже с 4ой и 5ой страницы выдачи идут переходы. Даже если страницы в выдаче нет по запросу, то она в выдаче по его уточнению, а продвижение уточнения продвинет и основной запрос. Который окажется на первых 5ти страницах и сам будет продвигаться, через несколько итераций.

Если же страницы нет в первых 5ти страницах выдачи, ни по запросу ни по его уточнениям, значит она вообще никак не релевантна этому запросу. Здесь нечего делать не создавая новую или не переписывая старую страницу.

Более того число, переходов намного более информативно, чем число показов по вордстат:

Если страница есть в выдаче, но переходы не идут значит у нее плохой сниппет или она не релеватна для пользователей (пользователь, например, набирает вики, чтобы найти википедию и его никак не интересуют остальные сайты) или это запрос-пустышка (результат СЕО прессинга).

2. Переходы с поисковых систем.

3. Ключи и запросы это одно и тоже.

4. Это один из альтернативных режимов. Есть автоматика по 1 пункту.

5. Если вы считаете что запрос обделен вы можете его ввести. Релевантная страница определиться сама, но вы ее сможете легко поменять.

---------- Добавлено 03.02.2012 в 18:18 ----------

Subbota:
Парсинг WordStat, делаю запрос, выдает кучу ключей. Выбираю нужные - добавить, добавляет только один верхний, опять добавить - опять верхний. Помнится эта функция работала иначе, и добавлялись все выбранные ключи. Это задумка такая?

Ок посмотрю

---------- Добавлено 03.02.2012 в 18:20 ----------

worldgaysex:
30/30 то выводит 29

ок поправлю

и в USP вы не добавили noindex

Есть еще какие-то предложения по этому плагину?

Всего: 2639