AnyTubes дорген

Graffy
На сайте с 05.05.2012
Offline
48
#111

kxk, я уже отвечал по этому поводу, изначально он делался на sqlite, но были проблемы с использованием оперативки, поэтому был переписан на mysql

AnyTubes Dorgen v2 (/ru/forum/comment/14276302)
S
На сайте с 31.05.2014
Offline
46
#112
Graffy:
barkasian, Используй Notepad++ при добавлении ключей в файл.
Если это не поможет, открой опять же в Notepad++ файл add.php и раскомментируй строку :

пробовал не помогает

http://plasmon.rghost.ru/7vwJyBqvT/image.png

http://higgs.rghost.ru/6WpmkhmmW/image.png

Graffy
На сайте с 05.05.2012
Offline
48
#113

saimonyz, база данных должна быть тоже в кодировке UTF-8

S
На сайте с 31.05.2014
Offline
46
#114

Graffy, а по поводу крона

php /var/www/юзер/data/www/домен/cleaner.php

php /var/www/юзер/data/www/домен/gen_sitemap.php

правильно ставлю и на сколько каждый час что бы выполнил нормально ? да и какие права ставить на cleaner.php и gen_sitemap.php

root# php /var/www/юзер/data/www/домен/cleaner.php

PHP Warning: filectime(): stat failed for ./cache/temp_cache/mostpopular.data in /var/www/юзер/data/www/домен/cleaner.php on line 29

PHP Warning: unlink(./cache/temp_cache/mostpopular.data): No such file or directory in /var/www/юзер/data/www/домен/cleaner.php on line 31

PHP Warning: filectime(): stat failed for ./cache/temp_cache/best.data in /var/www/юзер/data/www/домен/cleaner.php on line 33

PHP Warning: unlink(./cache/temp_cache/best.data): No such file or directory in /var/www/юзер/data/www/домен/cleaner.php on line 35

а вот с gen_sitemap.php всё норм

root# php /var/www/юзер/data/www/домен/gen_sitemap.php

Graffy
На сайте с 05.05.2012
Offline
48
#115

saimonyz, если gen_sitemap отрабатывает нормально, то и с cleaner все будет ок, я обычно крон ставлю через wget:

wget --delete-after http://domain.ru/cleaner.php
wget --delete-after http://domain.ru/gen_sitemap.php
S
На сайте с 31.05.2014
Offline
46
#116

Graffy, можно как то сделать что бы не парсел такие видосы

http://plasmon.rghost.ru/6RPX45TZk/image.png

irisat
На сайте с 20.03.2012
Offline
197
#117
saimonyz:
можно как то сделать что бы не парсел такие видосы
http://plasmon.rghost.ru/6RPX45TZk/image.png

Так это же дор! пусть парсит себе на здоровье) таких страниц наверное не более 1% будет.

Дор должен сливать на партнерки а не видяхи юзерам показывать!

ps: еще со временем видяхи пропадают - вы с этим явлением тоже будете бороться?)

Пропадание видях более актуально на промежутке времени - пропавших будет больше.

---------- Добавлено 31.01.2016 в 19:37 ----------

Graffy:
скинь в личку запрос по которому нашлось это видео

Та хотя бы id видео - можно будет посмотреть, есть ли в отдаваемых данных по API, пометка о ограничении...

Если нет, то нет большого смысла с этим бороться)

Лучше сделать :

irisat:
Можно сменить логику, что бы страницы записывалась в базу и формировалась после первого обращения к ней?

Либо добавить функцию что бы при обращении к странице, если API возвращает результат по указанному id, то формируем и записываем ...

Так бодет больше на дор похоже и меньше нагрузка при поиске и релевантах - запишутся только те на которые был переход - зачем нагружать "сайт" и записывать в базу видяху когда ее даже смотреть не хотели?

Нужно писать только то, к чему было обращение. имхо конечно)

LocalBitcoins (https://goo.gl/1Yxi8M) | Бот обменник (https://goo.gl/bPTaiF) - Покупка и продажа bitcoins! Биржа криптовалют №1 (https://goo.gl/6r6icz) - более 350 пар!
Graffy
На сайте с 05.05.2012
Offline
48
#118
irisat:

Так бодет больше на дор похоже и меньше нагрузка при поиске и релевантах - запишутся только те на которые был переход - зачем нагружать "сайт" и записывать в базу видяху когда ее даже смотреть не хотели?

Нужно писать только то, к чему было обращение. имхо конечно)

Смысла в этом почти нет, так как бот ходит почти по всем страницам, и они так же будут записываться.

irisat
На сайте с 20.03.2012
Offline
197
#119
Graffy:
Смысла в этом почти нет, так как бот ходит почти по всем страницам, и они так же будут записываться.

Смысл есть и не маленький!

Можно напарсить id тематических роликов, именно тех что нужно, по нужной тематике!

Запихнуть все id в ссылки на файле сайтмап.html

При данной реализации все ссылки вернут 404

А если записывать в базу при открытии целевой страницы - то получим более гибкий и удобный дорчик!)

ps: смысл этого в том, чтобы основное наполнение дора было тем чем нужно а не всяким мусором!

shurik0
На сайте с 07.01.2011
Offline
301
#120
irisat:
Можно напарсить id тематических роликов, именно тех что нужно, по нужной тематике!

Тогда пандора рулит.

А тут другой принцип:

Graffy:
при добавлении 10 начальных ключей и определенной настройке скрипта, дор будет сам расширятся без вашего беспокойства
Качественный хостинг по низкой цене. (http://goo.gl/MpjbKi)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий