plattoo

plattoo
Рейтинг
195
Регистрация
12.05.2010
stardel:
почему после того как парсер выдрал в моего сайта текст статьи то он стал у меня неуникальным?

Блин, как ты вообще сайт продвигаешь, если такие вопросы задаёшь :) ?

Сервис проверки уникальности находит полную копию или частичные совпадения с твоим контентом на других сайтах. И, соответственно, пишет, мол, обломись чувачок - текст неуникален.

Ему параллельно, что текст принадлежит тебе, и ты за него заплатил. Он просто находит полные и частичные копии. Вот и всё.

hakuna matata:
plattoo, да он еще и потом ворнинги в webmaster tools кидает - слишком много 404. Смотришь список 404 - а это /m/, /mobile/ и тд. Бред какой то.

И не говори. Честные дорвейщеги должны страдать из-за криворукости гугловских «инжынеров».

stardel:
а по какому принципу вообще работает парсер?

Парсеры разные нужны, парсеры разные важны.

Парсер выдирает что-либо со страницы (в твоём случае тело статьи) через регулярные выражения.

stardel:
Может мне таким заняться?

Ты ж церковными свечами торугешь, побойся Бога 😂

stardel, не занимайся фигнёй. Завтра я запущу парсер и твои тексты будут на моих дорах. Ну, убьёшь ты указанный дорвей - появятся другие. Смысла нет.

Могу посоветовать вот что:

Когда постишь новый контент, сразу же добаляй его в Гугл и Яндекс через панели вебмастера.

Прежде не отдавай пост через RSS. Парсер может сидеть на твоей ленте. И будет всегда быстрее тебя.

А потом, лайки, твиты, пинги, гуглоплюсы и прочие соцсигналы.

Короче, смысл в том, что бот должен быть вторым после тебя, кто увидит контент.

А все эти телеги бесполезная трата времени.

hakuna matata:
Берут файл зоны (список всех зарегистрированных доменов) и массово чекают домены по тем или иным признакам.

Да действительно, что-то я затупил.

one:
А с чего Вы решили что только это он проверяет?

Патамушта я вижу логи.

Вообще мобайл френдли у меня на всех дорах «Отлично! Страница оптимизирована для мобильных устройств.», а по PageSpeed Insights и для мобильных и для декстопов 100 из 100. Т.е. меня вся эта канитель с мобильностью не колышет. А вот инициативность Гугла забавляет.

one:
Гугл пробивает, твой сайт mobile ready или нет.

Это я понял. Только глупо это. А вдруг, мобильная версия у меня лежит в папке /mobilnayaversiya/ А он не нашёл. И чё, сайт теперь не мобильный, что-ли?

Ребятки, такой вопрос.

На нулёвый домен (зареган в марте, никем никогда не использовался) два дня назад залил дор. Пинганул и прогнал по дженах-базе. В выдаче его пока нет.

Сегодня глянул лог и среди прочего увидел вот это (урлы поменял, ибо нефиг):


93.183.196.77 - - [13/Jul/2015:04:44:14 +0000] "GET /wp-asf/dgsd-sds.php?asfgh=sfgsg_sfsg_sfgsg&sfgsg=../wp-sdfss.php HTTP/1.0" 404 14 "-" "-"
93.183.196.77 - - [13/Jul/2015:04:44:15 +0000] "GET /wp-asdfadf/asfasf/sadasd-aDad/ASD/ASs.php?files=../wp-asdADSD.php HTTP/1.0" 404 14 "-" "-"
93.183.196.77 - - [13/Jul/2015:04:44:15 +0000] "GET /ASDAD.php?file=wp-SADASD.php HTTP/1.0" 404 14 "-" "-"

Погуглил и нашёл експлойт для одного плагина. Выполнил нехитрые рекомендации и открыл wp-config.php у четырёх сайтов из TOP-10.

Внимание, вопрос.

Если пекари работают на широкую ногу и пробивают сайты, которых нет в выдаче, не логично ли предположить, что некоторые сервисы статистики и анализа сайтов созданы самими пекарями? Штобы, так сказать, кто первым встал, того и тапки. Кто что думает?

Ну, и ещё одно наблюдение, не относящееся к вопросу. Гугл, умный и инициативный. На том же сайте он ищет:


66.249.64.194 - - [13/Jul/2015:01:14:15 +0000] "GET /mobile/ HTTP/1.0" 404 14 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.64.194 - - [13/Jul/2015:01:14:25 +0000] "GET /m/ HTTP/1.0" 404 14 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

Таких папок никогда не было, и нигде они не упоминались.

---------- Добавлено 13.07.2015 в 21:34 ----------

Ringozo:
Мож кто знает "папочные" фрихи. т.е. не 123.frixa.ru, а frixa.ru/123/

На WP такое можно накопать. Но это WP - ничё туда не зальёшь. А вот ссылки проставить можно.

То же самое https://www.jottit.com/n92p/ - не зальёшь, но ссылку поставишь.

Ringozo:
Проблема в file_get_content

А какая проблема?

_Snake_:
Думаю стоит вот так.

Дык, зачем? Если я правильно понимаю, сабака отключает вывод ошибок. Это не кошерно. Быдлокодить нужно без ошибок 🙅

Ringozo:
Чет не совсем понятно. Можно поподробнее чуточку?

Твой вопрос

Ringozo:
Необходимо вывести этот результат на другой странице.

$page = file_get_contents('http://sovet-yurista.hyperphp.com/google/?l=ваш кейворд');
echo $page;

Т.е. предположим, что в index.php у тебя код


$page = file_get_contents('http://sovet-yurista.hyperphp.com/google/?l=ваш кейворд');

Результат его исполнения ты хочешь вывести на странице

site.ru/bez-sms-i-registracii.html

Для этого в index.php ты пишешь


$page = file_get_contents('http://sovet-yurista.hyperphp.com/google/?l=ваш кейворд');

include $_SERVER['DOCUMENT_ROOT'].'/bez-sms-i-registracii.html';

А в bez-sms-i-registracii.html пишешь


echo $page;
Всего: 1321