Эксперимент с Яндекс Рефератами.

12
S
На сайте с 29.12.2008
Offline
43
1673

Эксперимент с Яндекс Рефератами.

Сделал скрипт, который парсит http://referat.yandex.ru/

и делает на его основе сайт рефератов.

Загрузил сайт на narod.ru

Вот что написано на Яндекс Рефератах:

Нажав на кнопку "Написать реферат" вы лично создаете уникальный текст, причем именно от вашего нажатия на кнопку зависит, какой именно текст получится - таким образом, авторские права на реферат принадлежат только вам.

Теперь никто не сможет обвинить вас в плагиате, ибо каждый текст Яндекс.Рефератов неповторим.

Текстами рефератов можно пользоваться совершенно бесплатно, однако при транслировании и предоставлении текстов в массовое пользование ссылка на Яндекс.Рефераты обязательна.

Итак, это уникальный текст и

обязательно ставить ссылку на Яндекс.Рефераты.

Думаю, если ссылки на Яндекс.Рефераты не будет,

то сайт попадёт в баню.

А если ссылка на Яндекс.Рефераты будет,

то сайт будет проиндексирован и не будет забанен.

Сразу после загрузки сайта на narod.ru

я сделал add url в поисковики.

Через сколько дней поисковик зайдёт на мой сайт,

после того как я добавил сайт через add url?

Dmytro
На сайте с 04.06.2008
Offline
89
#1

Обсуждалось уже... текст с яндекс.рефератов какбэ и уникальный, но на поверку выходит, что нифига он не уникальный и яндекс на раз-два вычисляет, откуда он взят. Насчет аддурла - как повезет, вообще сайты на народе вроде как быстро индексятся.

S
На сайте с 29.12.2008
Offline
43
#2
Dmytro:
Обсуждалось уже... текст с яндекс.рефератов какбэ и уникальный, но на поверку выходит, что нифига он не уникальный и яндекс на раз-два вычисляет, откуда он взят

Ну и что, что Яндекс вычислит откуда он взят,

я ведь ссылку на яндекс-рефераты поставил.

А как это яндекс вычисляет?

bojo
На сайте с 25.02.2008
Offline
72
#3

сайты слепленные на основе данного сервиса долго не живут, не для этих нужд сервис разрабатывался 🍻

Dmytro
На сайте с 04.06.2008
Offline
89
#4
srarwars:
А как это яндекс вычисляет?

Ну а как иначе - генерить умеет, а вычислить свой же текст не сможет ? ☝

S
На сайте с 29.12.2008
Offline
43
#5

А может поможет синонимизация?

Dmytro
На сайте с 04.06.2008
Offline
89
#6

Простая автозамена слов - не думаю, придется еще помудрить с перемешиванием текста или добавлением наречий... ну как вариант. Проверьте прогой Dcfinder любой кусок текста я.рефератов и посмотрите на результаты поиска, даже беглый взгляд позволяет понять, что же так узнаваемо в этих "уникальных" текстах :)

S
На сайте с 29.12.2008
Offline
43
#7
Dmytro:
Проверьте прогой Dcfinder любой кусок текста я.рефератов и посмотрите на результаты поиска, даже беглый взгляд позволяет понять, что же так узнаваемо в этих "уникальных" текстах :)

А можете сказать, что узнаваемо в этих "уникальных" текстах?

Просто не хочеться скачивать прогу, может в ней вирус.

Это же яндекс генерит рефераты,

значит Гугл об этом ничего не знает.

Ну а как иначе - генерить умеет, а вычислить свой же текст не сможет ?

яндекс вычислит свой текст, а поскольку это текст яндекса,

то Гугл ничего не знает об этом тексте!

Поэтому Гугл проиндексирует этот сайт и не забанит его.

Или я ошибаюсь?

qazex
На сайте с 15.09.2008
Offline
98
#8
Итак, это уникальный текст

По большому счету, уникальный=нигде до этого неопубликованный.

Остальное все со временем воруется/парсится/копируется.

Dmytro
На сайте с 04.06.2008
Offline
89
#9

Нет там вирусов, куча народу ей пользуется. Узнаваем в этих текстах скелет, по которому строятся предложения: [сущ.]+[нар.]+[гл.]+... Все по одной схеме генерится, с небольшими вариациями.

Dmytro добавил 01.05.2009 в 02:42

Ну что за вопросы ? Сложно вбить в поиск пару предложений и убедиться в том, что гугл тоже не пальцем делан ? :)

S
На сайте с 29.12.2008
Offline
43
#10

http://referat-free2009.narod.ru/

srarwars добавил 01.05.2009 в 02:52

Вот исходники скрипта. Пусть они распространятся по Интернету :)

Основной скрипт

http://awvwafwcfew.narod.ru/referat.php

Шаблон index.htm

http://awvwafwcfew.narod.ru/index.tpl

Шаблон referat-1.htm

http://awvwafwcfew.narod.ru/referat.tpl

Класс для работы с шаблонами (не мой)

http://awvwafwcfew.narod.ru/template.php

Вот код referat.php

<?php
//Создание сайта рефератов на основе http://referat.yandex.ru/
require "template.php";
set_time_limit(0);

function upload2ftp($filename)
{
$connect = ftp_connect ("ftp.narod.ru");
$result_login = ftp_login($connect, "login", "password");
ftp_put($connect, $filename, $filename, FTP_ASCII);
ftp_quit($connect);
}

//спикок тем рефератов
$type_array = array("astronomy", "geology", "gyroscope", "literature", "marketing", "mathematics", "music", "polit",
"agrobiologia", "law", "psychology", "geography", "physics", "philosophy", "chemistry", "estetica");

//количество рефератов
$max_referat = 1000;
//количество ссылок на рефераты на странице меню
$max_link = 10;
//количество страниц меню (index.htm, index-2.htm)
$max_menu = $max_referat / $max_link;
//номер реферата (1, 2, 3 и т. д.)
$referat_id = 1;
//$menu_id - номер страницы index.htm, index-2.htm

for ($menu_id = 1; $menu_id <= $max_menu; $menu_id++)
{
//строка для ссылок на рефераты
$link_str = "";
for ($i = 1; $i <= $max_link; $i++)
{
/*Скачиваем реферат с http://referat.yandex.ru/
парсим и заносим в переменную $referat_title название реферата,
а в переменную $referat_text текст реферата*/
$f=join('', file("http://referat.yandex.ru/".$type_array[rand(0, count($type_array)-1)].".xml"));
// начало реферата
$begin=strpos(strtolower($f), '<h1 style', 0);
// конец реферата
$end=strpos(strtolower($f), '</div>', $begin);
// вырезаем то, что нам нужно - реферат целиком (название и текст)
$txt=substr($f, $begin, $end-$begin);

//выбираем название и текст
// начало названия
$begin=strpos(strtolower($txt), '>', 0)+8;
// конец названия
$end=strpos(strtolower($txt), '</h1>', $begin)-1;
// вырезаем то, что нам нужно - название реферата
$referat_title=substr($txt, $begin, $end-$begin);
// вырезаем то, что нам нужно - текст реферата
$referat_text=substr($txt, $end+6);

/*Создаём на основе tpl-шаблона реферата файл
referat-$referat_id.htm и сохраняе туда $referat_title и $referat_text*/
$tpl->get_tpl('referat.tpl');
$tpl->set_value('TITLE', "Реферат по теме: ".$referat_title);
$tpl->set_value('KEYWORDS', "рефераты, реферат, referat, курсовая, диплом, сочинения, экономика, право, история, абитуриент, студент, лекции, онлайн, образование, библиотека");
$tpl->set_value('DESCRIPTION', "Огромная коллекция рефератов на разные темы бесплатно, всё для студентов и школьников");

$prev = "referat-".($referat_id - 1).".htm";
$next = "referat-".($referat_id + 1).".htm";
if ($referat_id == 1) {$prev = "referat-".$max_referat.".htm";}
if ($referat_id == $max_referat) {$next = "referat-1.htm";}

$tpl->set_value('NAVIGATE', '<A href="'.$prev.'">Предыдущий реферат</A> :: <A href="index.htm">Главная страница</A> :: <A href="'.$next.'">Следующий реферат</A>');
$tpl->set_value('CONTENT', '<H1>'.$referat_title.'</H1>'.$referat_text);
$tpl->tpl_parse();

//сохраняем реферат в файл
$file = fopen ("referat-$referat_id.htm", "w");
fputs ($file, $tpl->html);
fclose ($file);
//загружаем на ftp-сервер
upload2ftp("referat-$referat_id.htm");
//удаляем файл
unlink ("referat-$referat_id.htm");

/*добавляем в переменную $link_str ссылку на только что
созданный реферат, <A href="referat-$referat_id.htm">$referat_title</A>*/
$link_str .= "<A href='referat-$referat_id.htm' target='_blank'>$referat_title</A><br><br>";
/*После этого делаем $referat_id++, чтобы каждый реферат был в отдельном файле,
иначе они будут сохраняться в одном и том же файле*/
$referat_id++;
}
/*Создаём на основе tpl-шаблона меню файл index-$menu_id.htm
Причём для $menu_id == 1 будет index.htm,
а для всех остальных будет index-2.htm, index-3.htm и т. д.
В этих файлах будут ссылки на рефераты из переменной $link_str*/
$tpl->get_tpl('index.tpl');
$tpl->set_value('KEYWORDS', "рефераты, реферат, referat, курсовая, диплом, сочинения, экономика, право, история, абитуриент, студент, лекции, онлайн, образование, библиотека");
$tpl->set_value('DESCRIPTION', "Огромная коллекция рефератов на разные темы бесплатно, всё для студентов и школьников");

$prev = "index-".($menu_id - 1).".htm";
$next = "index-".($menu_id + 1).".htm";
if ($menu_id == 1) {$prev = "index-".$max_menu.".htm";}
if ($menu_id == $max_menu) {$next = "index.htm";}
if ($menu_id == 2) {$prev = "index.htm";}

$tpl->set_value('NAVIGATE', '<A href="'.$prev.'">Предыдущая страница</A> :: <A href="index.htm">Главная страница</A> :: <A href="'.$next.'">Следующая страница</A>');
$tpl->set_value('CONTENT', $link_str);
$tpl->tpl_parse();

//сохраняем меню в файл
if ($menu_id == 1)
{$menu_filename = "index.htm";}
else
{$menu_filename = "index-$menu_id.htm";};
$file = fopen ($menu_filename, "w");
fputs ($file, $tpl->html);
fclose ($file);

//загружаем на ftp-сервер
upload2ftp($menu_filename);
//удаляем файл
unlink ($menu_filename);
}
echo "Done";
?>

Оставьте отзывы на скрипт

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий