Кстати, маленький прикольчик хочу подметить, совсем недавно парсил выдачу гугля по НЧ ключам - так вот много раз попадались мне страницы, созданные на фейсбуке. Тупо заголовок страницы НЧ ключ с точным вхождением.. а на самой странице никаких материалов нет и ссылок даже не стоит. Пустая страница 🤣 экспериментил кто то видать, а я наткнулся 🤣 считайте, спалил тему ☝
Соцсети ранжируются на порядок выше гуглом нежели сайты
А аккаунт другой создавали? на каком языке контент и какой тематики контент?
посудите сами сквозняк на дор с СДЛ - это уже абсурд.. все равно что википедия ссылалась бы на порносайт. Согласны??
+ для каких целей вам это надо? передать вес за два дня не получится, а загнать в индекс можно и другими способами.
оказалось проще:
65 строка:
$stripRN=false
да я же говорю - там дело все в подключаемом парсере simple_html_dom.php
он выдирает с шаблона все переносы. а как его подкрутить чтобы шаблон оставался в своем прежнем виде - не пойму
fwrite($handle, $new_cats);
прописал - тщетно .. все также в одну строку
fwrite($handle, $new_cats."\n");
у меня с построением списка все нормально. код не лезет в одну строку.. а вот
$html = new simple_html_dom(); $html = file_get_html('template.html');
в этих сгененых файлах получается в одну строку разметка страницы.
Может быть такое что дело в подключаемых библиотеках simple_html_dom ?
что то надо прописать ?
DenisVS, простите, что именно заменить?
согласен.
<?php/** * @author Ololo * @copyright 2012 */require ('simple_html_dom.php');set_time_limit(0);$filearray = glob("xml/*.xml");echo "Was found ".count($filearray).'txt files<br>';$cat = ceil(count($filearray)/50.0);$string_cats = '<a href="index.html">1</a> ';for($j = 2; $j <= $cat; $j++){ $string_cats.='<a href="cat_'.$j.'.html">'.$j.'</a> ';}var_dump($filearray);//die; $count = 1; $html = new simple_html_dom();$html = file_get_html('template.html');//$index = new simple_html_dom();$index = fopen('index.html', 'r');//$index = file_get_html('index.html');$index_html = fread($index, 100000);$new_cats = $index_html;$count_cat = 1;$current_cat = ('html/index.html');$sitemap = fopen('sitemap.html', 'r');$sitemap_html = fread($sitemap, 100000);foreach($filearray as $files_name){ $xml = simplexml_load_file($files_name,SimpleXMLElement,LIBXML_NOCDATA );$my_post = array();foreach ($xml as $key => $value) { $my_post["$key"] = trim($value); }$b = $html -> find('#post', 0);$b->outertext = $my_post['post'];$b = $html -> find('#mytitle', 0);$b->outertext = '<h2>'.$my_post['title'].'</h2>';$b = $html -> find('title', 0);$b->innertext = $my_post['title'];$b = $html -> find('cats', 0);$b->outertext = $string_cats; $html -> save('html/article_'.$count.'.html'); //$a = $index -> find('next_search', 0); $short_post = substr($my_post['post'], 0, 255); $short_post .="..."; $new_cats = str_replace('<next_search></next_search>', '<p><h2><a href="article_'.$count.'.html" title="'.$my_post['title'].'">'.$my_post['title'].'</a></h2>' .$short_post.'</p>'."\r\n<next_search></next_search>", $new_cats); //$a->outertext = '<p><h2><a href="article_'.$count.'.html" title="'.$my_post['title'].'">'.$my_post['title'].'</a></h2>'.$short_post.'</p>'."\r\n<next_search></next_search>"; $sitemap_html = str_replace('<next_search></next_search>', '<p><a href="article_'.$count.'.html" title="'.$my_post['title'].'">'.$my_post['title'].'</a></p>'."\r\n<next_search></next_search>", $sitemap_html); $count++; if(($count%50) == 0){ //$a = $index -> find('next_search', 0); //$a->outertext = ''; $new_cats = str_replace('<next_search></next_search>', '', $new_cats); $new_cats = str_replace('<cats></cats>', $string_cats, $new_cats); $handle = fopen($current_cat, 'w+'); fwrite($handle, $new_cats); fclose($handle); //$index ->save($current_cat); $count_cat++; //$index ->clear(); //$index = file_get_html('index.html'); $current_cat = ('html/cat_'.$count_cat.'.html'); $new_cats = $index_html; } //$cat_html = str_replace('<next_search></next_search>', '<p><a href="article_'.$count.'.html" title="'.$title.'">'.$title.'</a></p>'."\r\n<next_search></next_search>", $cat_html); }$new_cats = str_replace('<next_search></next_search>', '', $new_cats);$new_cats = str_replace('<cats></cats>', $string_cats, $new_cats);$handle = fopen($current_cat, 'w+');fwrite($handle, $new_cats);fclose($handle);$sitemap_html = str_replace('<next_search></next_search>', '', $sitemap_html);$sitemap_html = str_replace('<cats></cats>', $string_cats, $sitemap_html);$new_sitemap = fopen('html/sitemap.html', 'w+');fwrite($new_sitemap, $sitemap_html);fclose($new_sitemap);fclose($sitemap);
+ получается беда - плывут яваскрипты
ага.. баксов на пиццот потянет 🤣
давайте по существу, товарищи!
Собственно какого рода доры держатся из моей практики:
подбор уг текста из паблика по ключам (на практике уже полгода и все в порядке)
НО!
Головомойка имхо.. так как парсить и подбирать текст очень долго. даже на полуавтомате.
Интересуют более быстрые варианты генерации сайта под ключи определенной тематики...
Жако-дорген пробовал - мутата полная.. сайты уходят в никуда еще не залетев в индекс..
Картинки с альтами по нкнч ?
как вариант.. однако, картинки есть картинки
Что еще возможно/можно?
З.Ы. не жлобитесь на советы за это Бог наградит вас нереальным трафиком и конвертом ☝