Ваш сайт я и не знаю.
Смысл моей глупой проги?
Во первых, не моей. <class 'gensim.models.lsimodel.LsiModel'> можно загуглить. Моя прога лишь берет топ Я-хмл по определенному запросу, парсит контент с этих урлов и с помощью gensim строит текстовый корпус и получает lsi/lda
Дело вообще не в проге. Любой, кто может парсер Я-хмл сделать и ему дать загуглить gensim напишет это за несколько часов.
----
зы
вот это, например
-0.209*"asterica" + -0.151*"студия" + -0.139*"проект" + 0.133*"артатый" + 0.133*"выгодный" + -0.125*"scrum" + -0.124*"надежный" + 0.119*"товар" + -0.118*"создавать" + -0.116*"компания"
определено по запросу "Создание сайтов в Воронеже"
Запрос "Создание сайтов в Воронеже"
Долго не мог понять что такое "артатый"
$ mystem АРТАТОМ
АРТАТОМ{артат?|артатый?} 😆
осень в нью-йорке
<class 'gensim.models.lsimodel.LsiModel'> 0.679*"фильм" + 0.203*"осень" + 0.186*"любовь" + 0.186*"нью" + 0.179*"йорк" + 0.141*"жизнь" + 0.141*"хороший" + 0.137*"смотреть" + 0.124*"очень" + 0.105*"гир" 0.230*"фильм" + -0.217*"autumn" + -0.206*"in" + -0.205*"york" + -0.205*"new" + -0.178*"gabriel" + -0.178*"yared" + -0.153*"1" + 0.141*"просто" + -0.138*"история" 0.365*"любовь" + 0.237*"друг" + -0.222*"фильм" + 0.173*"время" + 0.159*"девушка" + 0.131*"чувство" + 0.114*"уилл" + -0.113*"просто" + 0.111*"кинопоиск" + -0.107*"жизнь" 0.264*"осень" + 0.257*"нью" + 0.228*"йорк" + 0.206*"онлайн" + -0.189*"жизнь" + -0.179*"просто" + 0.148*"смотреть" + -0.137*"история" + 0.136*"качество" + 0.135*"hd" 0.231*"онлайн" + 0.219*"качество" + 0.213*"уилл" + 0.190*"шарлотта" + -0.173*"фильм" + 0.169*"жизнь" + 0.162*"просто" + -0.155*"любовь" + 0.140*"2000" + 0.127*"бесплатно" 0.242*"кино" + -0.215*"бесплатно" + -0.201*"онлайн" + -0.197*"качество" + -0.190*"хороший" + 0.144*"ru" + 0.136*"mail" + -0.134*"смотреть" + 0.134*"in" + 0.132*"york" -0.329*"русский" + -0.326*"мелодрама" + -0.251*"hd" + -0.208*"комедия" + -0.165*"новинка" + -0.146*"2018" + -0.132*"гирр" + -0.132*"youtube" + -0.125*"драма" + -0.114*"вайнона" -0.211*"любовь" + 0.174*"смотреть" + -0.155*"очень" + -0.153*"старый" + 0.140*"фильм" + -0.140*"пересматривать" + 0.128*"время" + 0.127*"актер" + -0.126*"рекомендовать" + -0.124*"человек" 0.295*"драма" + -0.136*"онлайн" + 0.130*"комедия" + -0.122*"русский" + -0.121*"фильм" + -0.120*"hd" + 0.119*"человек" + 0.113*"осень" + 0.111*"снова" + 0.107*"нью" 0.319*"драма" + 0.216*"бесплатно" + -0.180*"русский" + 0.179*"кино" + 0.151*"онлайн" + -0.145*"hd" + -0.127*"год" + -0.124*"ричард" + 0.120*"великобритания" + 0.120*"германия" 0.180*"кейн" + 0.178*"megogo" + -0.155*"качество" + 0.148*"работа" + 0.145*"видео" + 0.138*"бесплатно" + 0.133*"плечо" + 0.133*"руб" + 0.131*"отношение" + 0.128*"человек" -0.169*"сердце" + 0.132*"хороший" + -0.123*"in" + 0.113*"to" + 0.111*"how" + 0.111*"taught" + -0.110*"красивый" + -0.110*"время" + -0.106*"детский" + -0.099*"любовь" 0.305*"драма" + -0.190*"онлайн" + 0.123*"мелодрама" + 0.114*"красивый" + 0.113*"комедия" + 0.102*"1080p" + 0.101*"германия" + 0.101*"индия" + 0.101*"франция" + 0.100*"великобритания" 0.234*"бесплатно" + -0.187*"год" + -0.177*"шарлотта" + 0.170*"смотреть" + -0.161*"комментарий" + -0.150*"просмотр" + -0.135*"фильм" + 0.116*"2000" + 0.114*"приключенческий" + -0.106*"качество" -0.151*"шарлотта" + 0.145*"приключенческий" + 0.138*"боевик" + -0.135*"осень" + -0.130*"википедия" + 0.127*"уилл" + -0.126*"hd" + 0.124*"качество" + -0.123*"2000" + 0.117*"триллер" 0.306*"википедия" + 0.235*"операция" + 0.162*"шарлотта" + 0.153*"статья" + 0.153*"wikipedia" + -0.152*"hd" + 0.107*"сильный" + 0.101*"осень" + -0.100*"смотреть" + 0.100*"кейн" 0.174*"день" + -0.163*"hd" + -0.127*"гир" + -0.124*"оставаться" + 0.121*"поставлять" + 0.121*"становиться" + -0.114*"википедия" + -0.110*"zona" + -0.110*"w37" + -0.110*"plus" 0.219*"hd" + -0.180*"plus" + -0.180*"w37" + -0.180*"zona" + 0.179*"красавица" + 0.161*"привычный" + 0.120*"выбирать" + 0.114*"появляться" + -0.112*"шарлотта" + -0.112*"кин" 0.336*"plus" + 0.336*"zona" + 0.336*"w37" + -0.263*"hd" + -0.229*"сайт" + -0.227*"1080" + -0.223*"720" + -0.172*"качество" + 0.154*"хороший" + -0.121*"картина" -0.294*"megogo" + -0.269*") - " + -0.258*"york" + -0.258*"new" + -0.254*"autumn" + -0.250*"in" + -0.238*"ru" + -0.236*"нью-йорк" + -0.218*"смотреть" + 0.194*"2000" -0.457*".." + -0.296*"йорк" + 0.289*"ru" + -0.278*"нью" + 0.272*"нью-йорк" + 0.249*") - " + 0.229*"megogo" + 0.228*"онлайн" + 0.203*"бесплатно" + -0.179*"смотреть"
На корпусе топ20 lr=225, text=йога от боли в шее
<class 'gensim.models.lsimodel.LsiModel'>0.436*"шея" + 0.407*"плечо" + 0.381*"йога" + 0.211*"боль" + 0.209*"мышца" + 0.166*"упражнение" + 0.150*"осанка" + 0.149*"спина" + 0.148*"рука" + 0.146*"голова"-0.360*"плечо" + 0.289*"нога" + 0.229*"остеохондроз" + 0.224*"правый" + 0.219*"шейный" + 0.216*"рука" + -0.199*"шея" + 0.180*"левый" + 0.152*"ладонь" + 0.149*"позвоночник"-0.322*"йога" + 0.307*"плечо" + 0.253*"выдох" + 0.222*"рука" + -0.219*"шейный" + 0.213*"вдох" + -0.200*"отдел" + -0.176*"шея" + 0.164*"спина" + -0.140*"боль"-0.264*"остеохондроз" + 0.260*"голова" + 0.214*"боль" + 0.200*"положение" + -0.187*"плечо" + 0.182*"шея" + -0.155*"правый" + 0.155*"рука" + -0.152*"осанка" + -0.143*"стопа"-0.425*"упражнение" + 0.227*"пол" + -0.198*"йога" + -0.167*"мат" + -0.153*"образ" + 0.152*"боль" + 0.146*"позиция" + 0.120*"стопа" + 0.119*"шея" + 0.118*"позвоночник"0.271*"вьяяма" + 0.217*"поза" + -0.202*"боль" + 0.194*"асана" + 0.144*"немой" + 0.128*"дискомфорт" + 0.127*"каждый" + 0.119*"10" + 0.114*"подбородок" + 0.110*"овал"0.307*"мышца" + 0.266*"упражнение" + 0.250*"положение" + -0.227*"йога" + 0.178*"следовать" + 0.155*"состояние" + 0.155*"часть" + -0.151*"правый" + 0.149*"должный" + -0.141*"нога"-0.262*"плечо" + 0.216*"поза" + 0.208*"йога" + -0.193*"затем" + -0.179*"боль" + -0.162*"выполнять" + -0.143*"стопа" + -0.139*"рука" + -0.129*"упражнение" + -0.128*"ширина"-0.478*"поза" + -0.150*"упражнение" + 0.138*"выдох" + 0.137*"шейный" + 0.131*"мышца" + 0.123*"вдох" + 0.123*"отдел" + -0.113*"выполнять" + -0.111*"зона" + 0.108*"сторона"0.194*"поза" + 0.182*"позвоночник" + 0.159*"боль" + -0.156*"шея" + -0.144*"стопа" + -0.137*"положение" + -0.135*"позвонок" + 0.131*"средство" + -0.120*"практика" + -0.099*"мышца"
А я, больше, именно в этом плане, чтобы победить это:
Использованные материалы: gensim---------- Добавлено 01.10.2019 в 02:39 ----------
Ну да, Яндекс уже все сделал - подобрал экспертные документы как мог. А мы крохи с его стола подберем.
Другие (ПФ, ссылки, ...) факторы? Улучшим документные внутренние, глядишь и другие подтянутся
Это похоже, опять на синонимы. С терминами бы определиться.
Моя задача состоит в том, чтобы расширить готовый документ, с готовой статьей обвесом (aside, "последние новости", "с этим покупают", "хиты продаж", "картинки", "видео") с учетом, например, запрос "аксессуары для шкода октавия" в т.ч. имеет по LsiModel
-0.402*"рейлинг" -0.382*"дуга" -0.325*"комплект" -0.295*"крыша" -0.222*"багажник" -0.166*"крепление" -0.163*"нагрузка" -0.163*"евродеталь"
Понял, хотя никакого кода не выкладывал, кроме
for i in [1,2]: result.append(parse_(i))
Тут не о синонимах.
0.851*"осень"
0.354*"фильм"
0.261*"цитата"
-0.340*"афоризм"
документы об этом, прям сейчас в топ20 Яндекса по запросу осень (lr=225)
v#5 example.com/article/name-of- the-article.5432
v#6 example.com/theme-of-article/name-of-the-article/?
$urla = explode('?',$_SERVER['REQUEST_URI']); $this->rq['url'] = trim($urla[0], '/'); $this->docid = {md5/crc32/dechex(crc32($str))/...}($this->rq['url'])
v#7
$vv = 'theme-of-article/sub-theme/sub-sub-theme/name-of-the-article'; $va = explode('/', $vv); $l = $lid = []; echo "\n\n", $vv, "\n"; foreach($va as $k) { array_push($l, $k); $link = implode('/', $l); array_push($lid, crc32($link)); $linkid = implode('-', $lid); $breadcrumbid[$linkid] =[ 'id' => $linkid, 'url' => $link ]; } var_dump($breadcrumbid);
theme-of-article/sub-theme/sub-sub-theme/name-of-the-article array(4) { [615759439]=> array(2) { ["id"]=> string(9) "615759439" ["url"]=> string(16) "theme-of-article" } ["615759439-177373207"]=> array(2) { ["id"]=> string(19) "615759439-177373207" ["url"]=> string(26) "theme-of-article/sub-theme" } ["615759439-177373207-1493907639"]=> array(2) { ["id"]=> string(30) "615759439-177373207-1493907639" ["url"]=> string(40) "theme-of-article/sub-theme/sub-sub-theme" } ["615759439-177373207-1493907639-3339912280"]=> array(2) { ["id"]=> string(41) "615759439-177373207-1493907639-3339912280" ["url"]=> string(60) "theme-of-article/sub-theme/sub-sub-theme/name-of-the-article" } }
Вариантов много.
А куда способности тянут? Математика, физика, химия... Отсюда, мягко, но логично аргументируя намекать. Не давить. Пусть попробует. В конце концов, можно бросить, подготовиться, пересдать ег с плохими баллами и перезагрузиться.
Потраченное на репетиторов не пропадет. Человеку любые знания полезны. Хотя ворчал, за счета репетиторов, но считаю это лучшей инвестицией в жизни.
2 дитя учу, если что. За обоих - горжусь
никто не знал php примерно в 1991г (ассмб, си, тп5/6), а node.js не было всего несколько лет назад. И не факт что кто-то про них (php, go) через лет так 10 вспомнит. Может и вордпресс тогда будет на ноде или еще чем то, если вообще будет. Но, тервер и матан вечны.
Они немного разные. По мне так лучше от каждого лучшее взять. Гугла PageSpeed подскажет про отрисовку, избыточные css, структуру DOM и т.д. А Pingdom даст больше инфы по каждому отдельному File requests и еще кое что...
Не о движках. В данном контексте там интересны рассуждения о контенте (в их случае выдача, шире - любой контент документа) и обвесе (если правильно помню термин который использовался) - в их случае директ, маркет и т.д., а для любого другого сайта - да много всего может быть, кроме "с этим покупают" и 5/10/х последних новостей/статей. И о том, что обвес позволяет, с их точки зрения, дать более полный ответ на запрос пользователя.
Но, общий посыл моей тирады был в том, что, есть конвейер - ВП (собирательно), а есть реальные ( у каждого свои) требования к документу, приличную часть из которых на данном конвейере не запустишь.
ВП в контексте Форда? Серьезно😂
Т.е. и там и там конвейер - это соглашусь. Но,в случае с Фордом это работает лет 100 как минимум, а во втором говорят, что конвейер есть, а Форды не всегда выходят:
Уточню - элементарные, как раз более-менее поддерживают:
title = h1, article, breadcrumb, menu ( 100500 запросов и memory_get_usage )
а вот дальше:
Гибко хидеры, типа реальный ласт-модифаед (не time() - 86400 ) и т.д., опенграф и прочие меты, разные контентные зоны, управление js/css/картинко* , чтобы 100%, контекстные подборки и тд и тп, лень дальше, но кто интересуется - поищите рассуждения Сегаловича об обвесе выдачи (на роем вроде в комментах к чему то) и см. сообщения от сеошников в теме: 1 2 они плохого не насоветуют. В итоге большой ассоциативный массив в терминах зрз
*
1. как минимум
if( document.querySelector(".fa") ) { addcss('/assets/vendor/font-awesome-4/css/font-awesome.min.css');}
а не грузить по любому font-awesome/любимый слайдер/да и jquery не всегда нужен
2 .что мешает картинко сжать
switch( $this->type ) { case 'jpeg': case 'jpg': $cmd = 'jpegoptim ' . escapeshellarg($this->src) .' --strip-all --all-progressive -m76'; break; case 'png': $cmd = 'pngquant --strip --quality=65-85 --ext .png --force 256 ' . escapeshellarg($this->src); break;
По мне, так нельзя аргументировать тем, что "сайт обамы/трампа на вп и еще миллион сайтов". Это сегодня, а что будет актуально завтра?---------- Добавлено 09.09.2019 в 23:47 ----------Чет не туда походу, тут про танки