alexverem

Рейтинг
229
Регистрация
12.10.2011
Xubart:
Боты в метрике отсекаются?
Их стало заметно больше как раз с конца февраля.

-Нужно какие-то настройки сделать?

- Боты это поисковые яндекс и гугл?

onep:
Да ладно ) А если так:

$url = '/;
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_USERAGENT,'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_HEADER, false);
$results = curl_exec ($ch);
curl_close($ch);

$doc = new DOMDocument();
@$doc->loadHTML($results);
$xpath = new DomXPath($doc);
$elements = $xpath->query('.//tr/td');
foreach ($elements as $i=>$element) {
echo $xpath->query($element->getNodePath().'/div')->item(0)->nodeValue.'<br />';
}

Не работает )

ок спасибо посмотрю, мне вообще один раз в сутки инфу брать, не гружу сервер, а то тут люди беспокоятся )

skapunker:
защита от ботов стоит, вот и все

А можно зашифроваться под юзера? Вроде стоит мозилла и тп в хедере

Anarchist:
Потому что дешевле, наверное. Спросите у них :D

У гугла 1200руб за миллион знаков, у яндекса пока не нашел стоимость

---------- Добавлено 13.02.2020 в 19:05 ----------

а во "на объем переводимого текста - в размере до 1 000 000 символов в сутки, но не более 10 000 000 символов месяц.", т.е. вроде немного бесплатно можно

спасибо всем, изучаю, даже не удобно как то ))

---------- Добавлено 13.02.2020 в 16:26 ----------

А что лучше никто не знает, гугл или яндекс? У кого есть опыт?

---------- Добавлено 13.02.2020 в 17:00 ----------

кстати tripadvisor использует PROMT, как думаете почему?

https://www.promt.ru/translation_software/corporate/promt-cloud-api/

ivan-lev:
Отчего бы не сделать тест.. и проверить?

делаю уже )

Sitealert:
Там сделано через добавление элемента HTML посредством javascript. Типа append. Только слегка замороченно.

Спасибо, мне верстальщик делает на ajax все-таки, посмотрел вроде рабочий вариант, так делают. Как думаете, есть недостатки? Или есть 100% опыт что все-таки такой вариант индексируется?

Спасибо всем за ответы! Но чего изобретать, в ссылке на tripadvisor есть рабочий вариант (проверил не идексируется), как сделано то там? ))

---------- Добавлено 10.02.2020 в 10:12 ----------

Еще, вот что у яндекса написано

Добавьте в код AJAX-страницы метатег meta name="fragment" content="!". В итоге HTML-версия этой страницы должна быть доступна по адресу с добавлением параметра ?_escaped_fragment_= (значение параметра пустое). Например: http://www.example.com/?_escaped_fragment_=.
Совет. Не размещайте метатег в HTML-версии страниц сайта — робот не сможет проиндексировать ее.

А нам как раз и нужно чтобы не проиндексировано было )) Кто-нибудь скажет как именно это работает? Или я путаю, и это касается страницы целиком? Ведь все таки meta ставится вроде в начале страницы

Samail:
Думаю document.write поисковики без проблем проиндексируют. Аяксом уже сложнее им будет и вариантов как не пустить бота к контенту, больше.

Спасибо всем за ответы, думаете write будет индексировать? мне кажется прочитает, но вряд ли будет выдавать в поиске?

---------- Добавлено 09.02.2020 в 18:29 ----------

кто нибудь понял как сделано в ссылке моей в примере? ajax?

---------- Добавлено 09.02.2020 в 18:31 ----------

проверил, у них не индексируется то, что спрятано, значит рабочий вариант

---------- Добавлено 09.02.2020 в 18:31 ----------

я про tripadvisor

---------- Добавлено 09.02.2020 в 18:31 ----------

Вот у них код, как думаете что это за реализация?

<span class="taLnk ulBlueLinks" onclick="widgetEvCall('handlers.clickExpand',event,this);">Еще</span>
Всего: 996