Ответ простой и однозначный - ЭТО реализовать НЕВОЗМОЖНО.
Один конкретный сайт (за некоторыми исключениями и в случае отсутствия противодействия) спарсить достаточно просто и стоить это будет не дорого. Но спарсить некий абстрактный сайт в вакууме и отфильтровать необходимое - невозможно, так как у всех разная разметка, логика, ошибки форматирования и т.д.---------- Добавлено 10.06.2018 в 15:40 ----------
Скажите откровенно (здесь все свои), этот ваш сайт наверняка был сделан на базе чужого контента? Правильно?
phpStorm/pyCharm, но тормозит на мощном компе (под линуксом, как там в винде - не знаю)
Antonio R, как я понял, сами тексты выкладываются на сайты суда не сразу, а с приличной задержкой. А сторонние сайты типа судебныерешения.рф скорей всего импортируют не всё подряд.
Думаю, не совсем так. Нарушение будет в том случае, если возможна ментальная ложная связь между проблемным ТЗ и рекламируемым товаром. Однако, если рекламный блок явно и однозначно отделен и путаница исключена, то нарушения может и не быть.
Прежде всего гляньте, что Гражданский кодекс подразумевает под термином "использование ТЗ". Использование - это маркировка знаком своей продукции. Если вы купите официально телефон Самсунг, сделаете его фотку и опубликуете обзор, то с вашей стороны нет "использования" ТЗ, в этом случае есть использование ТЗ производителем - ведь он нанес эту маркировку на свою продукцию, а не вы.
Нарушение будет только в том случае, если посетитель сайта может быть введен в заблуждение: продажа серой продукции, описание каких-нибудь хаков (про рутирование ничего на сайте нет?) и подобное. За фотки еще могут наказать, если вы какие-нибудь авторские фотки разместили. Но вашем случае есть еще большая вероятность, что к этому письму самсунг не имеет никакого отношения. Может быть конкуренты балуются?
А это и есть основная целевая аудитория. Профессионалу искусственный интеллект в поиске в большинстве случаев не нужен, он скорее вреден, профессионал сам сможет грамотно сформулировать запрос, чтобы найти строго то, что надо. Очевидно же, что после нововведений найти что-то конкретное стало значительно сложнее и в яндексе, и в гугле, постоянно приходится использовать кавычки в запросе, чтобы избавиться от обобщений. А вот для домохозяек такой поиск самое оно.
Поэтому от толоки наверно польза есть. Только в любом случае такие результаты напрямую нельзя использовать.
Результаты оценок Толоки не могут оказывать влияния на конкретные сайты/страницы. Это очевидно. Как понимаю, цель толоки даже не в (прямом) обучении алгоритмов, и это логично - никто в здравом уме толпе школьников такой рычаг не доверит. Цель скорей всего - дополнительная проверка качества алгоритмов.
Если буквально понимать пояснения гугла, то изменения касаются только индексирования и актуальны только для тех сайтов, которые для десктопной и мобильной версий выдают разный контент. Т.е. паук гугла будет обходить ваш сайт под юзерагентом смартфона, а не десктопа. Если ваш контент не зависит от устройств, то изменений никаких не должно произойти. Просто некотрые делают отдельную мобильную версию с урезанным контентом (относительно десктопной версии) - вот для них эти ихменения важны.
Мне не очень понятно, какое отношение хостинг сайта имеет ко всему этому? Реклама РСЯ на хостинге не размещается, а транслируется в браузеры посетителей напрямую с серверов РСЯ. Источником запрещенной информации хостинг, где размещен сайт, не является.
Только вот в случае агентского договора налоговая база возникает в момент поступления денег на счет агента.
Если агент не выплатит ИПэшнику деньги, то это не проблема налоговиков. Налог уже возник на стороне агента и ИПэшник его должен выплачивать.
Да, по кассовому методу налогооблагаемая база возникает с того, что упало на счет, только вот налоговики под этим счетом подразумевают счет агента, который действует от вашего имени.
Если у налоговиков запросите письменный ответ, то они скорей всего именно так ответят, но девочка в налоговой скорей всего в этом не разберется и ей будет проще считать в качестве налогоблагаемой базы тупо то, что упало на счет ИП, не делая поправку на агентские взаимоотношения.