На самом деле я с Вами согласен. Если отбросить эмоциональное восприятие Ваших слов, вызванное скорее подачей материала чем его содержимым, то здравое зерно можно углядеть - возможность добавить в биржу ссылок свой сайт, подтвердить права владения и выставить на нем галочку - не позволять закупать на него ссылки неопределенному кругу лиц - для владельцев сайтов была бы интересная возможность. При условии одновременного внедрения на всех биржах. Но!
давайте теперь поставим себя на место менеджмента бирж. Народ хочет фишку X. Ок. Идем к владельцам биржи. Диалог:
-владелец: Сколько стоит внедрение этой фишки?
-менеджмент: XXX$
-владелец: Каков ROI?
-менеджмент: 8-[]
и вот тут выясняется что инвестиции не отбиваются, наоборот, в условиях сдувающегося рынка наоборот сужается целевая аудитория.
Вы предлагаете взывать к совести владельцев бирж? А почему Вы хотите взывать к их совести за их же собственные деньги?
Мои пять копеек - как быть с юзкейсом, в котором ссылки закупаются не на свои проекты а на размещенные статьи на чужих сайтах? Т.е. вполне легальная закупка ссылок на чужие ресурсы, распространенное явление в статейном продвижении.
Вы хотите лишить оптимизаторов такой возможности.
Мне пока на https сохраненка не попадалась. Ни разу. Тоже мониторю этот момент.
Нужный. Нужный софт обязательно надо покупать. А не нужный - лучше не брать.
Вас постановка вопроса не смущает? Как можно покупать софт, если Вы не знаете - зачем он Вам. А вот когда будете знать и у Вас будет несколько альтернатив, тогда и вопрос будет звучать иначе - "нужен софт для [action], остановился между выбором X и Y - что посоветуете"
ммм. Согласен, не смертельно. Почему то считал что бот сапы передает данные, сейчас проверил код - нет, только инициирует обновление базы.
Так что в худшем случае - слив всех ссылок/статей + легкий дос частыми обновлениями базы (под видом бота сапы), но не иньект левых ссылок в базу, как я предполагал, когда писал первое сообщение.
php файл где лежит? И зря вы свой хэш светите, ой зря.
ul - блочный элемент, без стилей он именно так и отражается, а у вас вся навигация на ul/li.
Нет, сеансовый ключ по любому нужен. Если ручные проверки - то это не проблема, если вопрос автоматизации - то да, надо делать на один запрос больше. Если раскроете суть проблемы - возможно смогу помочь - я немножко работаю над парсингом выдачи.
Да, кстати - по https сохраненки нет, как недавно выяснилось, так, на всякий случай.
Вот до этого момента согласен.
А вот тут реально непонятно. У ботов гугля и яндекса никаких плугинов нет, а вопрос стоит в том что увидят они ссылку или не увидят и если увидят - будет медаль за хитрожопость или нет. Каким боком вылезли плагины? Тем более что явление это нерегулярное, стоят не у всех пользователей и стоят они в разном количестве. Как наличие или отсутствие плагинов (даже таких распространенных как флеш) влияет на обсуждаемый нами вопрос?
Так я на экслюзив и не претендую, изначально моя реплика бурундуку в том и состояла что технически вообще никаких сложностей, чуть сложнее сделать это еще и экономически выгодным в промышленном использовании (проверка хотя бы на уровне сотен тысяч документов ежедневно).---------- Добавлено 20.10.2015 в 23:46 ----------
phantom.js - это программно управляемый web-kit, и как раз парсинг и построение dom так ровно то же самое, что в хроме/сафари, так что это реально не проблема. Если страница в хроме отображается, то и фантом ее распарсит. Проблема там в ресурсах - с этим посложнее, но решаемо.
Под виндой аналогично можно ie запрячь, тот же принцип.
По приведенной ссылке - да, динамичный контент не вытащит, но так ведь в рассматриваемом контексте - и не должен. Яша точно такую ссылку не увидит, за гугль не уверен, но я бы такое точно покупать не стал, а речь изначально о проверке купленных ссылок - любое сомнение трактуется в пользу покупателя, не?
Ок, прошу прощения если был слишком резок
Не ну не виндой единой... Есть же phantom с webkit, да и chromium приспособить тоже не теорему Пуанкаре решить, два высших не нужно
Это да, но так линейно и не надо решать.
Во первых можно без рендера в image посмотреть аттрибуты в построенном dom-дереве, например position и прочий getComputedStyle, но это сложноватый путь, там надо будет набивать руку и долго исправлять свои ошибки перед промышленным использованием.
Я вижу решение несколько иным.
Рендерим в картинку оригинал, меняем какие либо свойства исследуемой ссылки, снова рендерим в картинку оригинал, по изменениям вычисляем область расположения ссылки в картинке, если таковая нашлась и на найденную (маленькую) область либо натравливаем распознавалку либо, зная шрифт, цвет и размер - растеризуем текст и ищем в картинке по шаблону.
В общем - это все голословие, противником которого я являюсь. Убедили - начал писать код, хоть планы были несколько иные, за неделю думаю смогу выкатить прототип, предлагаю обсуждение темы отложить на этот срок.---------- Добавлено 20.10.2015 в 20:11 ----------
флеш не нужен, его уже и нормальные браузеры не поддерживают, а в остальном - html, js, css, svg+canvas - вполне.