Ленивое Z

Ленивое Z
Рейтинг
106
Регистрация
27.08.2007
seogearbox:
ой зря

а что произойдёт в худшем случае?

Serg_CS:
Ленивое Z, ваш пример тривиально детектится

Наверное, вариант, да

87793:
Разные ссылки могут и на одном сайте по-разному размещаться

В смысле ссылки разных бирж?) Ну может быть.

seogearbox:
Убедили - начал писать код

Не стоит, трясина) И я не убеждал.

Если уж всё равно переводить в картинку, то проще всю страницу туда загонять и её уже в текст переводить. Готовое решение у меня есть в принципе где-то, с десктопа оно работает со старым абордажным Finereader 8, но для приличного сервиса надо лицензию покупать, а они сами не знают, сколько хотят за неё и даже на тестовый период пытаются какие деньги сорвать за распознавание, а у меня жаба и мы с ней дружим.

seogearbox:
Вы сейчас что хотите проверить? Мои знания html?

Не, зачем мне ваши знания по html, я хотел узнать как вы через объект browser решите простую задачу. Без всяких вот подколок и задних мыслей.

seogearbox:
Давайте тогда уже весь html, js и css.

Да он и был весь код. Ну можно вот так:

<!DOCTYPE html>

<html>
<head>
<meta charset="utf-8">
</head>
<body>
<div>
<a href="/" style="position:absolute; z-index:1" >Ссылка 1</a>
<img src="http://img.forumimg.net/design/forum-header-inside.png" style="position:absolute; z-index:2">
</div>
<br/>
<br/>
<br/>
<br/>
<div>
<a href="/" style="position:absolute; z-index:1" >Ссылка 2</a>
</div>
<br/>
<br/>
<br/>
<br/>
<div>
<a href="/" style="position:absolute; z-index:1" >Ссылка 3</a>
<img src="http://img.forumimg.net/design/menu_hl.png" style="position:absolute; z-index:2">
</div>
</body>
</html>
seogearbox:
Во что не верится - на движке броузера отрендерить картинку и проверить ее?

Нет, как пользоваться объектом WebBrowser я представляю, я не представляю как вы через него определите видимость ссылок на странице из примера. И поиском по содержимому страницы, и поиском по исходному коду у вас все три ссылки будут видимыми, а по факту нет. И это самый простой пример.

seogearbox:
Именно ее видимость, то есть видимость определенного тега с определенными аттрибутами.

Не особо, конечно, верится.

Вот в ссылках ниже есть скрытые?

<div>

<a href="/" style="position:absolute; z-index:1" >Ссылка 1</a>
<img src="http://img.forumimg.net/design/forum-header-inside.png" style="position:absolute; z-index:2">
</div>
<br/>
<br/>
<br/>
<br/>
<div>
<a href="/" style="position:absolute; z-index:1" >Ссылка 2</a>
</div>
<br/>
<br/>
<br/>
<br/>
<div>
<a href="/" style="position:absolute; z-index:1" >Ссылка 3</a>
<img src="http://img.forumimg.net/design/menu_hl.png" style="position:absolute; z-index:2">
</div>
ship:
почему доход за месяц по матрице продаж показывает больше, чем доход за день, умноженный на 30 или 31 день?

- в Матрице продаж отражены ваши цены, а суточные начисления идут за вычетом комиссии Маинлинк.

- "проблемные" ссылки не оплачиваются и в суточных начислениях отсутствуют, а в матрице продаж они есть.

- ссылка может быть с помесячной оплатой и начисления были в один из предыдущих дней месяца. В сегодняшних начислениях они отсутствуют, а в матрице продаж такие ссылки учтены.

seogearbox:
построю проверку на основании показаний настоящего броузера

В результате проверки что будет выдаваться: "видна ли ссылка на странице" или "ссылка есть в коде страницы"?

burunduk:
не прокатит - для этого для начала нужно получить полный скриншот страницы

Да элементарно, двумя строчками кода (ну в asp.net по-крайней мере так).

Третьей строчкой переводим grayscale

Четвертой понижаем контрастность (чтобы отсечь ссылки, близкие к цвету фона).

Пятой строчкой скармливаем картинку библиотеке файнридера.

Шестой строчкой проверяем наличие текста ссылки в распознанном тексте.

И не обязательно все ссылки с сайта проверять - достаточно одной, чтобы понять в каком виде ссылки размещаются.

burunduk:
а вот полностью рабочей библиотеки для построения dom по кривому html - ещё ни кто не смог написать

Не обязательно же на этом зацикливаться. Можно взять готовое решение типа finereader и им дублировать проверку визуального наличия ссылки на странице. Вполне себе рабочее решение, я лет семь назад так газеты по объявлениям недвижимости из соседнего города сканировал и выкладывал на сайт. На ура справляется с колонками. Для упырей, которые захотят ссылку картинкой генерировать будет проверка по html.

awasome:
Все равно заагсит.

Вы сейчас о чем? Вообще про ссылки или про ссылки на сайты с проститутками? Если вообще, то да, у всех сайтов, торгующих ссылками, есть риск нарваться на АГС. Только кто-то нарывается, а кто-то нет.

Всего: 2209