а что произойдёт в худшем случае?
Наверное, вариант, да
В смысле ссылки разных бирж?) Ну может быть.
Не стоит, трясина) И я не убеждал.
Если уж всё равно переводить в картинку, то проще всю страницу туда загонять и её уже в текст переводить. Готовое решение у меня есть в принципе где-то, с десктопа оно работает со старым абордажным Finereader 8, но для приличного сервиса надо лицензию покупать, а они сами не знают, сколько хотят за неё и даже на тестовый период пытаются какие деньги сорвать за распознавание, а у меня жаба и мы с ней дружим.
Не, зачем мне ваши знания по html, я хотел узнать как вы через объект browser решите простую задачу. Без всяких вот подколок и задних мыслей.
Да он и был весь код. Ну можно вот так:
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> </head> <body> <div> <a href="/" style="position:absolute; z-index:1" >Ссылка 1</a> <img src="http://img.forumimg.net/design/forum-header-inside.png" style="position:absolute; z-index:2"> </div> <br/> <br/> <br/> <br/> <div> <a href="/" style="position:absolute; z-index:1" >Ссылка 2</a> </div> <br/> <br/> <br/> <br/> <div> <a href="/" style="position:absolute; z-index:1" >Ссылка 3</a> <img src="http://img.forumimg.net/design/menu_hl.png" style="position:absolute; z-index:2"> </div> </body> </html>
Нет, как пользоваться объектом WebBrowser я представляю, я не представляю как вы через него определите видимость ссылок на странице из примера. И поиском по содержимому страницы, и поиском по исходному коду у вас все три ссылки будут видимыми, а по факту нет. И это самый простой пример.
Не особо, конечно, верится.
Вот в ссылках ниже есть скрытые?
<div> <a href="/" style="position:absolute; z-index:1" >Ссылка 1</a> <img src="http://img.forumimg.net/design/forum-header-inside.png" style="position:absolute; z-index:2"> </div> <br/> <br/> <br/> <br/> <div> <a href="/" style="position:absolute; z-index:1" >Ссылка 2</a> </div> <br/> <br/> <br/> <br/> <div> <a href="/" style="position:absolute; z-index:1" >Ссылка 3</a> <img src="http://img.forumimg.net/design/menu_hl.png" style="position:absolute; z-index:2"> </div>
- в Матрице продаж отражены ваши цены, а суточные начисления идут за вычетом комиссии Маинлинк.
- "проблемные" ссылки не оплачиваются и в суточных начислениях отсутствуют, а в матрице продаж они есть.
- ссылка может быть с помесячной оплатой и начисления были в один из предыдущих дней месяца. В сегодняшних начислениях они отсутствуют, а в матрице продаж такие ссылки учтены.
В результате проверки что будет выдаваться: "видна ли ссылка на странице" или "ссылка есть в коде страницы"?
Да элементарно, двумя строчками кода (ну в asp.net по-крайней мере так).
Третьей строчкой переводим grayscale
Четвертой понижаем контрастность (чтобы отсечь ссылки, близкие к цвету фона).
Пятой строчкой скармливаем картинку библиотеке файнридера.
Шестой строчкой проверяем наличие текста ссылки в распознанном тексте.
И не обязательно все ссылки с сайта проверять - достаточно одной, чтобы понять в каком виде ссылки размещаются.
Не обязательно же на этом зацикливаться. Можно взять готовое решение типа finereader и им дублировать проверку визуального наличия ссылки на странице. Вполне себе рабочее решение, я лет семь назад так газеты по объявлениям недвижимости из соседнего города сканировал и выкладывал на сайт. На ура справляется с колонками. Для упырей, которые захотят ссылку картинкой генерировать будет проверка по html.
Вы сейчас о чем? Вообще про ссылки или про ссылки на сайты с проститутками? Если вообще, то да, у всех сайтов, торгующих ссылками, есть риск нарваться на АГС. Только кто-то нарывается, а кто-то нет.