Страха большого нет. Такое склеевает Яндекс нормально.
Позиции изменились +/- 1 , зато ссылок учло в этот АП.
Очень не сильно апнуло, хотя подождем до утра...
Gmp, отличный сервис, спасибо за ссылку
Вот накопал, может кому пригодится http://ru2.php.net/manual/en/book.tidy.php -умеет ковыряться в DOM струтуре
Алгоритм работы парсера в секрете?
Вообще, надо смотреть с каким серьём собирается ТС работать, может и регулярками обойтись можно. Но формально задача сложно-разрешимая, но есть уже готовые классы типа http://simplehtmldom.sourceforge.net/ которые помогут
whites, таким образом можно приблизительно понять что чего то не хватает и то не всегда (тонко намекаю <div class="sheet" boom="<p>" bam="<a>"> ПАПАНДОССС </div> ) ,но понять какой таг не закрыт не просто ( n-я вложенность элементов , где n может принимать любое разумное и не разумное значение )
Ладно, этот пример был из области тяжких извращений, вот проще, где ваша логика не работает:
<textarea name="formtextarea" > <p>Пример незакрытого тага <b>И ещё <i>Всё ведь валидно? </textarea>
а может так?
<!-- <p> Оппа! -->
понимать меня?
whites, я бы сказал что *на раз*. Тут дом-разборщик не слабый писать надо. Проще посмотреть валидатором кода, например http://users.skynet.be/mgueury/mozilla/
Если говорить о *правильном* WAP, то это не просто тему поправить у WP
http://ru.wikipedia.org/wiki/WML
http://kunegin.narod.ru/ref2/wap/wap8.htm