Скорее всего так и есть, бывает и новые не все цепляет за раз. На оном сайте было точно так же. В глубине еще были страницы типа А, Б, В, Г... так весь алфавит, так он их через одну посчитал :)
Именно, лучше о структуре как следует подумать сразу и ничего не менять.
Все нашел алгоритм хороший, оч помогла функция котрую NetBot посоветовал.
Может ссылок поубавилось или у самих ссылок ПР поубавился?
Polter,
Причины разные, скажите конкретнее
Revan,
Много там мусора, хочется стерильно чтобы было :)
Блин, вот еще проблемка. Есть там такие пробелы для глаза, но никакими метода ми не удаляются т.е. их немогу найти ни как табуляцию, ни как пробел, ни как перенос строки... вообще непонятно что это за загадка :(
Ну раз теги убираются, то и переносы строк подавно. Чем я и занимаюсь, вот только есть там конструкции вообще жуткого вида, я только половину вычистил а уже 20 выражений регулярных. Под некоторые незнаю как писать, вот и хотелось еще на стадии перевода что-то более менее толковое, чтобы потом проще обрабатывать было :)
Пробовал ее, совсем что-то никакого толку. Правда у меня тадлиц немного, у меня основная проблема это жуткие абзацы, смотреть на них просто страшно и самое главное, что у него есть привычка лепить таблицы непонятно куда и непонятно зачем и еще хуже, бывает для списка он каждую цифру вставляет в отдельный span, со стилями в котором еще один спан и в нем пробелы, которые должны быть перед текстом :(
Жаль что програмки ни у кого нет, так как бред этот алгоритму не поддается, кое что удалось вычистить.
Но там есть такие конструкции, что можно только эпитетами описывать! 😡
А побольше можно получить у кого-то, лежа на диване?
Мне контентом больше нравится заниматься, чем ссылками :)
Однако если бы поисковики про это знали, то его стало бы значительно больше. Тем более контент имеет свойство накапливаться и требует помесячной оплаты, кстати он и не пропадает вместе с умершими сайтами, лежит себе и все :)