- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Для тех, кто увлекается валидаторами W3C и качеством контента! В декабре 2005 проверял и индексировал сайт, все было хорошо. В январе 2006 проверил снова LinkChecker-ом - обнаружил, что на каждой странице не работает одна ссылка, причем, как выяснилось - та, что в строке <!DOCTYPE ...>.
Линк полагалось изменить еще в августе 2002 согласно, например, http://www.w3.org/TR/xhtml1/xhtml1-diff.html#docconf, до конца 2005 URL'ы устаревших DTD поддерживалиь вебмастерами сайта www.w3.org, но в декабре - перестали существовать.
Вероятно, если есть DOCTYPE со ссылкой на DTD, возвращающий HTTP 404 Not Found, парсер робота может очень сильно обидеться. Успешно войдя в переписку с Я, комментарий по этой теме пока не получил.
Бедные сотрудники Яндекса. Какой только херни им вебмастера не пишут. 😂
IMHO Яндексу плевать на доктайп, равно и как на его полное отсутствие. Доктайпы - они для клиентов визуального отображения контента, а не его парисноговой обработки с целью вычленения текста и ссылок...
KLArk,
Это получается такой:
http://www.w3.org/TR/xhtml1/xhtml1-diff.html#docconf,
доктайп теперь не работает?
Я даже не знал про такие :)
IMHO Яндексу плевать на доктайп, равно и как на его полное отсутствие. Доктайпы - они для клиентов визуального отображения контента, а не его парисноговой обработки с целью вычленения текста и ссылок...
Да на URL в общем-то всем плевать, в том числе и клиентам визуального отображения.
Реально скачивать DTD может только валидирующий XML-парсер. Проделывать же подобную операцию с xhtml-документами никому в здравом уме не придет мысль.
Реально скачивать DTD может только валидирующий XML-парсер
К сожалению, как раз сейчас у меня под рукой нет последней версии исходника парсера Яндекса :) Посему, немогу точно сказать, как он анализирует контент, какой диалект языка HTML устанавливает by default!
Я просто предположил (возможно - ошибочно!), что если роботу сообщается язык и, может быть даже, местоположение DTD, что анализ контента и мета-тегов осуществляется с использованием четко регламентированного стандарта.
Признаю, очень большая вероятность того, что все вы правы - имеется! Посмотрим, что ответит Я, ведь наличие проблемы они уже признали и пообещали разобраться.
Segey,
http://www.w3.org/TR/xhtml1/xhtml1-diff.html#docconf,
Если сходите по этой ссылке, увидите, какой DTD правильный для XHTML 1.0 Tr... Зеленым цветом выделена как раз ссылка на DTD, что говорит о том, что это стало предметом изменения второй редакции стандарта XHTML 1.0 - в первой редакции ссылка на DTD была другой! Как раз имелось ввиду, что эта неверная ссылка на DTD ("http://www.w3.org/1999/xhtml/DTD/xhtml1-transitional.dtd" или "http://www.w3.org/TR/xhtml1/DTD/xhtml-transitional.dtd") до конца 2005 поддерживалась, но в январе 2006 - перестала существовать. Второй вариант у меня выдавал 404 ошибку несколько дней назад, а в начале декабря - все было нормально. Первый вариант сейчас выдает HTTP 300 Multiple Choices после долгого ожидания, что наводит на мысль!
Да тут не исходник парсера нужен, а немного здравого смысла и понимания, что такое на самом деле аббревиатура DTD означает.
Да тут не исходник парсера нужен, а немного здравого смысла и понимания, что такое на самом деле аббревиатура DTD означает.
Document Type Definision (DTD) - имхо - условно говоря язык, на котором написан документ. Или я не прав?
Document Type Definision (DTD) - имхо - условно говоря язык, на котором написан документ. Или я не прав?
Ну обозвать и так можно. По сути это один из способов записи синтаксических ограничений (наряду с XML Schema и RELAX NG) для XML-документов. К семантике документа это не имеет ни малейшего отношения, и в парсинге html/xhtml документов - применять это негде и незачем.
От Я ответов больше не получал. Но проблему они мою решили. Несколько часов назад сайт был-таки проиндексирован и попал даже по некоторым важным для меня запросам в Top-10. Возможно, я был не прав. Возможно, DTD никак не связан с парсингом сайтов Яndex-ом.
Для тех, кто сталкивается с проблемами индексации: Добавил сайт в AddURL в начале декабря. Отписал в суппорт о проблеме по истечении 5 недель. Получил ответ через день, а решение проблемы - через две недели. Сомневаюсь, что можно получить результат по проблемам быстрее. Короче - терпение, и еще раз - терпение!