Руководитель Группы ФО, вспоминая ваше участие в недавней теме, предлагаю вам посмотреть на ситуацию по-философски :) Отдел "К" просто нашел багу у вашего друга. Предупрежден - вооружен теперь :)
http://validator.w3.org/
Сейчас посмотрел по ЛИ за июль:
Не умерла значит :) Но у меня на сайтах ее уже пару лет почти нет.
сеrt-gib.ru = Group IB
Их понты обоснованы :) А что пишут, если не секрет?
Можете попробовать OWOX, но по сути это аналог того же CostUP. Забавная статья, как можно сделать самому выгрузку.
noiws, это могут быть боты. Если бы было >5%, то логичнее было бы их отправлять на "версию для печати". Когда еще была жива Opera Mini, мы делали общую облегченную версию без графики и лукавств, обзывали ее как "версия для печати". Также мне знаком человек, который отправлял такой трафик на страницу с "обновите браузер", где попутно впаривался тулбар :) В остальном присоединяюсь в предыдущим ораторам - нет, не стоит. Но допускаю специфику, когда это может быть ценный трафик. Но 2% - это точно ни о чем, т.к. ботов обычно в трафике больше.
Продолжаем нашу добрую традицию по еженедельному добавлению новых локаций для вас. В счет пропущенных недель представляем сразу несколько стран:
Молдавия (Кишинев) - дата-центр с пятилетней историей. Полностью независимый - IP транзит не происходит только через одну компанию. Инфраструктура основана на нескольких апстрим провайдерах и пирах. Используют 3 крупнейших ISP в Молдове. Являются LIR-ом в RIPE NCC и это гарантирует отстувие проблем с IPs.
Intel Core i5 4430, 2 x 3 TB HDD, 8 GB RAM, 169$ Заказать!
Intel Core i7 4770, 2 x 3 TB HDD, 8 GB RAM, 137$ Заказать!
Египет(Эль-Ашир-мин-Рамадан) - высокотехнологичный дата-центр в Африке, подключенный непосредственно к опорной сети. Новейшая система ИБП позволяет достигать наивысшего аптайма. Отличные решения как для бюджетных, так и для крупных проектов.
Intel Pentium E5500 2.80 GHz, 500 GB HDD, 2 GB RAM, 70$ Заказать!
Intel Core i3 2100, 2 x 500 GB HDD, 8 GB RAM, 130$ Заказать!
Intel Quad Core Xeon E5530, 2 x 500 GB HDD, 16 GB RAM, 280$ Заказать!
Франция(Бретань) - является членом RIPE, ARCEP и April. Дата-центр помогает справляться с DDoS атаками, а также предоставляет IP/KVM для некоторых из своих машин. Бюджетные цены на популярные конфигурации.
Intel Atom 230, 30 GB SSD, 1 GB RAM, 18$ Заказать!
AMD Dual-Core E350, 2 x 500 GB HDD, 8 GB RAM, 30$ Заказать!
AMD Athlon II X2, 2 x 1 TB HDD, 8 GB RAM, 42$ Заказать!
Австрия (Вена) - до 10-ти Гбит безлимитного подключения в центре Европы, один из самых надежных дата-центров. Сервера выдаются в течение пары суток.
Intel Dual Xeon 5520, 2 x 3 TB HDD, 72 GB RAM, 369$ Заказать!
Intel Xeon E5-2603, 2 x 3 TB HDD, 64 GB RAM, 588$ Заказать!
Intel Xeon E5-2603, 4 x 3 TB HDD, 64 GB RAM, 10 Gbit unmetered 777$ Заказать!
Швейцария (Рихтерсвиль) - fail-safe инфраструктура обеспечивает высочайший аптайм в самом сердце Европы. Огромнейший выбор конифгов.
Intel Atom D525, 2 x 500 GB HDD, 4 GB RAM, 60$ Заказать!
AMD FX6300, 2 x 1 TB HDD, 4 GB RAM, 122$ Заказать!
AMD 2x Opteron 6128, 3 x 3 TB HDD, 80 GB RAM, 400$ Заказать!
Также напоминаем вам о том, что на виртуальные сервера XEN есть возможность установки полноценного VNC-бекофис пресета, включающего в себя практически все, что необходимо для удобной работы:
Linux 3.2.46, Debian 7.5 Wheezy + MATE Desktop Environment 1.8.0, KeePassX 0.4.3, Chromium 34.0, ownCloud Desktop Sync Client 1.6.1, Pidgin 2.10.9
Ваш личный удаленный офис, доступный 24 часа в сутки! (по требованию бесплатно устаналиваем дополнительный софт)
ENXVPS1, 400 CPU, 10 GB HDD, 512 MB RAM, 8$ Заказать!
ENXVPS2, 500 CPU, 20 GB HDD, 512 MB RAM, 18$ Заказать!
ENXVPS3, 800 CPU, 30 GB HDD, 768 MB RAM, 22$ Заказать!
Делайте так, как делают многие агрегаторы. Собирайте ботом, но сабмит на свой сайт ведите от имени пользователей. UGC, все дела :)
Если уже есть сайт, то почему не ориентироваться от вашего трафика (в той же метрике -> мобильные устройства)? Как мне кажется, в новой версии вашего сайта логичнее подключить bootstrap и сделать адекватную верстку блоками, а не делать шесть разных мобильных версий :) В целом, можете обратить внимание на этот мой пост, где я уже частично раскрыл вопрос.
vl273, для того чтобы ответить на этот вопрос, вам нужно понять как работает поисковый робот, будь то GoogleCrawl или робот Яндекса. Ну и узнать, что такое валидация и ее значение :) Хорошим примером здесь будет вот этот:
Или можно было вас отправить в FAQ Гугла по индексированию мультимедийных файлов :)
Но лучше все это подтвердить не нашими с вами догадками, а... Патентами Гугла! "Document segmentation based on visual gaps" можно перевести как "Сегментация документов на основе видимых промежутков", там нас интересуют следующие места:
По сути эти два абзаца и отвечают на ваш вопрос. Попробую перевести их:
[0038] В ситуациях, когда документ 500 является веб-страницей, он может быть создан с помощью языка разметки, например, HTML. Конкретные элементы и стили HTML, используемые для макета различных веб-страниц, могут значительно варьироваться. Несмотря на то, что HTML основан на иерархической объектной модели документа (DOM), иерархия DOM не обязательно свидетельствует о визуальном макете или визуальной сегментации документа.
[0039] Компонент сегментации 230 может создать визуальную модель кандидата (акт 403). Визуальная модель может быть основана на видимых промежутках или разделителях в документе, таких как пробелы. В контексте HTML различным его элементам могут быть назначены различные веса (их численные значения), которые определят количество разделителей для конечного документа. В одном случае, большие веса будут соответствовать большим разделителям. Веса могут быть определены различными способами. Например, в результате субъективного анализа элементов в HTML-документе, которые визуально разделяют документы. На основе этого субъективного анализа вес может быть назначен, а затем изменен (оптимизирован), пока документы не будут приемлимо сегментированы. Могут быть использованы и другие технологии генерации веса, на основе анализа поведения и исходного кода веб-браузеров или с использованием "ручного сегментирования" веб-страниц с последующей автоматической расстановкой весов через процесс машинного обучения.
А в целом советую прочитать замечательные статьи (правда они на английском): GoogleBot - это Хром, Как Гугл собирается проиндексировать весь мир? и "Насколько умны поисковые роботы?". Придет необходимое в нашей работе понимание, как и чего работает, чтобы не сделать ложных выводов.