vkusnoserver

vkusnoserver
Рейтинг
104
Регистрация
30.04.2011
Должность
Хостер

Руководитель Группы ФО, вспоминая ваше участие в недавней теме, предлагаю вам посмотреть на ситуацию по-философски :) Отдел "К" просто нашел багу у вашего друга. Предупрежден - вооружен теперь :)

Vladsinna7:
А как это валидный и не валидный? А то я прочитал, но так и не понял...

http://validator.w3.org/

domen4you:
она тоже умерла?) Там побольше чем 2 процента, думаю

Сейчас посмотрел по ЛИ за июль:

Opera Mini 7,273,839 5.9% 7,461,141 6.0% 7,585,676 6.1%

Не умерла значит :) Но у меня на сайтах ее уже пару лет почти нет.

сеrt-gib.ru = Group IB

Их понты обоснованы :) А что пишут, если не секрет?

Можете попробовать OWOX, но по сути это аналог того же CostUP. Забавная статья, как можно сделать самому выгрузку.

noiws, это могут быть боты. Если бы было >5%, то логичнее было бы их отправлять на "версию для печати". Когда еще была жива Opera Mini, мы делали общую облегченную версию без графики и лукавств, обзывали ее как "версия для печати". Также мне знаком человек, который отправлял такой трафик на страницу с "обновите браузер", где попутно впаривался тулбар :) В остальном присоединяюсь в предыдущим ораторам - нет, не стоит. Но допускаю специфику, когда это может быть ценный трафик. Но 2% - это точно ни о чем, т.к. ботов обычно в трафике больше.

Продолжаем нашу добрую традицию по еженедельному добавлению новых локаций для вас. В счет пропущенных недель представляем сразу несколько стран:

Молдавия (Кишинев) - дата-центр с пятилетней историей. Полностью независимый - IP транзит не происходит только через одну компанию. Инфраструктура основана на нескольких апстрим провайдерах и пирах. Используют 3 крупнейших ISP в Молдове. Являются LIR-ом в RIPE NCC и это гарантирует отстувие проблем с IPs.

Intel Core i5 4430, 2 x 3 TB HDD, 8 GB RAM, 169$ Заказать!

Intel Core i7 4770, 2 x 3 TB HDD, 8 GB RAM, 137$ Заказать!

Египет(Эль-Ашир-мин-Рамадан) - высокотехнологичный дата-центр в Африке, подключенный непосредственно к опорной сети. Новейшая система ИБП позволяет достигать наивысшего аптайма. Отличные решения как для бюджетных, так и для крупных проектов.

Intel Pentium E5500 2.80 GHz, 500 GB HDD, 2 GB RAM, 70$ Заказать!

Intel Core i3 2100, 2 x 500 GB HDD, 8 GB RAM, 130$ Заказать!

Intel Quad Core Xeon E5530, 2 x 500 GB HDD, 16 GB RAM, 280$ Заказать!

Франция(Бретань) - является членом RIPE, ARCEP и April. Дата-центр помогает справляться с DDoS атаками, а также предоставляет IP/KVM для некоторых из своих машин. Бюджетные цены на популярные конфигурации.

Intel Atom 230, 30 GB SSD, 1 GB RAM, 18$ Заказать!

AMD Dual-Core E350, 2 x 500 GB HDD, 8 GB RAM, 30$ Заказать!

AMD Athlon II X2, 2 x 1 TB HDD, 8 GB RAM, 42$ Заказать!

Австрия (Вена) - до 10-ти Гбит безлимитного подключения в центре Европы, один из самых надежных дата-центров. Сервера выдаются в течение пары суток.

Intel Dual Xeon 5520, 2 x 3 TB HDD, 72 GB RAM, 369$ Заказать!

Intel Xeon E5-2603, 2 x 3 TB HDD, 64 GB RAM, 588$ Заказать!

Intel Xeon E5-2603, 4 x 3 TB HDD, 64 GB RAM, 10 Gbit unmetered 777$ Заказать!

Швейцария (Рихтерсвиль) - fail-safe инфраструктура обеспечивает высочайший аптайм в самом сердце Европы. Огромнейший выбор конифгов.

Intel Atom D525, 2 x 500 GB HDD, 4 GB RAM, 60$ Заказать!

AMD FX6300, 2 x 1 TB HDD, 4 GB RAM, 122$ Заказать!

AMD 2x Opteron 6128, 3 x 3 TB HDD, 80 GB RAM, 400$ Заказать!

Также напоминаем вам о том, что на виртуальные сервера XEN есть возможность установки полноценного VNC-бекофис пресета, включающего в себя практически все, что необходимо для удобной работы:

Linux 3.2.46, Debian 7.5 Wheezy + MATE Desktop Environment 1.8.0, KeePassX 0.4.3, Chromium 34.0, ownCloud Desktop Sync Client 1.6.1, Pidgin 2.10.9

Ваш личный удаленный офис, доступный 24 часа в сутки! (по требованию бесплатно устаналиваем дополнительный софт)

ENXVPS1, 400 CPU, 10 GB HDD, 512 MB RAM, 8$ Заказать!

ENXVPS2, 500 CPU, 20 GB HDD, 512 MB RAM, 18$ Заказать!

ENXVPS3, 800 CPU, 30 GB HDD, 768 MB RAM, 22$ Заказать!

Делайте так, как делают многие агрегаторы. Собирайте ботом, но сабмит на свой сайт ведите от имени пользователей. UGC, все дела :)

Если уже есть сайт, то почему не ориентироваться от вашего трафика (в той же метрике -> мобильные устройства)? Как мне кажется, в новой версии вашего сайта логичнее подключить bootstrap и сделать адекватную верстку блоками, а не делать шесть разных мобильных версий :) В целом, можете обратить внимание на этот мой пост, где я уже частично раскрыл вопрос.

vl273, для того чтобы ответить на этот вопрос, вам нужно понять как работает поисковый робот, будь то GoogleCrawl или робот Яндекса. Ну и узнать, что такое валидация и ее значение :) Хорошим примером здесь будет вот этот:

Или можно было вас отправить в FAQ Гугла по индексированию мультимедийных файлов :)

Но лучше все это подтвердить не нашими с вами догадками, а... Патентами Гугла! "Document segmentation based on visual gaps" можно перевести как "Сегментация документов на основе видимых промежутков", там нас интересуют следующие места:

“[0038] In situations in which document 500 is a web page, document 500 may be generated using a markup language, such as HTML. The particular HTML elements and style used to layout different web pages varies greatly. Although HTML is based on a hierarchical document object model (DOM), the hierarchy of the DOM is not necessarily indicative of the visual layout or visual segmentation of the document.” [emphasis added]

“[0039] Segmentation component 230 may generate a visual model of the candidate document (act 403). The visual model may be particularly based on visual gaps or separators, such as white space, in the document. In the context of HTML, for instance, different HTML elements may be assigned various weights (numerical values) that attempt to quantify the magnitude of the visual gap introduced into the rendered document. In one implementation, larger weights may indicate larger visual gaps. The weights may be determined in a number of ways. The weights may, for instance, be determined by subjective analysis of a number of HTML documents for HTML elements that tend to visually separate the documents. Based on this subjective analysis weights may be initially assigned and then modified (“tweaked”) until documents are acceptably segmented. Other techniques for generating appropriate weights may also be used, such as based on examination of the behavior or source code of Web browser software or using a labeled corpus of hand-segmented web pages to automatically set weights through a machine learning process.” [emphasis added]

По сути эти два абзаца и отвечают на ваш вопрос. Попробую перевести их:

[0038] В ситуациях, когда документ 500 является веб-страницей, он может быть создан с помощью языка разметки, например, HTML. Конкретные элементы и стили HTML, используемые для макета различных веб-страниц, могут значительно варьироваться. Несмотря на то, что HTML основан на иерархической объектной модели документа (DOM), иерархия DOM не обязательно свидетельствует о визуальном макете или визуальной сегментации документа.

[0039] Компонент сегментации 230 может создать визуальную модель кандидата (акт 403). Визуальная модель может быть основана на видимых промежутках или разделителях в документе, таких как пробелы. В контексте HTML различным его элементам могут быть назначены различные веса (их численные значения), которые определят количество разделителей для конечного документа. В одном случае, большие веса будут соответствовать большим разделителям. Веса могут быть определены различными способами. Например, в результате субъективного анализа элементов в HTML-документе, которые визуально разделяют документы. На основе этого субъективного анализа вес может быть назначен, а затем изменен (оптимизирован), пока документы не будут приемлимо сегментированы. Могут быть использованы и другие технологии генерации веса, на основе анализа поведения и исходного кода веб-браузеров или с использованием "ручного сегментирования" веб-страниц с последующей автоматической расстановкой весов через процесс машинного обучения.

А в целом советую прочитать замечательные статьи (правда они на английском): GoogleBot - это Хром, Как Гугл собирается проиндексировать весь мир? и "Насколько умны поисковые роботы?". Придет необходимое в нашей работе понимание, как и чего работает, чтобы не сделать ложных выводов.

Всего: 1115