Среднестатистическая веб-страница

Мы, веб-разработчики, стараемся улучшить наш HTML-код, делая его понятным и легко читаемым. Мы делаем это в погоне за лучшей семантикой и доступностью, так чтобы каждый мог использовать его. Это - наш главный приоритет. И у нас всегда возникают вопросы:

  • Какой лучший способ структурирования разметки?
  • Как другие делают это?

Подобные вопросы постоянно интересуют нас. Хочется точно знать, как другие люди пишут разметки в эти дни, так как новые веб-технологии постоянно появляются. Таким образом, веб-разработчики из многих стран объединились с целью детального исследования, и в итоге они столкнулись с набором данных более чем с 8000000 страниц топ двадцатки результатов выдачи Google.

Исследования, проведенные ранее

Еще в 2005 году Ян Хиксон, редактор спецификации HTML5, сделал анализ образца примерно миллиарда документов, с целью увидеть из чего состоит сеть. Миллиард - это огромное количество, но для Google нет ничего невозможного. С такого огромного количества документов он вытащил ценную информацию о популярных именах классов, элементах, атрибутах и соответствующих метаданных. Выдающиеся результаты были позже опубликованы в качестве Web Authoring статистики, которая до сих пор является самым мощным исследованием веб-авторинга из когда-либо сделанных.

Более недавно, в 2008 году, благодаря анализу Метаданных Opera и Mining Application сканера, МАМА, в конечном итоге было проанализировано около 3500000 URL. Брайан Уилсон, автор этой впечатляющей работы, расширил исследования, публикуя результаты с подробным изложением структуры страниц, в том числе HTML, CSS и JavaScript.

Один из анализов с Web Authoring статистики, который впоследствии доказал свою важность в прогрессировании HTML5 разработки, был список самых популярных имен классов в этих HTML-документах. Сканер Opera MAMA также искал наиболее распространенные имена классов и в дополнение к результатам Google, они опубликовали релевантные результаты по популярным ID значений атрибутов к элементам.

Что это исследование добавляет к общему пониманию?

Данные для этого исследования выходят из 8,021,323 индексированных страниц, собранных из лучших двадцати результатов Google, используя около 30000000 ключевых слов, выбранных по их значению и объему. Мы запустили Google поиск для каждого из них и взяли URL-адреса для топ 20 результатов выдачи, добавили их в список и удалили дубликаты.

Мы можем только предположить, что соответствие этих веб-страниц к общему веб населению очень высока. Это основано на вероятности того, что эти сайты пользуются популярностью и имеют высокий трафик, поэтому они соизмеримы с их поисковыми результатами выдачи.

Насколько свежие эти данные?

Последний набор данных от 20 мая 2016 года.

Это новое исследование никогда не превзойдет предыдущее исследование Google, сделанное еще в 2005 году. Суть его также не в превосхождении большого исследования Opera. Речь идет о поиске новых и актуальных взглядов на фактическую разметку, которая используется наиболее популярными и успешными веб-страницами в Интернете.

Итак, как сегодня выглядит среднестатистическая страница HTML? Посмотрите на скриншоты ниже и оцените исследования для полной статистики.

Статистика

После проведенного исследования, было выяснений, что средняя индексируемая страница сайта использует двадцать шесть различных различных типов элементов.

Большинство веб-сайтов используют 26 различных HTML элементовс(плюс-минус несколько), и с интересным пиком в 9 элементов.

Двадцать шесть элементов используются на большинстве страниц, упорядоченных по частоте:

Неудивительно, что Head и HTML используются на всех сайтах. Немного странно, что Body является на 99% - возможно, был очень большой сайт с какой-то странной ошибкой? Также странно, что табличные элементы в нижней части списка до сих пор находятся на почти трети всех сайтов.

Среди описаний типов документов (document type declarations), которые определяют, какая версия (X) HTML страницы используется, последняя HTML5 doctype явно лидирует. Doctype - это самая первая строка HTML документа, которая определяет, какую версию (X) HTML страница использует:

Почти две трети всех сайтов декларируют себя на HTML5.

HTML, который известен как корневой элемент, обволакивает содержимое веб-страницы и его можно найти сразу после объявления doctype. Метаданные содержат такую ??информацию о странице, как стили, скрипты и данные, чтобы помочь поисковым системам или браузерам использовать и отображать страницы.

Если мы посмотрим на все элементы, которые конкретно указывают браузеру и поисковым системам сайта на то, как сайт стилизовать, мы узнаем о примерно 175 000 000 элементов, а вот как они процентно расположились:

Контент секционирования

Элементы контент секционирования позволяют организовать контент на логические части. Разбивка 105000000 элементов на секционирования контента выглядит следующим образом:

H3 являются наиболее популярными элементами заголовков и элементами общего контент секционирования.

Элементы текстового контента полезны для организации контента в пределах body, и они помогут вам определить цель этого контента.

DIV имеет явное лидирство.

Какое будущее сети?

Американские веб-разработчики и создатели веб-контента заинтересованы в использовании, статистике и поддержке браузера. Это те вещи, которые привели к именам классов полученных в 2005 году, имен, известных на сегодняшний день как наиболее популярные HTML5 теги.

Сеть развивается быстро. Тенденции меняются из года в год и мы, как создатели веб-контента, понимаем, сколько мотивации и усилий нужно приложить, чтобы оставаться в курсе последних событий. Подумайте над тем, как разметка и средняя веб-страница выглядели десять лет назад, и как современная веб-страница выглядит сегодня.

Веб-компоненты - это HTML-связанная технология, которая позволяет, по сути, создавать и использовать собственные элементы, как будто это обычная HTML. Кроме того, вы можете даже создавать собственные версии стандартных HTML-элементов.

Никто не может предсказать будущее. Мы можем только догадываться, как среднестатистическая веб-страница будет выглядеть через десять лет с этого момента. В следующий раз мы проводим это исследование (мы рассматриваем ежеквартально), увидим ли мы такие вещи, как рост веб-компонентов?