Используемые символы
А теперь обратимся к политике используемых символов в HTML. Как известно, в компьютерах каждый символ все-таки на самом деле является неким числом. И операционная система при дакэбражеши текста выводит уже символ, соответствующий какому-либо числу. Таблица соответствия чисел и символов называется кодировкой. Но дело в том, что кодировок только для русскоязычных символов уже не менее пяти. И если браузер не распознает, какая кодировка использована гфи создании Web-страницы, то вместо текста пользователь увидит мешанину непонятных символов. Каждый, наверное, с этим встречался. Поэтому в каждый браузер встроена функция смены кодировки отображаемой Web-страницы. Однако язык HTML обладает возможностями указания используемой кодировки, чтобы браузер не пытался распознать ее самостоятельно. Для этих целей используется уже знакомый нам тег <meta>. Дело в том, что среди предбпределенных переменных протокола HTTP есть переменная с наименованием Сontent-Type. Она задает тип содержимого Web-страницы и дополнительно позволяет указывать наименование применяемой кодировки. Полностью соответствующая конструкция выглядит так:
<МЕТА. http-equiv="Content-Type" content="text/html;
charset=ISO-8858-5">
В приведенном примере видно, что значение переменной состоит из двух частей, разделенных знаком точки с запятой. Первая часть говорит о том, что данный документ является обычным текстом с тегами HTML, а вторая часть указывает используемую кодировку. При этом использование слова charset является обязательным. А, после знака равенства указывается уже само название кодировки. В примере использовано стандартная кодировка, утвержденная Международной Организацией по Стандартизации (ISO) с поддержкой кириллицы. Однако вместо нее можно использовать стандартную кириллическую кодировку Windows или КОИ-8.
Также следует указать, что браузеры не могут обычным порядком отображать некоторые символы, которые встречаются в тексте. Так, если браузер в тексте встретит знак неравенства "меньше", то он просто интерпретирует его как открывающую скобку для тега.
А так как стандартного тега за этим знаком не последует, то некоторая часть текста будет просто проигнорирована и не отображена. Более того, некоторые специализированные европейские символы просто отсутствуют на клавиатуре, и их будет затруднительно .вставить в текст содержимого Web-страницы. Проблему необходимо было решить. И выход был найден.
Вместо самих символов в текст подставлялись последовательности, которые можно было уже нормально интерпретировать. Так, знак неравенства "меньше", он же — открывающая угловая скобка, заменяется на последовательность ⁢, В данном случае вся последовательность заключена в кавычки, начинается она со знака амперсанта, а заканчивается знаком точки с запятой. Подобные последовательности перекочевали и в язык следующего поколения — XML, и получили название "eatities", что в русскоязычной литературе переводят как "сущности". Перевод, конечно, правильный, но, к сожалению, ничуть не разъясняет суть дела. Проще и, наверное, правильней называть эти сущности текстовыми подстановками. Список текстовых подстановок используемых в HTML приведен в табл. 1.1.
Таблица 1.1. Текстовые подстановки
Символы | Описание |
< | Знак неравенства "меньше" (<) |
> ; |
Знак неравенства "больше" (>), |
& | Знак амперсанта (&) |
" | Знак кавычек |
À | Прописная А, тупое ударение |
Á | Прописная А, сильное ударение |
 | Прописная А, диакритическое ударение |
à | Прописная А, тильда |
Ä | Прописная А, умляут |
Å | Прописная А, звонко» произношение |
à | Строчная а, тупое ударение |
´ | Строчная а, сильное ударение |
â | Строчная а, диакритическое ударение |
ã | Строчная а, тильда |
ä | Строчная а, умляут |
å | Строчная а, звонкое произношение |
&Aelig | Прописные АЕ, дифтонг |
æ | Строчные ае, дифтонг |
Ç | Прописная С, седиль |
ç | Строчная с, седиль |
È | Прописная Е, тупое ударение |
É | Прописная Е, сильное ударение |
Ê | Прописная Е, диакритическое ударение |
&Еuml | Прописная Е, умляут |
è | Строчная е, тупое ударение |
é | Строчная е, сильное ударение |
ê | Строчная е, диакритическое ударение |
ë | Строчная е, умляут |
Í | Прописная I, сильное ударение |
Ì | Прописная I, тупое ударение |
Ï | Прописная I, умляут |
í | Строчная i, сильное ударение |
ì | Строчная i, тупое ударение |
&ticirc | Строчная i, диакритическое ударение |
ï | Строчная i, умляут |
Ð | Сочетание Eth |
ð | Строчные eth |
Ñ | Прописная N, тильда |
ñ | Строчная п, тильда |
Ò | Прописная О, тупое ударение |
Ó, | Прописная О, сильное ударение |
&0circ . | Прописная О, диакритическое ударение |
&0tilde | Прописная 0, тильда |
Ö | Прописная О, умляут |
Ø | Прописная О, слэш |
ò | Строчная о, тупое ударение |
ó | Строчная о, сильное ударение |
ô | Строчная о, диакритическое ударение |
õ | Строчная о, тильда , |
ö | Строчная о, умляут |
ø | Строчная о, слэш |
Ù | Прописная U, тупое ударение |
Ú | Прописная U, сильное ударение |
Û | Прописная U, диакритическое ударение |
Ü | Прописная U, умляут |
ù | Строчная и, тупое ударение |
ú | Строчная и, сильное ударение |
û | Строчная и, диакритическое ударение |
ü | Строчная и, умляут |
Ý | Прописная Y, сильное ударение |
ý | Строчная у, сильное ударение |
® | Зарегистрированная торговая марка — Trademark |
scopy | Права собственности - Copyright |
Snbsp | Неразделяемый пробел |