Python Кодировки

Python Кодировки — зачем нужны кодировки?

Чтобы передать данные и программы обработки данных примитивному в своей основе устройству под названием компьютер, понимающему лишь Нули и Единицы.

Python Кодировки не отличаются особой оригинальностью, ибо используют те же самые кодировки, что и другие языки программирования и операционные системы.

 

ASCII -  American Standard Code for Information Interchange (то есть Американский Стандартный Код Информационного Обмена) — семи-битовая кодировка, содержащая управляющие символы, заглавные и прописные символы латинского алфавита, знаки препинания, ряд математических символов и ещё кое-какие символы.

base64 — система счисления с основанием 64.

base64 — это, с моей точки зрения, система, придуманная компьютерными извращенцами ради мнимых выгод, которые по мере развития компьютеров потеряли былое значение.

UTF-8 -

UTF-16 -

Windows 1251 -

КОИ-8 (Код Обмена Информацией, 8 бит) — восьми-битовая кодовая страница, которая совместима с ASCII, она разработана для кодирования букв кириллических алфавитов, а на свободные места включили символы псевдографики и ещё кое-какие полезные символы. Для России наиболее интересна КОИ-8R, содержащая все символы русского алфавита.

Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако ближе к 2010 году, с распространением Юникода, постепенно выходит из употребления.

Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы.

Это означает, что если в тексте, написанном в КОИ-8, убрать восьмой бит каждого символа, то получится «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.

Юникод - современный непрерывно развиваемый стандарт кодирования символов, который позволяет присвоить коды символам почти всех письменных языков, причём даже древним, которые вышли из употребления.

Юникод (чаще всего) или Уникод (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки почти всех письменных языков.

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.).

Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.

Стандарт состоит из двух основных разделов: универсальный набор символов (англ. UCS, universal character set) и семейство кодировок (англ. UTF, Unicode transformation format).

Универсальный набор символов задаёт однозначное соответствие символов кодам — элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS.

Разбираться с Кодировками буду по мере необходимости.

Приглашаю всех высказываться в Комментариях. Критику и обмен опытом одобряю и приветствую. В хороших комментариях сохраняю ссылку на сайт автора!

И не забывайте, пожалуйста, нажимать на кнопки социальных сетей, которые расположены под текстом каждой страницы сайта.
Python КодировкиПродолжение тут…

_Родник

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Проверка комментариев включена. Прежде чем Ваши комментарии будут опубликованы пройдет какое-то время.