Python Кодировки — зачем нужны кодировки?
Чтобы передать данные и программы обработки данных примитивному в своей основе устройству под названием компьютер, понимающему лишь Нули и Единицы.
Python Кодировки не отличаются особой оригинальностью, ибо используют те же самые кодировки, что и другие языки программирования и операционные системы.
ASCII - American Standard Code for Information Interchange (то есть Американский Стандартный Код Информационного Обмена) — семи-битовая кодировка, содержащая управляющие символы, заглавные и прописные символы латинского алфавита, знаки препинания, ряд математических символов и ещё кое-какие символы.
base64 — система счисления с основанием 64.
base64 — это, с моей точки зрения, система, придуманная компьютерными извращенцами ради мнимых выгод, которые по мере развития компьютеров потеряли былое значение.
UTF-8 -
UTF-16 -
КОИ-8 (Код Обмена Информацией, 8 бит) — восьми-битовая кодовая страница, которая совместима с ASCII, она разработана для кодирования букв кириллических алфавитов, а на свободные места включили символы псевдографики и ещё кое-какие полезные символы. Для России наиболее интересна КОИ-8R, содержащая все символы русского алфавита.
Была широко распространена как основная русская кодировка в Unix-совместимых ОС и в электронной почте, однако ближе к 2010 году, с распространением Юникода, постепенно выходит из употребления.
Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите из нижней части таблицы.
Это означает, что если в тексте, написанном в КОИ-8, убрать восьмой бит каждого символа, то получится «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратятся в «rUSSKIJ tEKST». Из‑за этого символы кириллицы расположены не в алфавитном порядке.
Юникод - современный непрерывно развиваемый стандарт кодирования символов, который позволяет присвоить коды символам почти всех письменных языков, причём даже древним, которые вышли из употребления.
Юникод (чаще всего) или Уникод (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки почти всех письменных языков.
Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium, Unicode Inc.).
Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.
Стандарт состоит из двух основных разделов: универсальный набор символов (англ. UCS, universal character set) и семейство кодировок (англ. UTF, Unicode transformation format).
Универсальный набор символов задаёт однозначное соответствие символов кодам — элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS.
Разбираться с Кодировками буду по мере необходимости.
Приглашаю всех высказываться в Комментариях. Критику и обмен опытом одобряю и приветствую. В хороших комментариях сохраняю ссылку на сайт автора!
И не забывайте, пожалуйста, нажимать на кнопки социальных сетей, которые расположены под текстом каждой страницы сайта.
Продолжение тут…