Dira.zapisi

Актуальные вопросы

Сколько весит один символ текста?

Достаточный алфавит Т. к. 256 = 28, то вес 1 символа – 8 бит. Единице в 8 бит присвоили свое название — байт.

В кодировке Unicode один символ занимает 16 бит памяти, что соответствует 2 байтам (1 байт = 8 бит).

РЕШЕНИЕ: N= 32 = 2. i = 5 бит (вес одного символа)

UTF8, по сравнению с UTF-16, наибольший выигрыш в компактности даёт для текстов на латинице, поскольку латинские буквы без диакритических знаков, цифры и наиболее распространённые знаки препинания кодируются в UTF8 лишь одним байтом, и коды этих символов соответствуют их кодам в ASCII.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *