Достаточный алфавит Т. к. 256 = 28, то вес 1 символа – 8 бит. Единице в 8 бит присвоили свое название — байт.
В кодировке Unicode один символ занимает 16 бит памяти, что соответствует 2 байтам (1 байт = 8 бит).
РЕШЕНИЕ: N= 32 = 2. i = 5 бит (вес одного символа)
UTF—8, по сравнению с UTF-16, наибольший выигрыш в компактности даёт для текстов на латинице, поскольку латинские буквы без диакритических знаков, цифры и наиболее распространённые знаки препинания кодируются в UTF—8 лишь одним байтом, и коды этих символов соответствуют их кодам в ASCII.
Добавить комментарий