Python3. UTF-16BE прооблемы с кодированием декодированием кирилицы

Автор mrgoodvin, 23 октября 2019, 15:29:23

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

mrgoodvin

Приветствую форумчане. Заметил странности с кодированием в utf-16. У вас так же?
Хотя до 0420 нормально кодируется, декодируется, а все что дальше, т.е. 'Р', 'С', 'Т' и т.д, выше разряда 042F. выдает ахинею. К стати модуль python3-webencodings, аналогично.
>>>'П'.encode('utf-16be')
b'\x04\x1f'
>>> 'Р'.encode('utf-16be')
b'\x04 '

mrgoodvin

Все нормально, ложная тревога :). Системная у то меня utf-8, собственно из за этого наверно и было наложение до 0420, что запутало.
>>> b'\x04\x20'.decode('utf-16be')
'Р'
>>> b'\x04\x21'.decode('utf-16be')
'С'