在unicode字符串中转换字节字符串

Converting byte string in unicode string(在unicode字符串中转换字节字符串)
本文介绍了在unicode字符串中转换字节字符串的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

问题描述

我有这样的代码:

a = "u0432"
b = u"u0432"
c = b"u0432"
d = c.decode('utf8')

print(type(a), a)
print(type(b), b)
print(type(c), c)
print(type(d), d)

然后输出:

<class 'str'> в
<class 'str'> в
<class 'bytes'> b'\u0432'
<class 'str'> u0432

为什么在后一种情况下我看到的是字符代码,而不是字符?如何将 Byte 字符串转换为 Unicode 字符串,以便在输出时我看到的是字符而不是其代码?

Why in the latter case I see a character code, instead of the character? How I can transform Byte string to Unicode string that in case of an output I saw the character, instead of its code?

推荐答案

在字符串(或 Python 2 中的 Unicode 对象)中,u 有一个特殊的含义,即这里来了一个 Unicode由它的 Unicode ID 指定的字符".因此 u"u0432" 将产生字符 в.

In strings (or Unicode objects in Python 2), u has a special meaning, namely saying, "here comes a Unicode character specified by it's Unicode ID". Hence u"u0432" will result in the character в.

b'' 前缀告诉你这是一个 8 位字节序列,并且 bytes 对象没有 Unicode 字符,所以 u 代码没有特殊意义.因此,b"u0432" 只是字节的序列 ,u,0,432.

The b'' prefix tells you this is a sequence of 8-bit bytes, and bytes object has no Unicode characters, so the u code has no special meaning. Hence, b"u0432" is just the sequence of the bytes ,u,0,4,3 and 2.

本质上,您有一个 8 位字符串,其中不包含 Unicode 字符,而是包含 Unicode 字符的规范.

Essentially you have an 8-bit string containing not a Unicode character, but the specification of a Unicode character.

您可以使用 unicode 转义编码器转换此规范.

You can convert this specification using the unicode escape encoder.

>>> c.decode('unicode_escape')
'в'

这篇关于在unicode字符串中转换字节字符串的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!

本站部分内容来源互联网,如果有图片或者内容侵犯了您的权益,请联系我们,我们会在确认后第一时间进行删除!

相关文档推荐

Multiprocessing on Windows breaks(Windows 上的多处理中断)
How to use a generator as an iterable with Multiprocessing map function(如何将生成器用作具有多处理映射功能的可迭代对象)
read multiple files using multiprocessing(使用多处理读取多个文件)
Why does importing module in #39;__main__#39; not allow multiprocessig to use module?(为什么在__main__中导入模块不允许multiprocessig使用模块?)
Trouble using a lock with multiprocessing.Pool: pickling error(使用带有 multiprocessing.Pool 的锁时遇到问题:酸洗错误)
Python sharing a dictionary between parallel processes(Python 在并行进程之间共享字典)