python中字符串的编码与解码详析

脚本专栏 2026/6/27 佚名

3 2 1

1. 常用的编码

ASCII:只能表示一些字母，数字和特殊的字符，占一个字节
GBK：国家简体中文字符集和繁体字符集，兼容ASCII，占两个字节
Unicode：能够表示全世界上所有的字符，Unicode有人说占4个字节也有人说占2个字节，但中文占2个字节
UTF-8：Unicode的压缩版，占1~3个字节，其中中文占三个字节

2.补充:计算机表示的单位：

bit：位，计算机最小的表示单位

bytes：字节，最小的存储单位，1bytes=8bit，1bytes简写成1B

1KB = 1024B

1MB = 1024KB

1GB = 1024MB

1TB = 1024GB

......

3.ASCII编码

ASCII编码是基于拉丁字母一套编码，主要是显示现代英语和其西欧语言，是最早通用的单字节编码系统,具体ASCII对照表如下：

在对照表中需要记住的是大写字母A的编码是65，小写字母a的编码的97即可。

在python中可以使用chr和ord方法进行转换：

# 将数字类型转换成ASCII对应的字符
print(chr(97)) # a
# 将数字转换成对应的数据
print(ord("A")) # 65
# 或者使用

但随着事件的发展，ASCII编码扩展到了256个字符，编码对照表如下：

其中后128个字符称为扩展ASCII码

2.GBK和GB2312编码

由于ASCII编码只能由256个字符组成，然只能由1个字节来表示中文是不可能的，因此制定了GB2312编码，用来表示中文的对照表

4.Unicode

为了解决各个国家编码冲突的问题，Unicode编码就因此而生，Unicode把所有语言都统一到一套编码里面，就会避免冲突，产生乱码。

Unicodeb标准在不断发展，最常用的是用两个字节表示一个字符，也有的字符是4个字节，但是中文是占两个字节。如果统一成Unicode编码，在存储和传输上就不划算

5.UTF-8编码

为了解决Unicode编码存储过大的问题，就推出了可变长编码UTF-8，UTF-8编码把一个Unicode字符依据不同的数据大小编程1~6个字节，其中中文就占3个字节

6.编码和解码

1.编码操作

可以通过encode进行编码，其中语法如下：

对字符串进行ASCII编码(只能转换数字，英文字母和一些符号)

# 方式1： 通过bytes方法
bytes('a', 'ASCII')
# 方式2: 通过encode方法进行
'a'.encode('ASCII')

将字符串转换成gbk编码格式

# 方式1: 通过encode方法进行
print('你好'.encode('GBK')) # 编码之后的结果为:b'\xc4\xe3\xba\xc3'
# 方式2: 通过bytes类型
print(bytes('我爱你', 'GBK')) # 编码之后的结果为:b'\xce\xd2\xb0\xae\xc4\xe3'

将字符串转换成Unicode编码格式

# 方式1: 通过encode方法进行
print('你好'.encode('unicode_escape')) # 编码之后的结果为:b'\\u4f60\\u597d'
# 方式2: 通过bytes类型
print(bytes('我爱你', 'unicode_escape')) # 编码之后的结果为:b'\\u6211\\u7231\\u4f60'

将字符串转换成UTF-8编码格式

# 方式1: 通过encode方法进行
print('你好'.encode('utf-8')) # 编码之后的结果为:b'\xe4\xbd\xa0\xe5\xa5\xbd'
# 方式2: 通过bytes类型
print(bytes('我爱你', 'utf-8')) # 编码之后的结果为:b'\xe6\x88\x91\xe7\x88\xb1\xe4\xbd\xa0'

2.解码操作

将GBK编码格式转换成字符串

# 通过decode方法解码
print(b'\xc4\xe3\xba\xc3\xce\xd2\xb0\xae\xc4\xe3'.decode('GBK')) # 解码之后结果为：你好我爱你

将UTF-8编码格式转换成字符串

# 通过decode方法解码
print(b'\xe4\xbd\xa0\xe5\xa5\xbd\xe6\x88\x91\xe7\x88\xb1\xe4\xbd\xa0'.decode('utf-8')) # 解码之后结果为：你好我爱你

将Uniconde编码格式转换成字符串

# 通过decode方法解码
print(b'\\u4f60\\u597d\\u6211\\u7231\\u4f60'.decode('GBK')) # 解码之后结果为：你好我爱你

Python字符串编码转换,python查看字符串编码格式,python字符串编码格式转换

标签：

Python字符串编码转换,python查看字符串编码格式,python字符串编码格式转换

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

评论“python中字符串的编码与解码详析”

python中字符串的编码与解码详析

暂无“python中字符串的编码与解码详析”评论...

www.imxmx.com 杰晶网络

8,675无损音乐

1,324高清电影

213破解软件

120,141站长资源

最新文章

群星《奔赴！万人现场第2期》[FLAC/分轨][5

2026/6/27

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2026/6/27

群星《奇妙浪一夏 (上海迪士尼度假区音乐)》

2026/6/27

【古典音乐】詹姆斯·高威《季节》1993[WAV+

2026/6/27

贝拉芳蒂《卡里普索之王》SACD[WAV+CUE]

2026/6/27

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2026/6/27

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

python中字符串的编码与解码详析

1. 常用的编码

2.补充:计算机表示的单位：

3.ASCII编码

2.GBK和GB2312编码

4.Unicode

5.UTF-8编码

6.编码和解码

1.编码操作

2.解码操作

Python字符串编码转换,python查看字符串编码格式,python字符串编码格式转换

python 根据列表批量下载网易云音乐的免费音乐

python 调整图片亮度的示例

评论“python中字符串的编码与解码详析”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新动态

友情链接

python中字符串的编码与解码详析

1. 常用的编码

2.补充:计算机表示的单位：

3.ASCII编码

2.GBK和GB2312编码

4.Unicode

5.UTF-8编码

6.编码和解码

1.编码操作

2.解码操作

Python字符串编码转换,python查看字符串编码格式,python字符串编码格式转换

python 根据列表批量下载网易云音乐的免费音乐

python 调整图片亮度的示例

评论“python中字符串的编码与解码详析”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新动态

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存