admin

一个字符占几个字节?字符转化成字节的方法详解

admin 服务器租用 2023-11-18 70浏览 0

  比较少接触编码的人就会有疑问,不知道编码一个字符占几个字节。GBK编码方式是中文占两个字节,英文占1个字节。编码不同,占据的字节数不同,其中的门路还是比较深奥的,不过关于计算机大神来说估计就是小菜一碟了。正常来说一个英文等于两个字节,一个中文(含繁体)等于两个字节。

 

  一个字符占几个字节

 

  不同的编码里,字符和字节的对应关系也不同,与编码方式有关,常见的编码字符与字节的对应关系如下:

 

  1、ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制,最小值0,最大值255。

 

  2、UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。

 

  3、Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。

 

  符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。

 

  4、GBK编码方式是中文占两个字节,英文占1个字节。


一个字符占几个字节?字符转化成字节的方法详解

 

  字符转化成字节的方法

 

  1.使用 bytes() 功能

 

  这个想法是使用字节构造函数 bytes(string, encoding) 使用指定的编码从字符串中获取字节数组。要执行相反的操作,即将字节转换为字符串,请将字节传递给使用所用编码的字符串构造函数。如果未指定编码,则它使用 Unicode 实现使用的当前默认编码。

 

  2.使用 encode() 功能

 

  另一种选择是使用 str.encode 使用指定编码或默认编码对字符串进行编码的函数 utf-8.要从给定字节解码字符串,可以使用 bytes.decode 函数,它接受编码或使用默认编码 utf-8 当没有指定编码时。这就是在 Python 中将字符串转换为字节的全部内容。

 

  一个字符占几个字节?还有不清楚的小伙伴就要仔细阅读下文章。英文和数字占一个字节,中文占一个字符,也就是两个字节,要提醒大家的是字符不等于字节。


版权声明

本文仅代表作者观点,不代表立场。
本站部分资源来自互联网,如有侵权请联系站长删除。