string 数据结构

img

字符串默认在堆上分配内存存储。字符串是通过char数组存储的,字符串是不可变的字节数组,其头部指针指向一个字节数组。

字符串在Go语言内存模型中用一个2字长的数据结构表示。它包含一个指向字符串存储数据的指针和一个长度数据。因为string类型是不可变的,对于多字符串共享同一个存储数据是安全的。切分操作str[i:j]会得到一个新的2字长结构,一个可能不同的但仍指向同一个字节序列(即上文说的存储数据)的指针和长度数据。这意味着字符串切分可以在不涉及内存分配或复制操作。这使得字符串切分的效率等同于传递下标。

字符串默认在堆上分配内存存储。字符串是通过char数组存储的,字符串是不可变的字节数组,其头部指针指向一个字节数组

string在内存中的存储结构是长度固定的字节数组,也就是说是字符串是不可变的。当要修改字符串的时候,需要转换为[]byte,修改完成后再转换回来。但是不论怎么转换,都必须重新分配内存,并复制数据,通过加号拼接字符串,每次都必须重新分配内存。(可以通过strings.join 和 buffer 来优化)

string在内存中的存储结构是长度固定的字节数组,也就是说是字符串是不可变的。当要修改字符串的时候,需要转换为[]byte,修改完成后再转换回来。但是不论怎么转换,都必须重新分配内存,并复制数据,通过加号拼接字符串,每次都必须重新分配内存。

1、type 占一个字节

2、rune 英文占一个字节,中文占三个字节

3、string底层是用byte数组存的,并且是不可以改变的。

4、在 Go 中,字符串是以 UTF-8 为格式进行存储的,在字符串上调用 len 函数,取得的是字符串包含的 byte 的个数

例如 s:=”你好” fmt.Println(len(s)) 输出结果应该是6,因为中文字符是用3个字节存的。

所以用string存储unicode的话,如果有中文,按下标是访问不到,如果想要获得我们想要的情况的话,需要先转换为rune切片再使用内置的len函数

1
2
3
4
5
6
7
func main() {
s := "你好" // UTF-8
fmt.Println(len(s)) //结果:6

st := []rune(s)
fmt.Println(len(st)) //结果:2
}