1.不同字符与获取字符串长度
获取字符串长度,是字符串操作的重要方法。理论来说,获取字符串长度,只要从头到尾查找一遍就可以了。但遗憾的是,不同字符具有不同的编码格式。拉丁字母一个字符只要一个字节就行,而中文则可能需要两道三个字节;UNICODE把所有字符设置为2个字节,UTF-8格式则把所有字符设置为1--3个字节。
因此,字符串长度的获得,不等于按字节数查找,而要根据不同字符编码查找。
2.golang中获取字符串长度的方法
对于中文开发者来说,经常需要对字符串进行长度判断。golang有自己的默认判断长度函数len();但遗憾的是,len()函数判断字符串长度的时候,是判断字符的字节数而不是字符长度。因此,在中文字符下,应该采用如下方法:
1)使用 bytes.Count() 统计
2)使用 strings.Count() 统计
3)将字符串转换为 []rune 后调用 len 函数进行统计
4)使用 utf8.RuneCountInString() 统计
3.样例展示
s := "欢迎学习Go的len()函数" r := []rune(strTest) fmt.Println(len(r)) fmt.Println(len(s)) fmt.Println(bytes.Count([]byte(s), nil) - 1) fmt.Println(strings.Count(s, "") - 1) fmt.Println(utf8.RuneCountInString(s))
补充:Go语言获取中英文混和字符串的长度以及子字符串的方法
1. 纯英文字符串
使用len()函数。
testString1 := "China!" length1 := len(testString1) fmt.Printf("testString1 字符串的长度是:%d", length1)
长度是6。
2. 中英文混合字符串
2.1 先使用len()函数。
testString2 := "我爱你中国,我爱你China!" length2 := len(testString2) fmt.Printf("字符串的长度是:%d", length2) fmt.Printf("testString2字符串的长度是:%d\n", length2) fmt.Printf("testString2中的最后一个字符是:%s\n", testString2[length2-1]) fmt.Printf("testString2中的最后一个字符是:%c\n", testString2[length2-1]) fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:15]) fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:16])
这种方法的到的是字节数。Go语言中,中文字符按utf-8编码,占3字节,故长度是31。故此方法不适用统计中英文混合或者中文字符串长度。
2.2 使用utf8.RuneCountInString()方法。
testString2 := "我爱你中国,我爱你China!" length3 := utf8.RuneCountInString(testString2) fmt.Printf("使用utf8中的方法统计的字符串长度是:%d\n", length3)
此方法可统计字符数,输出结果是15。
2.3 转成[]rune类型,再对此类型进行操作
testString2 := "我爱你中国,我爱你China!" temp := []rune(testString2) length4 := len(temp) fmt.Printf("使用rune统计的字符串的长度是:%d\n", length4) //获取字符串中最后一个字符 lastChar := string(temp[length4-1]) //获取下标从0到3(不包括3)的子串 subString1 := temp[0:3] subString2 := temp[6:9] fmt.Printf("testString2中的最后一个字符是:%s\n", lastChar) fmt.Printf("testString2中的下标0-2的子字符串是:%s\n",string(subString1)) fmt.Printf("testString2中的下标6-8的子字符串是:%s\n",string(subString2))
此方法也可输出字符个数15。但是此方法能获取指定下标范围的子字符串,也能获取指定下标位置的字符。比第二种方法方便。
3.示例代码
package main import ( "fmt" "unicode/utf8" ) func main() { //纯英文 testString1 := "China!" length1 := len(testString1) fmt.Printf("testString1字符串的长度是:%d\n", length1) lastCharA := testString1[length1-1] //此处用%s格式输出最后一个字符会出错,只能用%c fmt.Printf("testString1字符串中最后一个字符是:%s\n", lastCharA) fmt.Printf("testString1字符串中最后一个字符是:%c\n", lastCharA) fmt.Printf("testString1中的下标0-2的子字符串是:%s\n",testString1[0:3]) fmt.Printf("testString1中的下标3-末尾的子字符串是:%s\n",testString1[3:]) fmt.Println() //中英文加一起15个字符 testString2 := "我爱你中国,我爱你China!" //此处长度是输出字节数,Go语言中文字符是UTF-8编码,长度3字节,故此处应该是15+1+9+6=31 length2 := len(testString2) fmt.Printf("testString2字符串的长度是:%d\n", length2) fmt.Printf("testString2中的最后一个字符是:%s\n", testString2[length2-1]) fmt.Printf("testString2中的最后一个字符是:%c\n", testString2[length2-1]) fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:15]) fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",testString2[:16]) fmt.Println() //此处就是统计字符数 length3 := utf8.RuneCountInString(testString2) fmt.Printf("使用utf8中的方法统计的字符串长度是:%d\n", length3) fmt.Println() //转成rune类型,再统计字符数 temp := []rune(testString2) //获取中英文混合字符串长度 length4 := len(temp) fmt.Printf("使用rune统计的字符串的长度是:%d\n", length4) //获取字符串中最后一个字符 lastCharB := string(temp[length4-1]) //获取下标从0到3(不包括3)的子串 subString1 := temp[0:3] subString2 := temp[6:] fmt.Printf("testString2中的最后一个字符是:%s\n", lastCharB) fmt.Printf("testString2中的下标0-2的子字符串是:%s\n",string(subString1)) fmt.Printf("testString2中的下标6-末尾的子字符串是:%s\n",string(subString2)) }
4. 示例结果
总结
如果是对中英文进行操作,建议用第三种方式。先转成rune[]型,再进行操作。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
golang,字符串长度
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新动态
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]