rune类型
在看一些开源项目的源代码时,经常看到rune类型的使用,本文就详细说下rune类型,首先看下golang源码的注释:
// rune is an alias for int32 and is equivalent to int32 in all ways. It is
// used, by convention, to distinguish character values from integer values.
type rune = int32
可以看出rune类型是int32类型的别名,等价于int32,之所以定义rune类型是因为按照惯例用来区分字符值和整数值用的。 rune类型通常用于表示一个unicode字符的码点,也就是unicode编码中的字符编码,支持 Unicode 的 1,114,112 个码点。
使用方法
定义一个rune类型的变量可以使用单引号,例如:
var r1 rune = 'A'
var r2 rune = '你'
var r3 rune = 'U0001F600' // 笑脸表情的 Unicode 码点是 U+1F600
可以使用 %c 来格式化rune类型的变量,例如:
fmt.Printf("r1: %cn", r1) // 输出: r1: A
fmt.Printf("r2: %cn", r2) // 输出: r2: 你
fmt.Printf("r3: %cn", r3) // 输出: r3:
在字符串中使用rune类型可以表示一个Unicode 字符,例如:
str := "你好,世界!"
r := []rune(str)
fmt.Printf("%cn", r[0]) // 输出: 你
因为rune是32位的整型,当把一个rune变量赋值给一个int类型的变量时需要进行类型转换:
var r rune = 'A'
var i int = int(r)
计算字符串长度
众所周知,一个中文字符在unicode编码中占2个字节,而在utf-8编码中占3个字节。golang默认编码是utf-8,如果想得到一个字符串的长度而不是字符串占用的字节长度的场景,就需要使用rune类型:
package main
import (
"fmt"
"unicode/utf8"
)
func main() {
var str = "hello,世界"
//计算占用的字节数
fmt.Println("字节数:", len(str))
//以下两种都可以得到str的字符数
//unicode/utf8包提供了获取字符数的方法
fmt.Println("字符数:", utf8.RuneCountInString(str))
//通过rune类型处理unicode字符方式
fmt.Println("字符数:", len([]rune(str)))
}
输出结果:
字节数: 12
字符数: 8
字符数: 8