<返回更多

Golang中的rune类型到底是什么?

2023-03-18  今日头条  路多辛
加入收藏

rune类型

在看一些开源项目的源代码时,经常看到rune类型的使用,本文就详细说下rune类型,首先看下golang源码的注释:

// rune is an alias for int32 and is equivalent to int32 in all ways. It is
// used, by convention, to distinguish character values from integer values.
type rune = int32

可以看出rune类型是int32类型的别名,等价于int32,之所以定义rune类型是因为按照惯例用来区分字符值和整数值用的。 rune类型通常用于表示一个unicode字符的码点,也就是unicode编码中的字符编码,支持 Unicode 的 1,114,112 个码点。

使用方法

定义一个rune类型的变量可以使用单引号,例如:

var r1 rune = 'A'
var r2 rune = '你'
var r3 rune = 'U0001F600'  // 笑脸表情的 Unicode 码点是 U+1F600

可以使用 %c 来格式化rune类型的变量,例如:

fmt.Printf("r1: %cn", r1)  // 输出: r1: A
fmt.Printf("r2: %cn", r2)  // 输出: r2: 你
fmt.Printf("r3: %cn", r3)  // 输出: r3: 

在字符串中使用rune类型可以表示一个Unicode 字符,例如:

str := "你好,世界!"
r := []rune(str)
fmt.Printf("%cn", r[0])  // 输出: 你

因为rune是32位的整型,当把一个rune变量赋值给一个int类型的变量时需要进行类型转换:

var r rune = 'A'
var i int = int(r)

计算字符串长度

众所周知,一个中文字符在unicode编码中占2个字节,而在utf-8编码中占3个字节。golang默认编码是utf-8,如果想得到一个字符串的长度而不是字符串占用的字节长度的场景,就需要使用rune类型:

package main

import (
   "fmt"
   "unicode/utf8"
)

func main() {
   var str = "hello,世界"
   //计算占用的字节数
   fmt.Println("字节数:", len(str))

   //以下两种都可以得到str的字符数
   //unicode/utf8包提供了获取字符数的方法
   fmt.Println("字符数:", utf8.RuneCountInString(str))
   //通过rune类型处理unicode字符方式
   fmt.Println("字符数:", len([]rune(str)))
}

输出结果:

字节数: 12
字符数: 8
字符数: 8
声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>