仓颉-函数
定义函数
仓颉使用关键字 func 来表示函数定义的开始,func 之后依次是函数名、参数列表、可选的函数返回值类型、函数体。其中,函数名可以是任意的合法标识符,参数列表定义在一对圆括号内(多个参数间使用逗号分隔),参数列表和函数返回值类型(如果存在)之间使用冒号分隔,函数体定义在一对花括号内。
函数定义举例:
1 | func add(a: Int64, b: Int64): Int64 { |
上例中定义了一个名为 add 的函数,其参数列表由两个 Int64 类型的参数 a 和 b 组成,函数返回值类型为 Int64,函数体中将 a 和 b 相加并返回。
下面依次对函数定义中的参数列表、函数返回值类型和函数体作进一步介绍。
参数列表
一个函数可以拥有 0 个或多个参数,这些参数均定义在函数的参数列表中。根据函数调用时是否需要给定参数名,可以将参数列表中的参数分为两类:非命名参数和命名参数。
非命名参数的定义方式是 p: T,其中 p 表示参数名,T 表示参数 p 的类型,参数名和其类型间使用冒号连接。例如,上例中 add 函数的两个参数 a 和 b 均为非命名参数。
命名参数的定义方式是 p!: T,与非命名参数的不同是在参数名 p 之后多了一个 !。可以将上例中 add 函数的两个非命名参数修改为命名参数,如下所示:
1 | func add(a!: Int64, b!: Int64): Int64 { |
命名参数还可以设置默认值,通过 p!: T = e 方式将参数 p 的默认值设置为表达式 e 的值。例如,可以将上述 add 函数的两个参数的默认值都设置为 1:
1 | func add(a!: Int64 = 1, b!: Int64 = 1): Int64 { |
注意:
只能为命名参数设置默认值,不能为非命名参数设置默认值。
参数列表中可以同时定义非命名参数和命名参数,但是需要注意的是,非命名参数只能定义在命名参数之前,也就意味着命名参数之后不能再出现非命名参数。例如,下例中 add 函数的参数列表定义是不合法的:
1 | func add(a!: Int64, b: Int64): Int64 { // Error, named parameter 'a' must be defined after non-named parameter 'b' |
非命名参数和命名参数的主要差异在于调用时的不同,具体可参见下文调用函数中的介绍。
函数参数均为不可变变量,在函数定义内不能对其赋值。
1 | func add(a: Int64, b: Int64): Int64 { |
函数参数作用域从定义处起至函数体结束:
1 | func add(a: Int64, b: Int64): Int64 { |
函数返回值类型
函数返回值类型是函数被调用后得到的值的类型。函数定义时,返回值类型是可选的:可以显式地定义返回值类型(返回值类型定义在参数列表和函数体之间),也可以不定义返回值类型,交由编译器推导确定。
当显式地定义了函数返回值类型时,就要求函数体的类型(关于如何确定函数体的类型可参见下节函数体)、函数体中所有 return e 表达式中 e 的类型是返回值类型的子类型。例如,对于上述 add 函数,显式地定义了它的返回值类型为 Int64;如果将函数体中的 return a + b 修改为 return (a, b),则会因为类型不匹配而报错:
1 | // Error, the type of the expression after return does not match the return type of the function |
在函数定义时如果未显式定义返回值类型,编译器将根据函数体的类型以及函数体中所有的 return 表达式来共同推导出函数的返回值类型。例如,下例中 add 函数的返回值类型虽然被省略,但编译器可以根据 return a + b 推导出 add 函数的返回值类型是 Int64:
1 | func add(a: Int64, b: Int64) { |
注意:
函数的返回值类型并不是任何情况下都可以被推导出来的,如果返回值类型推导失败,编译器会报错。
指定返回类型为 Unit 时,编译器会在函数体中所有可能返回的地方自动插入表达式 return (),使得函数的返回类型总是为 Unit。
函数体
函数体中定义了函数被调用时执行的操作,通常包含一系列的变量定义和表达式,也可以包含新的函数定义(即嵌套函数)。如下 add 函数的函数体中首先定义了 Int64 类型的变量 r(初始值为 0),接着将 a + b 的值赋值给 r,最后将 r 的值返回:
1 | func add(a: Int64, b: Int64) { |
在函数体的任意位置都可以使用 return 表达式来终止函数的执行并返回。return 表达式有两种形式:return 和 return expr(expr 是一个表达式)。
对于 return expr,要求 expr 的类型与函数定义中的返回值类型保持一致。例如,下例中会因为 return 100 中 100 类型(Int64)和函数 foo 的返回值类型(String)不同而报错。
1 | // Error, cannot convert an integer literal to type 'Struct-String' |
对于 return,其等价于 return (),所以要求函数的返回值类型为 Unit。
1 | func add(a: Int64, b: Int64) { |
注意:
return表达式作为一个整体,其类型并不由后面跟随的表达式决定,而是Nothing类型。
在函数体内定义的变量属于局部变量的一种(如上例中的 r 变量),它的作用域从其定义之后开始到函数体结束。
对于一个局部变量,允许在其外层作用域中定义同名变量,并且在此局部变量的作用域内,局部变量会“遮盖”外层作用域的同名变量。例如:
1 | let r = 0 |
上例中,add 函数之前定义了 Int64 类型的全局变量 r,同时 add 函数体内定义了同名的局部变量 r,那么在函数体内,所有使用变量 r 的地方(如 r = a + b),用到的将是局部变量 r,即(在函数体内)局部变量 r “遮盖”了全局变量 r。
函数返回值类型中提到函数体也是有类型的,函数体的类型是函数体内最后一“项”的类型:若最后一项为表达式,则函数体的类型是此表达式的类型,若最后一项为变量定义或函数声明,或函数体为空,则函数体的类型为 Unit。例如:
1 | func add(a: Int64, b: Int64): Int64 { |
上例中,因为函数体的最后一“项”是 Int64 类型的表达式(即 a + b),所以函数体的类型也是 Int64,与函数定义的返回值类型相匹配。又如,下例中函数体的最后一项是 print 函数调用,所以函数体的类型是 Unit,同样与函数定义的返回值类型相匹配:
1 | func foo(): Unit { |
调用函数
函数调用的形式为 f(arg1, arg2, ..., argn)。其中,f 是要调用的函数的名字,arg1 到 argn 是 n 个调用时的参数(称为实参),要求每个实参的类型必须是对应参数类型的子类型。实参可以有 0 个或多个,当实参个数为 0 时,调用方式为 f()。
根据函数定义时参数是非命名参数还是命名参数的差异,函数调用时传实参的方式也有所不同:对于非命名参数,它对应的实参是一个表达式;对于命名参数,它对应的实参需要使用 p: e 的形式,其中 p 是命名参数的名字,e 是表达式(即传递给参数 p 的值)。
对于多个命名参数,调用时的传参顺序可以和定义时的参数顺序不同。
对于拥有默认值的命名参数,调用时如果没有传实参,那么此参数将使用默认值作为实参的值。
对于拥有默认值的命名参数,调用时也可以为其传递新的实参,此时命名参数的值等于新的实参的值,即定义时的默认值将失效。
函数类型
仓颉编程语言中,函数是一等公民(first-class citizens),可以作为函数的参数或返回值,也可以赋值给变量。因此函数本身也有类型,称之为函数类型。
函数类型由函数的参数类型和返回类型组成,参数类型和返回类型之间使用 -> 连接。参数类型使用圆括号 () 括起来,可以有 0 个或多个参数,如果参数超过一个,参数类型之间使用逗号(,)分隔。
例如:
1 | func hello(): Unit { |
上述示例定义了一个函数,函数名为 hello,其类型是 () -> Unit,表示该函数没有参数,返回类型为 Unit。
函数类型的类型参数
可以为函数类型标记显式的类型参数名,下面例子中 main 方法里的 name 和 price 就是 类型参数名。
1 | func showFruitPrice(name: String, price: Int64) { |
另外对于一个函数类型,只允许统一写类型参数名,或者统一不写类型参数名,不能交替存在。
1 | let handler: (name: String, Int64) -> Int64 // Error |
函数类型作为参数类型
示例:函数名为 printAdd,其类型是 ((Int64, Int64) -> Int64, Int64, Int64) -> Unit,表示该函数有三个参数。
1 | // 参数类型分别为函数类型 (Int64, Int64) -> Int64 和两个 Int64,返回类型为 Unit |
函数类型作为返回类型
函数类型可以作为另一个函数的返回类型。
如下示例中,函数名为 returnAdd,其类型是 () -> (Int64, Int64) -> Int64,表示该函数无参数,返回类型为函数类型 (Int64, Int64) -> Int64。注意,-> 是右结合的。
1 | func add(a: Int64, b: Int64): Int64 { |
函数类型作为变量类型
函数名本身也是表达式,它的类型为对应的函数类型。
1 | func add(p1: Int64, p2: Int64): Int64 { |
上述示例中,函数名是 add,其类型为 (Int64, Int64) -> Int64。变量 f 的类型与 add 类型相同,add 被用来初始化 f。
若一个函数在当前作用域中被重载(见函数重载)了,那么直接使用该函数名作为表达式可能产生歧义,如果产生歧义编译器会报错,例如:
1 | func add(i: Int64, j: Int64) { |
嵌套函数
定义在源文件顶层的函数被称为全局函数。定义在函数体内的函数被称为嵌套函数。
示例,函数 foo 内定义了一个嵌套函数 nestAdd,可以在 foo 内调用该嵌套函数 nestAdd,也可以将嵌套函数 nestAdd 作为返回值返回,在 foo 外对其进行调用:
1 | func foo() { |
程序会输出:
1 | 6 |
Lambda 表达式
Lambda 表达式定义
Lambda 表达式是一种匿名函数(即没有函数名的函数),其核心设计目的是在程序中快速定义简短的函数逻辑,无需显式声明函数名称。这一概念起源于数学中的 λ 演算(lambda calculus),后被引入多种编程语言(如 C++、Python、C# 等),用于简化代码并提升灵活性。仓颉编程语言中也引入了 Lambda 表达式,具体使用介绍将在本小节展开介绍。
Lambda 表达式的语法为如下形式: { p1: T1, ..., pn: Tn => expressions | declarations }。
其中,=> 之前为参数列表,多个参数之间使用 , 分隔,每个参数名和参数类型之间使用 : 分隔。=> 之前也可以没有参数。=> 之后为 Lambda 表达式体,是一组表达式或声明序列。Lambda 表达式的参数名的作用域与函数的相同,为 Lambda 表达式的函数体部分,其作用域级别可视为与 Lambda 表达式的函数体内定义的变量等同。
1 | let f1 = { a: Int64, b: Int64 => a + b } |
Lambda 表达式不管有没有参数,都不可以省略 =>,除非其作为尾随 lambda。例如:
1 | var display = { => println("Hello") } |
Lambda 表达式中参数的类型标注可缺省。以下情形中,若参数类型省略,编译器会尝试进行类型推断,当编译器无法推断出类型时会编译报错:
- Lambda 表达式赋值给变量时,其参数类型根据变量类型推断;
- Lambda 表达式作为函数调用表达式的实参使用时,其参数类型根据函数的形参类型推断。
1 | // The parameter types are inferred from the type of the variable sum1 |
Lambda 表达式中不支持声明返回类型,其返回类型总是从上下文中推断出来,若无法推断则报错。
-
若上下文明确指定了 Lambda 表达式的返回类型,则其返回类型为上下文指定的类型。
-
Lambda 表达式赋值给变量时,其返回类型根据变量类型推断返回类型:
1
let f: () -> Unit = { ... }
-
Lambda 表达式作为参数使用时,其返回类型根据使用处所在的函数调用的形参类型推断:
1
2
3
4
5
6
7func f(a1: (Int64) -> Int64): Int64 {
a1(1)
}
main(): Int64 {
f({ a2: Int64 => a2 + 10 })
} -
Lambda 表达式作为返回值使用时,其返回类型根据使用处所在函数的返回类型推断:
1
2
3func f(): (Int64) -> Int64 {
{ a: Int64 => a }
}
-
-
若上下文中类型未明确,与推导函数的返回值类型类似,编译器会根据 Lambda 表达式体中所有 return 表达式
return xxx中 xxx 的类型,以及 Lambda 表达式体的类型,来共同推导出 Lambda 表达式的返回类型。-
=>右侧的内容与普通函数体的规则一样,返回类型为Int64:1
let sum1 = { a: Int64, b: Int64 => a + b }
-
=>的右侧为空,返回类型为Unit:1
let f = { => }
-
Lambda 表达式调用
Lambda 表达式支持立即调用,例如:
1 | let r1 = { a: Int64, b: Int64 => a + b }(1, 2) // r1 = 3 |
Lambda 表达式也可以赋值给一个变量,使用变量名进行调用,例如:
1 | func f() { |
闭包
一个函数或 lambda 从定义它的静态作用域中捕获了变量,函数或 lambda 和捕获的变量一起被称为一个闭包,这样即使脱离了闭包定义所在的作用域,闭包也能正常运行。
函数或 lambda 的定义中对于以下几种变量的访问,称为变量捕获:
- 函数的参数缺省值中访问了本函数之外定义的局部变量;
- 函数或 lambda 内访问了本函数或本 lambda 之外定义的局部变量;
class/struct内定义的不是成员函数的函数或 lambda 访问了实例成员变量或this。
以下情形的变量访问不是变量捕获:
- 对定义在本函数或本 lambda 内的局部变量的访问;
- 对本函数或本 lambda 的形参的访问;
- 对全局变量和静态成员变量的访问;
- 对实例成员变量在实例成员函数或属性中的访问。由于实例成员函数或属性将
this作为参数传入,在实例成员函数或属性内通过this访问所有实例成员变量。
变量的捕获发生在闭包定义时,因此变量捕获有以下规则:
- 被捕获的变量必须在闭包定义时可见,否则编译报错;
- 被捕获的变量必须在闭包定义时已经完成初始化,否则编译报错。
如果捕获的变量是引用类型,可修改其可变实例成员变量的值。
1 | class C { |
为了防止捕获了 var 声明变量的闭包逃逸,这类闭包只能被调用,不能作为一等公民使用,包括不能赋值给变量,不能作为实参或返回值使用,不能直接将闭包的名字作为表达式使用。
1 | func f() { |
需要注意的是,捕获具有传递性。如果一个函数 f 调用了捕获 var 变量的函数 g,且 g 捕获的 var 变量不在函数 f 内定义,那么函数 f 同样捕获了 var 变量,此时,f 也不能作为一等公民使用。
以下示例中,g 捕获了 var 声明的变量 x,f 调用了 g,且 g 捕获的 x 不在 f 内定义,f 同样不能作为一等公民使用:
1 | func h(){ |
以下示例中,g 捕获了 var 声明的变量 x,f 调用了 g。但 g 捕获的 x 在 f 内定义,f 没有捕获其他 var 声明的变量。因此,f 仍作为一等公民使用:
1 | func h(){ |
静态成员变量和全局变量的访问,不属于变量捕获,因此访问了 var 修饰的全局变量、静态成员变量的函数或 lambda 仍可作为一等公民使用。
1 | class C { |
函数调用语法糖
尾随 lambda
尾随 lambda 可以使函数的调用看起来像是语言内置的语法一样,增加语言的可扩展性。
当函数最后一个形参是函数类型,并且函数调用对应的实参是 lambda 时,可以使用尾随 lambda 语法,将 lambda 放在函数调用的尾部,圆括号外面。
例如,下例中定义了一个 myIf 函数,它的第一个参数是 Bool 类型,第二个参数是函数类型。当第一个参数的值为 true 时,返回第二个参数调用后的值,否则返回 0。调用 myIf 时可以像普通函数一样调用,也可以使用尾随 lambda 的方式调用。
1 | func myIf(a: Bool, fn: () -> Int64) { |
当函数调用有且只有一个 lambda 实参时,还可以省略 (),只写 lambda。
示例:
1 | func f(fn: (Int64) -> Int64) { fn(1) } |
Flow 表达式
流操作符包括两种:表示数据流向的中缀操作符 |> (称为 pipeline)和表示函数组合的中缀操作符 ~> (称为 composition)。
Pipeline 表达式
当需要对输入数据做一系列的处理时,可以使用 pipeline 表达式来简化描述。pipeline 表达式的语法形式如下:e1 |> e2。等价于如下形式的语法糖:let v = e1; e2(v) 。
其中 e2 是函数类型的表达式,e1 的类型是 e2 的参数类型的子类型。
示例:
1 | func inc(x: Array<Int64>): Array<Int64> { // Increasing the value of each element in the array by '1' |
Composition 表达式
composition 表达式表示两个单参函数的组合。composition 表达式语法为 f ~> g,等价于 { x => g(f(x)) }。
其中 f,g 均为只有一个参数的函数类型的表达式。
f 和 g 组合,则要求 f(x) 的返回类型是 g(...) 的参数类型的子类型。
示例 1:
1 | func f(x: Int64): Float64 { |
示例 2:
1 | func f(x: Int64): Float64 { |
示例 3:
1 | func h1<T>(x: T): T { x } |
注意:
表达式 f ~> g 中,会先对 f 求值,然后对 g 求值,最后才会进行函数的组合。
另外,流操作符不能与无默认值的命名形参函数直接一同使用,这是因为无默认值的命名形参函数必须给出命名实参才可以调用。例如:
1 | func f(a!: Int64): Unit {} |
如果需要使用,开发者可以通过 lambda 表达式传入 f 函数的命名实参:
1 | func f(a!: Int64): Unit {} |
由于相同的原因,当 f 的参数有默认值时,直接与流运算符一起使用也是错误的,例如:
1 | func f(a!: Int64 = 2): Unit {} |
但是当命名形参都存在默认值时,不需要给出命名实参也可以调用该函数,函数仅需要传入非命名形参,那么这种函数是可以同流运算符一起使用的,例如:
1 | func f(a: Int64, b!: Int64 = 2): Unit {} |
当然,如果想要在调用 f 时,为参数 b 传入其他参数,那么也需要借助 lambda 表达式:
1 | func f(a: Int64, b!: Int64 = 2): Unit {} |
变长参数
变长参数是一种特殊的函数调用语法糖。当形参最后一个非命名参数是 Array 类型时,实参中对应位置可以直接传入参数序列代替 Array 字面量(参数个数可以是 0 个或多个)。示例如下:
1 | func sum(arr: Array<Int64>) { |
程序输出:
1 | 0 |
需要注意,只有最后一个非命名参数可以作为变长参数,命名参数不能使用这个语法糖。
1 | func length(arr!: Array<Int64>) { |
变长参数可以出现在全局函数、静态成员函数、实例成员函数、局部函数、构造函数、函数变量、lambda、函数调用操作符重载、索引操作符重载的调用处。不支持其他操作符重载、composition、pipeline 这几种调用方式。示例如下:
1 | class Counter { |
程序输出:
1 | 2 |
函数重载决议总是会优先考虑不使用变长参数就能匹配的函数,只有在所有函数都不能匹配,才尝试使用变长参数解析。示例如下:
1 | func f<T>(x: T) where T <: ToString { |
程序输出:
1 | array: [] |
当编译器无法决议时会报错:
1 | func f(arr: Array<Int64>) { arr.size } |
函数重载
函数重载定义
在仓颉编程语言中,如果一个作用域中,一个函数名对应多个函数定义,这种现象称为函数重载。
-
函数名相同,函数参数不同(是指参数个数不同,或者参数个数相同但参数类型不同)的两个函数构成重载。示例如下:
1
2
3
4
5
6
7
8
9// Scenario 1
func f(a: Int64): Unit {
}
func f(a: Float64): Unit {
}
func f(a: Int64, b: Float64): Unit {
} -
对于两个同名泛型函数 (详见泛型函数章节),如果重命名一个函数的泛型形参后(使泛型参数顺序相同),其非泛型部分与另一个函数的非泛型部分函数参数不同,则两个函数构成重载,否则这两个泛型函数构成重复定义错误(类型变元的约束不参与判断)。示例如下:
1
2
3
4
5
6
7
8interface I1{}
interface I2{}
func f1<X, Y>(a: X, b: Y) {}
func f1<Y, X>(a: X, b: Y) {} // Ok: after rename generic type parameter, it will be 'func f1<X, Y>(a: Y, b: X)'
func f2<T>(a: T) where T <: I1 {}
func f2<T>(a: T) where T <: I2 {} // Error, not overloading -
同一个类内的两个构造函数参数不同,构成重载。示例如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15// Scenario 2
class C {
var a: Int64
var b: Float64
public init(a: Int64, b: Float64) {
this.a = a
this.b = b
}
public init(a: Int64) {
b = 0.0
this.a = a
}
} -
同一个类内的主构造函数和
init构造函数参数不同,构成重载(认为主构造函数和init函数具有相同的名字)。示例如下:1
2
3
4
5
6
7
8
9
10
11
12// Scenario 3
class C {
C(var a!: Int64, var b!: Float64) {
this.a = a
this.b = b
}
public init(a: Int64) {
b = 0.0
this.a = a
}
} -
两个函数名相同,参数不同的函数定义在不同的作用域,在两个函数都可见的作用域中构成重载。示例如下:
1
2
3
4
5
6
7
8// Scenario 4
func f(a: Int64): Unit {
}
func g() {
func f(a: Float64): Unit {
}
} -
如果子类中存在与父类同名的函数,并且函数的参数类型不同,则构成函数重载。示例如下:
1
2
3
4
5
6
7
8
9
10// Scenario 5
open class Base {
public func f(a: Int64): Unit {
}
}
class Sub <: Base {
public func f(a: Float64): Unit {
}
}
只允许函数声明引入的函数重载,但是以下情形不构成重载,不构成重载的两个名字不能定义或声明在同一个作用域内:
- class、interface、struct 类型的静态成员函数和实例成员函数之间不能重载
- enum 类型的 constructor、静态成员函数和实例成员函数之间不能重载
如下示例,两个变量均为函数类型且函数参数类型不同,但由于它们不是函数声明所以不能重载,如下示例将编译报错(重定义错):
1 | main() { |
如下示例,虽然变量 f 为函数类型,但由于变量和函数之间不能同名,如下示例将编译报错(重定义错):
1 | main() { |
如下示例,静态成员函数 f 与实例成员函数 f 的参数类型不同,但由于类内静态成员函数和实例成员函数之间不能重载,如下示例将编译报错:
1 | class C { |
函数重载决议
函数调用时,所有可被调用的函数(是指当前作用域可见且能通过类型检查的函数)构成候选集,候选集中有多个函数,究竟选择候选集中哪个函数,需要进行函数重载决议,有如下规则:
-
优先选择作用域级别高的作用域内的函数。在嵌套的表达式或函数中,越是内层作用域级别越高。
如下示例中在
inner函数体内调用g(Sub())时,候选集包括inner函数内定义的函数g和inner函数外定义的函数g,函数决议选择作用域级别更高的inner函数内定义的函数g。1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16open class Base {}
class Sub <: Base {}
func outer() {
func g(a: Sub) {
print("1")
}
func inner() {
func g(a: Base) {
print("2")
}
g(Sub()) // Output: 2
}
} -
如果作用域级别相对最高的仍有多个函数,则需要选择最匹配的函数(对于函数 f 和 g 以及给定的实参,如果 f 可以被调用时 g 也总是可以被调用的,但反之不然,则称 f 比 g 更匹配)。如果不存在唯一最匹配的函数,则报错。
如下示例中,两个函数
g定义在同一作用域,选择更匹配的函数g(a: Sub): Unit。1
2
3
4
5
6
7
8
9
10
11
12
13
14open class Base {}
class Sub <: Base {}
func outer() {
func g(a: Sub) {
print("1")
}
func g(a: Base) {
print("2")
}
g(Sub()) // Output: 1
} -
子类和父类认为是同一作用域。如下示例中,一个函数
g定义在父类中,另一个函数g定义在子类中,在调用s.g(Sub())时,两个函数g当成同一作用域级别决议,则选择更匹配的父类中定义的函数g(a: Sub): Unit。1
2
3
4
5
6
7
8
9
10
11
12
13
14open class Base {
public func g(a: Sub) { print("1") }
}
class Sub <: Base {
public func g(a: Base) {
print("2")
}
}
func outer() {
let s: Sub = Sub()
s.g(Sub()) // Output: 1
}
操作符重载
如果希望在某个类型上支持此类型默认不支持的操作符,可以使用操作符重载实现。
如果需要在某个类型上重载某个操作符,可以通过为类型定义一个函数名为此操作符的函数的方式实现,这样,在该类型的实例使用该操作符时,就会自动调用此操作符函数。
操作符函数定义与普通函数定义相似,区别如下:
- 定义操作符函数时需要在
func关键字前面添加operator修饰符; - 操作符函数的参数个数需要匹配对应操作符的要求(详见附录操作符);
- 操作符函数只能定义在 class、interface、struct、enum 和 extend 中;
- 操作符函数具有实例成员函数的语义,所以禁止使用
static修饰符; - 操作符函数不能为泛型函数。
另外,需要注意的是,被重载后的操作符不改变它们固有的优先级和结合性(详见附录操作符)。
操作符重载函数定义和使用
定义操作符函数有两种方式:
- 对于可以直接包含函数定义的类型 (包括
struct、enum、class和interface),可以直接在其内部定义操作符函数的方式实现操作符的重载。 - 使用
extend的方式为其添加操作符函数,从而实现操作符在这些类型上的重载。对于无法直接包含函数定义的类型(是指除struct、class、enum和interface之外其他的类型)或无法改变其实现的类型,比如第三方定义的struct、class、enum和interface,只能采用这种方式(参见扩展)。
操作符函数对参数类型的约定如下:
-
对于一元操作符,操作符函数没有参数,对返回值的类型没有要求。
-
对于二元操作符,操作符函数只有一个参数,对返回值的类型没有要求。
如下示例中介绍了一元操作符和二元操作符的定义和使用:
-实现对一个Point实例中两个成员变量x和y取负值,然后返回一个新的Point对象,+实现对两个Point实例中两个成员变量x和y分别求和,然后返回一个新的Point对象。1
2
3
4
5
6
7
8
9
10
11
12
13
14
15open class Point {
var x: Int64 = 0
var y: Int64 = 0
public init (a: Int64, b: Int64) {
x = a
y = b
}
public operator func -(): Point {
Point(-x, -y)
}
public operator func +(right: Point): Point {
Point(this.x + right.x, this.y + right.y)
}
}接下来,就可以在
Point的实例上直接使用一元-操作符和二元+操作符:1
2
3
4
5main() {
let p1 = Point(8, 24)
let p2 = -p1 // p2 = Point(-8, -24)
let p3 = p1 + p2 // p3 = Point(0, 0)
} -
索引操作符(
[])分为取值let a = arr[i]和赋值arr[i] = a两种形式,它们通过是否存在特殊的命名参数 value 来区分不同的重载。索引操作符重载不要求同时重载两种形式,可以只重载赋值不重载取值,反之亦可。索引操作符取值形式
[]内的参数序列对应操作符重载的非命名参数,可以是 1 个或多个,可以是任意类型。不可以有其他命名参数。返回类型可以是任意类型。1
2
3
4
5
6
7
8
9
10
11class A {
operator func [](arg1: Int64, arg2: String): Int64 {
return 0
}
}
func f() {
let a = A()
let b: Int64 = a[1, "2"]
// b == 0
}索引操作符赋值形式
[]内的参数序列对应操作符重载的非命名参数,可以是 1 个或多个,可以是任意类型。=右侧的表达式对应操作符重载的命名参数,有且只能有一个命名参数,该命名参数的名称必须是 value, 不能有默认值,value 可以是任意类型。返回类型必须是 Unit 类型。需要注意的是,value 只是一种特殊的标记,在索引操作符赋值时并不需要使用命名参数的形式调用。
1
2
3
4
5
6
7
8
9
10class A {
operator func [](arg1: Int64, arg2: String, value!: Int64): Unit {
return
}
}
func f() {
let a = A()
a[1, "2"] = 0
}特别的,除
enum外的不可变类型不支持重载索引操作符赋值形式。 -
函数调用操作符(
())重载函数,输入参数和返回值类型可以是任意类型。示例如下:1
2
3
4
5
6
7
8
9
10open class A {
public init() {}
public operator func ()(): Unit {}
}
func test1() {
let a = A() // Ok, A() is call the constructor of A
a() // Ok, a() is to call the operator () overloading function
}不能使用
this或super调用()操作符重载函数。示例如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23open class A {
public init() {}
public init(x: Int64) {
this() // Ok, this() calls the constructor of A
}
public operator func ()(): Unit {}
public func foo() {
this() // Error, this() calls the constructor of A
super() // Error
}
}
class B <: A {
public init() {
super() // Ok, super() calls the constuctor of the super class
}
public func goo() {
super() // Error
}
}对于枚举类型,当构造器形式和
()操作符重载函数形式都满足时,优先匹配构造器形式。示例如下:1
2
3
4
5
6
7
8
9
10
11
12
13
14enum E {
Y | X | X(Int64)
public operator func ()(p: Int64) {}
public operator func ()(p: Float64) {}
}
main() {
let e = X(1) // Ok, X(1) is to call the constructor X(Int64)
X(1.0) // Ok, X(1.0) is to call the operator () overloading function
let e1 = X
e1(1) // Ok, e1(1) is to call the operator () overloading function
Y(1) // oK, Y(1) is to call the operator () overloading function
}
可以被重载的操作符
下表列出了所有可以被重载的操作符(优先级从高到低):
| Operator | Description |
|---|---|
() |
Function call |
[] |
Indexing |
! |
NOT |
- |
Negative |
** |
Power |
* |
Multiply |
/ |
Divide |
% |
Remainder |
+ |
Add |
- |
Subtract |
<< |
Bitwise left shift |
>> |
Bitwise right shift |
< |
Less than |
<= |
Less than or equal |
> |
Greater than |
>= |
Greater than or equal |
== |
Equal |
!= |
Not equal |
& |
Bitwise AND |
^ |
Bitwise XOR |
| ` | ` |
需要注意的是:
- 一旦在某个类型上重载了除关系操作符(
<、<=、>、>=、==和!=)之外的其他二元操作符,并且操作符函数的返回类型与左操作数的类型一致或是其子类型,那么此类型支持对应的复合赋值操作符。当操作符函数的返回类型与左操作数的类型不一致且不是其子类型时,在使用对应的复合赋值符号时将报类型不匹配错误。- 仓颉编程语言不支持自定义操作符,即不允许定义除上表中所列
operator之外的其他操作符函数。- 对于类型
T, 如果T已经默认支持了上述若干可重载操作符,那么通过扩展的方式再次为其实现同签名的操作符函数时将报重定义错误。例如,为数值类型重载其已支持的同签名算术操作符、位操作符或关系操作符等操作符时,为Rune重载同签名的关系操作符时,为Bool类型重载同签名的逻辑操作符、判等或不等操作符时,等等这些情况,均会报重定义错误。
const 函数和常量求值
常量求值允许某些特定形式的表达式在编译时求值,可以减少程序运行时需要的计算。
const 上下文与 const 表达式
const 上下文是指 const 变量初始化表达式,这些表达式始终在编译时求值。因此需要对 const 上下文中允许的表达式加以限制,避免修改全局状态、I/O 等副作用,确保其可以在编译时求值。
const 表达式具备了可以在编译时求值的能力。满足如下规则的表达式是 const 表达式:
- 数值类型、
Bool、Unit、Rune、String类型的字面量(不包含插值字符串)。 - 所有元素都是
const表达式的Array字面量(不能是Array类型,可以使用VArray类型),tuple字面量。 const变量,const函数形参,const函数中的局部变量。const函数,包含使用const声明的函数名、符合const函数要求的lambda、以及这些函数返回的函数表达式。const函数调用(包含const构造函数),该函数的表达式必须是const表达式,所有实参必须都是const表达式。- 所有参数都是
const表达式的enum构造器调用,和无参数的enum构造器。 - 数值类型、
Bool、Unit、Rune、String类型的算术表达式、关系表达式、位运算表达式,所有操作数都必须是const表达式。 if、match、try、throw、return、is、as。这些表达式内的表达式必须都是const表达式。const表达式的成员访问(不包含属性的访问),tuple的索引访问。const init和const函数中的this和super表达式。const表达式的const实例成员函数调用,且所有实参必须都是const表达式。
注意:
当前编译器实现暂不支持
throw作为const表达式使用。
const 函数
const 函数是一类特殊的函数,这些函数具备了可以在编译时求值的能力。在 const 上下文中调用这种函数时,这些函数会在编译时执行计算。而在其他非 const 上下文,const 函数会和普通函数一样在运行时执行。
下例是一个计算平面上两点距离的 const 函数,distance 中使用 let 定义了两个局部变量 dx 和 dy:
1 | struct Point { |
编译运行输出:
1 | 5.000000 |
需要注意:
const函数声明必须使用const修饰。- 全局
const函数和static const函数中只能访问const声明的外部变量,包含const全局变量、const静态成员变量,其他外部变量都不可访问。const init函数和const实例成员函数除了能访问const声明的外部变量,还可以访问当前类型的实例成员变量。 const函数中的表达式都必须是const表达式,const init函数除外。const函数中可以使用let、const声明新的局部变量。但不支持var。const函数中的参数类型和返回类型没有特殊规定。如果该函数调用的实参不符合const表达式要求,那这个函数调用不能作为const表达式使用,但仍然可以作为普通表达式使用。const函数不一定都会在编译时执行,例如可以在非const函数中运行时调用。const函数与非const函数重载规则一致。- 数值类型、
Bool、Unit、Rune、String类型 和enum支持定义const实例成员函数。 - 对于
struct和class,只有定义了const init才能定义const实例成员函数。class中的const实例成员函数不能是open的。struct中的const实例成员函数不能是mut的。
另外,接口中也可以定义 const 函数,但会受到以下规则限制:
- 接口中的
const函数,实现类型必须也用const函数才算实现接口。 - 接口中的非
const函数,实现类型使用const或非const函数都算实现接口。 - 接口中的
const函数与接口的static函数一样,只有在该接口作为泛型约束的时候,受约束的泛型变元或变量才能使用这些const函数。
在下面的例子中,在接口 I 里定义了两个 const 函数,类 A 实现了接口 I,泛型函数 g 的形参类型上界是 I。
1 | interface I { |
编译执行上述代码,输出结果为:
1 | 1 |
const init
如果一个 struct 或 class 定义了 const 构造器,那么这个 struct/class 实例可以用在 const 表达式中。
- 如果当前类型是
class,则不能具有var声明的实例成员变量,否则不允许定义const init。如果当前类型具有父类,当前的const init必须调用父类的const init(可以显式调用或者隐式调用无参const init),如果父类没有const init则报错。 - 当前类型的实例成员变量如果有初始值,初始值必须要是
const表达式,否则不允许定义const init。 const init内可以使用赋值表达式对实例成员变量赋值,除此以外不能有其他赋值表达式。
const init 与 const 函数的区别是 const init 内允许对实例成员变量进行赋值(需要使用赋值表达式)。