最近业余时间想学习点新知识,目前当先流行的大数据处理框架,spark&flink,但由于底层源码是scala写的,不得以先来学习一下前置知识-scala
scala简介
- scala是运行在jvm的多范式编程语言,同时支持面向对象和面向函数编程
2.scala在早期并未受到重视,随着大数据处理框架spark和kafka的兴起,这门语言才开始走入开发者世界
3.官网地址:http://www.scala-lang.org
使用scala语言的好处
1.开发大数据应用程序(Spark程序、Flink程序)
2.一行代码抵得上java多行
3.兼容java,可以使用java类库
scala中声明变量
1.语法格式
val/var 变量名称:变量类型=初始值
- val定义的是不可重新赋值的变量(不能被修改);
- var定义的是可以重新赋值的变量(能被修改)
- scala中声明变量是变量名在前,变量类型在后,跟java正好相反。
- scala语句的末尾不需要加分号
2.示例
使用val声明变量,相当于java中的final,不能再被指向其他的数据
val a:Int =20
使用var来声明变量时,后期可以被赋值成其他
var b:Int =1
b=30
scala中变量的类型可以显示的声明,也可以不声明,如果没有声明时,会根据变量来推断变量的类型(scala支持类型推断)
3.代码截图
23f4468e97118489b810ca89eebf5c5.png
4.惰性变量
- scala中使用关键字lazy来定义惰性变量,实现懒加载
- 惰性变量只能是不可变变量,并且只有在调用惰性变量时,才会去实例化这个变量
- 语法格式
lazy val 变量名=表达式
代码
69fa97c324bc16917d4c70af7a9209c.png
scala数据类型
基础类型 | 类型说明 |
---|---|
Byte | 8位带符号整数 |
Short | 16位带符号整数 |
Int | 32位带符号整数 |
Long | 64位带符号整数 |
Char | 16位不带符号Unicode字符 |
String | 字符串 |
Float | 32位单精度浮点数 |
Double | 64位双精度浮点数 |
Boolean | true或false |
scala与java的区别
- scala中的数据类型首字母都是大写
- scala中定义变量,可以不声明类型,让其自行推断
-
scala类型层次结构
1556592270468.png
类型 | 说明 |
---|---|
Any | 所有类型的父类,,它有两个子类AnyRef与AnyVal |
AnyVal | 所有数值类型的父类 |
AnyRef | 所有对象类型(引用类型)的父类 |
Unit | 表示空,Unit是AnyVal的子类,它只有一个的实例(),它类似于Java中的void,但scala要比Java更加面向对象 |
Null | Null是AnyRef的子类,也就是说它是所有引用类型的子类。它的实例是null, 可以将null赋值给任何对象类型 |
Nothing | 所有类型的子类不能直接创建该类型实例,某个方法抛出异常时,返回的就是Nothing类型,因为Nothing是所有类的子类,那么它可以赋值为任何类型 |
条件表达式
-
条件表达式就是if表达式,if表达式可以根据给定的条件是否满足,根据条件的结果(真或假)决定执行对应的操作。
3df35f20a602049fa9310812f10d657.png
1b9e043bf543d6ffa9a58016fe04885.png
块表达式
- 定义变量时用{}包含一系列表达式,其中块的最后一个表达式的值就是块的值
val x=0
val result={
val y=x+10
val z=y+"-hello"
val m=z+"-kaikeba"
"over"
}
//result的值就是块表达式的结果
后期一个方法的返回值不需要加上return,把要返回的结果放在方法的最后一行就可以了
循环
scala 语言中也可以使用循环,包括for循环和while循环 ,一般推荐使用for表达式,它表达起来显得更加简洁
1.for循环语法
for (i <- 表达式/数组、集合) {}
-
2.代码示例
5fd4dd0ea4ee50531a8611ec5eea63a.png
3.双重for循环
-
代码示例
a7c2d27e6cbc31a6f4a6c66de255073.png
4.守卫
- 在for表达式中可以添加if判断语句,这个if判断就称为守卫
语法结构
for(i <- 表达式/数组/集合 if 表达式) {
// 表达式
}
- 5.for 推导式
在for循环体中,可以使用yield表达式构建出一个集合,我们把yield的for表达式称之为推导式
while 循环
语法结构
while(返回值为布尔类型的表达式){
//表达式
}