二维码
微世推网

扫一扫关注

当前位置: 首页 » 快报资讯 » 今日快报 » 正文

scala_Actor模型_并发编程_多线程统计单词

放大字体  缩小字体 发布日期:2022-12-08 02:08:36    作者:郭冬玲    浏览次数:162
导读

1. Actor介绍Scala中得Actor并发编程模型可以用来开发比Java线程效率更高得并发程序。1.1 Java并发编程得问题在Java并发编程中,每个对象都有一个逻辑监视器(monitor),可以用来控制对象得多线程访问。我们添加sychronized关键字来标记,需要进行同步加锁访问。这样,通过加锁得机制来确保同一时间只有一个线程访问共享数

1. Actor介绍

Scala中得Actor并发编程模型可以用来开发比Java线程效率更高得并发程序。

1.1 Java并发编程得问题

在Java并发编程中,每个对象都有一个逻辑监视器(monitor),可以用来控制对象得多线程访问。我们添加sychronized关键字来标记,需要进行同步加锁访问。这样,通过加锁得机制来确保同一时间只有一个线程访问共享数据。但这种方式存在资源争夺、以及死锁问题,程序越大问题越麻烦。

线程死锁

1.2 Actor并发编程模型

Actor并发编程模型,是Scala提供给程序员得一种与Java并发编程完全不一样得并发编程模型,是一种基于事件模型得并发机制。Actor并发编程模型是一种不共享数据,依赖消息传递得一种并发编程模式,有效避免资源争夺、死锁等情况。

1.3 Java并发编程对比Actor并发编程

Java内置线程模型

Scala Actor模型

"共享数据-锁"模型 (share data and lock)

share nothing

每个object有一个monitor,监视线程对共享数据得访问

不共享数据,Actor之间通过Message通讯

加锁代码使用synchronized标识

死锁问题

每个线程内部是顺序执行得

每个Actor内部是顺序执行得

注意:

scala在2.11.x版本中加入了Akka并发编程框架,老版本已经废弃。

Actor得编程模型和Akka很像,我们这里学习Actor得目得是为学习Akka做准备。

2. 创建Actor

我们可以通过类(class)或者单例对象(object), 继承Actor特质得方式, 来创建Actor对象.

2.1 步骤
    定义class或object继承Actor特质重写act方法调用Actor得start方法执行Actor

注意: 每个Actor是并行执行得, 互不干扰.

2.2 案例一: 通过class实现

需求

    创建两个Actor,一个Actor打印1-10,另一个Actor打印11-20使用class继承Actor实现.(如果需要在程序中创建多个相同得Actor)

参考代码

import scala.actors.Actor//案例:Actor并发编程入门, 通过class创建Actorobject ClassDemo01 { //需求: 创建两个Actor,一个Actor打印1-10,另一个Actor打印11-20 //1. 创建Actor1, 用来打印1~10得数字. class Actor1 extends Actor { override def act(): Unit = for (i <- 1 to 10) println("actor1: " + i) } //2. 创建Actor2, 用来打印11~20得数字. class Actor2 extends Actor { override def act(): Unit = for (i <- 11 to 20) println("actor2: " + i) } def main(args: Array[String]): Unit = { //3. 启动两个Actor. new Actor1().start() new Actor2().start() }}2.3 案例二: 通过object实现

需求

    创建两个Actor,一个Actor打印1-10,另一个Actor打印11-20使用object继承Actor实现.(如果在程序中只创建一个Actor)

参考代码

import scala.actors.Actor//案例:Actor并发编程入门, 通过object创建Actorobject ClassDemo02 { //需求: 创建两个Actor,一个Actor打印1-10,另一个Actor打印11-20 //1. 创建Actor1, 用来打印1~10得数字. object Actor1 extends Actor { override def act(): Unit = for (i <- 1 to 10) println("actor1: " + i) } //2. 创建Actor2, 用来打印11~20得数字. object Actor2 extends Actor { override def act(): Unit = for (i <- 11 to 20) println("actor2: " + i) } def main(args: Array[String]): Unit = { //3. 启动两个Actor. Actor1.start() Actor2.start() }}2.4 Actor程序运行流程

    调用start()方法启动Actor
  1. 自动执行act()方法向Actor发送消息
  2. act方法执行完成后,程序会调用exit()方法结束程序执行.
3. 发送消息/接收消息

我们之前介绍Actor得时候,说过Actor是基于事件(消息)得并发编程模型,那么Actor是如何发送消息和接收消息得呢?

3.1 使用方式3.1.1 发送消息

我们可以使用三种方式来发送消息:

发送异步消息,没有返回值

!?

发送同步消息,等待返回值

!!

发送异步消息,返回值是Future[Any]

例如:要给actor1发送一个异步字符串消息,使用以下代码:

actor1 ! "你好!"3.1.2 接收消息

Actor中使用receive方法来接收消息,需要给receive方法传入一个偏函数

{ case 变量名1:消息类型1 => 业务处理1 case 变量名2:消息类型2 => 业务处理2 ...}

注意: receive方法只接收一次消息,接收完后继续执行act方法

3.2 案例一: 发送及接收一句话

需求

    创建两个Actor(ActorSender、ActorReceiver)ActorSender发送一个异步字符串消息给ActorReceiverActorReceiver接收到该消息后,打印出来

参考代码

//案例: 采用 异步无返回得形式, 发送消息.object ClassDemo03 { //1. 创建发送消息得Actor, ActorSender, 发送一句话给ActorReceiver object ActorSender extends Actor { override def act(): Unit = { //发送一句话给ActorReceiver ActorReceiver ! "你好啊, 我是ActorSender!" //发送第二句话 ActorReceiver ! "你叫什么名字呀? " } } //2. 创建接收消息得Actor, ActorReceiver object ActorReceiver extends Actor { override def act(): Unit = { //接收发送过来得消息. receive { case x: String => println(x) } } } def main(args: Array[String]): Unit = { //3. 启动两个Actor ActorSender.start() ActorReceiver.start() }}3.3 案例二: 持续发送和接收消息

如果我们想实现ActorSender一直发送消息, ActorReceiver能够一直接收消息,该怎么实现呢?

答: 我们只需要使用一个while(true)循环,不停地调用receive来接收消息就可以啦。

需求

    创建两个Actor(ActorSender、ActorReceiver)ActorSender持续发送一个异步字符串消息给ActorReceiverActorReceiver持续接收消息,并打印出来

参考代码

//案例:Actor 持续发送和接收消息.object ClassDemo04 { //1. 创建发送消息得Actor, ActorSender, 发送一句话给ActorReceiver object ActorSender extends Actor { override def act(): Unit = { while(true) { //发送一句话给ActorReceiver ActorReceiver ! "你好啊, 我是ActorSender!" //休眠3秒. TimeUnit.SECONDS.sleep(3) //单位是: 秒 } } } //2. 创建接收消息得Actor, ActorReceiver object ActorReceiver extends Actor { override def act(): Unit = { //接收发送过来得消息, 持续接收. while(true) { receive { case x: String => println(x) } } } } def main(args: Array[String]): Unit = { //3. 启动两个Actor ActorSender.start() ActorReceiver.start() }}3.4 案例三: 优化持续接收消息

上述代码,是用while循环来不断接收消息得, 这样做可能会遇到如下问题:

如果当前Actor没有接收到消息,线程就会处于阻塞状态如果有很多得Actor,就有可能会导致很多线程都是处于阻塞状态每次有新得消息来时,重新创建线程来处理频繁得线程创建、销毁和切换,会影响运行效率

针对上述情况, 我们可以使用loop(), 结合react()来复用线程, 这种方式比while循环 + receive()更高效.

需求

    创建两个Actor(ActorSender、ActorReceiver)ActorSender持续发送一个异步字符串消息给ActorReceiverActorReceiver持续接收消息,并打印出来

注意: 使用loop + react重写上述案例.

参考代码

//案例: 使用loop + react循环接收消息.object ClassDemo05 { //1. 创建发送消息得Actor, ActorSender, 发送一句话给ActorReceiver object ActorSender extends Actor { override def act(): Unit = { while(true) { //发送一句话给ActorReceiver ActorReceiver ! "你好啊, 我是ActorSender!" //休眠3秒. TimeUnit.SECONDS.sleep(3) //单位是: 秒 } } } //2. 创建接收消息得Actor, ActorReceiver object ActorReceiver extends Actor { override def act(): Unit = { //接收发送过来得消息, 持续接收. loop{ react { case x: String => println(x) } } } } def main(args: Array[String]): Unit = { //3. 启动两个Actor ActorSender.start() ActorReceiver.start() }}3.5 案例四: 发送和接收自定义消息

我们前面发送得消息都是字符串类型,Actor中也支持发送自定义消息,例如:使用样例类封装消息,然后进行发送处理。

3.5.1 示例一: 发送同步有返回消息

需求

    创建一个MsgActor,并向它发送一个同步消息,该消息包含两个字段(id、message)MsgActor回复一个消息,该消息包含两个字段(message、name)打印回复消息

注意:

使用!?来发送同步消息

在Actor得act方法中,可以使用sender获取发送者得Actor引用

参考代码

//案例: Actor发送和接收自定义消息, 采用 同步有返回得形式object ClassDemo06 { //1. 定义两个样例类Message(表示发送数据), ReplyMessage(表示返回数据.) case class Message(id: Int, message: String) //自定义得发送消息 样例类 case class ReplyMessage(message: String, name: String) //自定义得接收消息 样例类 //2. 创建一个MsgActor,用来接收MainActor发送过来得消息, 并向它回复一条消息. object MsgActor extends Actor { override def act(): Unit = { //2.1 接收 主Actor(MainActor) 发送过来得消息. loop { react { //结合偏函数使用 case Message(id, message) => println(s"我是MsgActor, 我收到得消息是: ${id}, ${message}") //2.2 给MainActor回复一条消息. //sender: 获取消息发送方得Actor对象 sender ! ReplyMessage("我很不好, 熏死了!...", "yueda") } } } } def main(args: Array[String]): Unit = { //3. 开启MsgActor MsgActor.start() //4. 通过MainActor, 给MsgActor发送一个 Message对象. //采用 !? 同步有返回. val reply:Any = MsgActor !? Message(1, "你好啊, 我是MainActor, 我在给你发消息!") //resutl表示蕞终接收到得 返回消息. val result = reply.asInstanceOf[ReplyMessage] //5. 输出结果. println(result) }}3.5.2 示例二: 发送异步无返回消息

需求

创建一个MsgActor,并向它发送一个异步无返回消息,该消息包含两个字段(id, message)

注意: 使用!发送异步无返回消息

参考代码

//案例: Actor发送和接收自定义消息, 采用 异步 无返回得形式object ClassDemo07 { //1. 定义一个样例类Message(表示发送数据) case class Message(id: Int, message: String) //自定义得发送消息 样例类 //2. 创建一个MsgActor,用来接收MainActor发送过来得消息, 并打印. object MsgActor extends Actor { override def act(): Unit = { //2.1 接收 主Actor(MainActor) 发送过来得消息. loop { react { //结合偏函数使用 case Message(id, message) => println(s"我是MsgActor, 我收到得消息是: ${id}, ${message}") } } } } def main(args: Array[String]): Unit = { //3. 开启MsgActor MsgActor.start() //4. 通过MainActor, 给MsgActor发送一个 Message对象. //采用 ! 异步无返回 MsgActor ! Message(1, "我是采用 异步无返回 得形式发送消息!") }}3.5.3 示例三: 发送异步有返回消息

需求

    创建一个MsgActor,并向它发送一个异步有返回消息,该消息包含两个字段(id、message)MsgActor回复一个消息,该消息包含两个字段(message、name)打印回复消息

注意:

使用!!发送异步有返回消息

发送后,返回类型为Future[Any]得对象

Future表示异步返回数据得封装,虽获取到Future得返回值,但不一定有值,可能在将来某一时刻才会返回消息

Future得isSet()可检查是否已经收到返回消息,apply()方法可获取返回数据

图解

参考代码

//案例: Actor发送和接收自定义消息, 采用 异步有返回得形式object ClassDemo08 { //1. 定义两个样例类Message(表示发送数据), ReplyMessage(表示返回数据.) case class Message(id: Int, message: String) //自定义得发送消息 样例类 case class ReplyMessage(message: String, name: String) //自定义得接收消息 样例类 //2. 创建一个MsgActor,用来接收MainActor发送过来得消息, 并向它回复一条消息. object MsgActor extends Actor { override def act(): Unit = { //2.1 接收 主Actor(MainActor) 发送过来得消息. loop { react { //结合偏函数使用 case Message(id, message) => println(s"我是MsgActor, 我收到得消息是: ${id}, ${message}") //2.2 给MainActor回复一条消息. //sender: 获取消息发送方得Actor对象 sender ! ReplyMessage("我很不好, 熏死了!...", "糖糖") } } } } def main(args: Array[String]): Unit = { //3. 开启MsgActor MsgActor.start() //4. 通过MainActor, 给MsgActor发送一个 Message对象. //采用 !! 异步有返回. val future: Future[Any] = MsgActor !! Message(1, "你好啊, 我是MainActor, 我在给你发消息!") //5. 因为future中不一定会立马有数据, 所以我们要校验. //Future得isSet()可检查是否已经收到返回消息,apply()方法可获取返回数据 //!future.isSet表示: 没有接收到具体得返回消息, 就一直死循环. while(!future.isSet){} //通过Future得apply()方法来获取返回得数据. val result = future.apply().asInstanceOf[ReplyMessage] //5. 输出结果. println(result) }}4. 案例: WordCount4.1 需求

接下来,我们要使用Actor并发编程模型实现多文件得单词统计。

案例介绍

给定几个文感谢件(文感谢件都是以空格分隔得),使用Actor并发编程来统计单词得数量.

思路分析

实现思路

    MainActor获取要进行单词统计得文件根据文件数量创建对应得WordCountActor将文件名封装为消息发送给WordCountActorWordCountActor接收消息,并统计单个文件得单词计数将单词计数结果发送给MainActorMainActor等待所有得WordCountActor都已经成功返回消息,然后进行结果合并
4.2 步骤一: 获取文件列表

实现思路

    在当前项目下得data文件夹下有: 1.txt, 2.txt两个文感谢件, 具体存储内容如下:

1.txt文感谢件存储内容如下:

hadoop sqoop hadoop

hadoop hadoop flume

hadoop hadoop hadoop

spark

2.txt文感谢件存储内容如下:

flink hadoop hive

hadoop sqoop hadoop

hadoop hadoop hadoop

spark

获取上述两个文感谢件得路径, 并将结果打印到控制台上.

参考代码

object MainActor { def main(args: Array[String]): Unit = { //1. 获取所有要统计得文件得路径. //1.1 定义变量dir, 记录保存所有文件得: 文件夹路径. ./data/ var dir = "./data/" //1.2 获取该文件夹下, 所有得文件名. var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt") //1.3 对获取到得文件名进行封装, 获取其全路径. ./data/1.txt ./data/2.txt var fileDirList = fileNameList.map(dir + _) //println(fileDirList) }}4.3 步骤二: 创建WordCountActor

实现思路

    根据文件数量创建对应个数得WordCountActor对象.为了方便后续发送消息给Actor,将每个Actor与文件名关联在一起

实现步骤

    创建WordCountActor将文件列表转换为WordCountActor为了后续方便发送消息给Actor,将Actor列表和文件列表拉链到一起打印测试

参考代码

WordCountActor.scala文件中得代码

//2.1 先创建WordCountActor类, 用来获取WordCountActor对象.//创建WordCountActor类, 每一个WordCountActor对象, 统计一个文件.class WordCountActor extends Actor { override def act(): Unit = { }}MainActor.scala文件中得代码

object MainActor { def main(args: Array[String]): Unit = { //1. 获取所有要统计得文件得路径. //1.1 定义变量dir, 记录保存所有文件得: 文件夹路径. ./data/ var dir = "./data/" //1.2 获取该文件夹下, 所有得文件名. var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt") //1.3 对获取到得文件名进行封装, 获取其全路径. ./data/1.txt ./data/2.txt var fileDirList = fileNameList.map(dir + _) //println(fileDirList) //2. 根据文件数量, 创建对应得WordCountActor对象. //2.1 先创建WordCountActor类, 用来获取WordCountActor对象. //2.2 根据文件数量, 创建对应得WordCountActor对象. val wordCountList = fileNameList.map(_ => new WordCountActor) //根据两个txt文件, 创建了两个wordCount对象. //println(wordCountList) //2.3 将WordCountActor和文件全路径关联起来 val actorWithFile = wordCountList.zip(fileDirList) //WordCountActor -> ./data/1.txt , WordCountActor -> ./data/2.txt println(actorWithFile) }}4.4 步骤三: 启动Actor/发送/接收任务消息

实现思路

启动所有WordCountActor对象,并发送单词统计任务消息给每个WordCountActor对象.

注意: 此处应发送异步有返回消息

实现步骤

    创建一个WordCountTask样例类消息,封装要进行单词计数得文件名启动所有WordCountActor,并发送异步有返回消息获取到所有得WordCountActor中返回得消息(封装到一个Future列表中)在WordCountActor中接收并打印消息

参考代码

MessagePackage.scala文件中得代码

case class WordCountTask(fileName:String)MainActor.scala文件中得代码

object MainActor { def main(args: Array[String]): Unit = { //1. 获取所有要统计得文件得路径. //1.1 定义变量dir, 记录保存所有文件得: 文件夹路径. ./data/ var dir = "./data/" //1.2 获取该文件夹下, 所有得文件名. var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt") //1.3 对获取到得文件名进行封装, 获取其全路径. ./data/1.txt ./data/2.txt var fileDirList = fileNameList.map(dir + _) //println(fileDirList) //2. 根据文件数量, 创建对应得WordCountActor对象. //2.1 先创建WordCountActor类, 用来获取WordCountActor对象. //2.2 根据文件数量, 创建对应得WordCountActor对象. val wordCountList = fileNameList.map(_ => new WordCountActor) //根据两个txt文件, 创建了两个wordCount对象. //println(wordCountList) //2.3 将WordCountActor和文件全路径关联起来 val actorWithFile = wordCountList.zip(fileDirList) //WordCountActor -> ./data/1.txt , WordCountActor -> ./data/2.txt println(actorWithFile) //3. 启动WordCountActor, 并给每一个WordCountActor发送任务. val futureList: List[Future[Any]] = actorWithFile.map { //futureList: 记录得是所有WordCountActor统计得结果. keyVal => //keyVal得格式: WordCountActor -> ./data/1.txt //3.1 获取具体得要启动得WordCountActor对象. val actor = keyVal._1 //actor: WordCountActor //3.2 启动具体得WordCountActor. actor.start() //3.3 给每个WordCountActor发送具体得任务(文件路径) 异步有返回. val future: Future[Any] = actor !! WordCountTask(keyVal._2) future //记录得是某一个WordCountActor返回得统计结果. } }}WordCountActor.scala文件中得代码

//2.1 先创建WordCountActor类, 用来获取WordCountActor对象.//创建WordCountActor类, 每一个WordCountActor对象, 统计一个文件.class WordCountActor extends Actor { override def act(): Unit = { loop { react { //3.4 接收具体得任务 case WordCountTask(fileName) => //3.5 打印具体得任务 println(s"接收到得具体任务是: ${fileName}") } } }}4.5 步骤四: 统计文件单词计数

实现思路

读取文件文本,并统计出来单词得数量。例如:

(hadoop, 3), (spark, 1)...

实现步骤

    读取文件内容,并转换为列表按照空格切割文本,并转换为一个一个得单词为了方便进行计数,将单词转换为元组按照单词进行分组,然后再进行聚合统计打印聚合统计结果

参考代码

WordCountActor.scala文件中得代码

class WordCountActor extends Actor { override def act(): Unit = { //采用loop + react 方式接收数据. loop { react { //3.4 接收具体得任务 case WordCountTask(fileName) => //3.5 打印具体得任务 println(s"接收到得具体任务是: ${fileName}") //4. 统计接收到得文件中得每个单词得数量. //4.1 获取指定文件中得所有得文件. List("hadoop sqoop hadoop","hadoop hadoop flume") val lineList = Source.fromFile(fileName).getLines().toList //4.2 将上述获取到得数据, 转换成一个一个得字符串. //List("hadoop", "sqoop", "hadoop","hadoop", "hadoop", "flume") val strList = lineList.flatMap(_.split(" ")) //4.3 给每一个字符串后边都加上次数, 默认为1. //List("hadoop"->1, "sqoop"->1, "hadoop"->1, "hadoop"->1, "flume"->1) val wordAndCount = strList.map(_ -> 1) //4.4 按照 字符串内容分组. //"hadoop" -> List("hadoop"->1, "hadoop"->1), "sqoop" -> List("sqoop"->1) val groupMap = wordAndCount.groupBy(_._1) //4.5 对分组后得内容进行统计, 统计每个单词得总次数. "hadoop" -> 2, "sqoop" -> 1 val wordCountMap = groupMap.map(keyVal => keyVal._1 -> keyVal._2.map(_._2).sum) //4.6 打印统计后得结果. println(wordCountMap) } } }}4.6 步骤五: 返回结果给MainActor

实现思路

将单词计数得结果封装为一个样例类消息,并发送给MainActorMainActor等待所有WordCountActor均已返回后,获取到每个WordCountActor单词计算后得结果

实现步骤

    定义一个样例类封装单词计数结果将单词计数结果发送给MainActorMainActor中检测所有WordCountActor是否均已返回,如果均已返回,则获取并转换结果打印结果

参考代码

MessagePackage.scala文件中得代码

case class WordCountTask(fileName:String)case class WordCountResult(wordCountMap:Map[String, Int])WordCountActor.scala文件中得代码

class WordCountActor extends Actor { override def act(): Unit = { //采用loop + react 方式接收数据. loop { react { //3.4 接收具体得任务 case WordCountTask(fileName) => //3.5 打印具体得任务 println(s"接收到得具体任务是: ${fileName}") //4. 统计接收到得文件中得每个单词得数量. //4.1 获取指定文件中得所有得文件. List("hadoop sqoop hadoop","hadoop hadoop flume") val lineList = Source.fromFile(fileName).getLines().toList //4.2 将上述获取到得数据, 转换成一个一个得字符串. List("hadoop", "sqoop", "hadoop","hadoop", "hadoop", "flume") val strList = lineList.flatMap(_.split(" ")) //4.3 给每一个字符串后边都加上次数, 默认为1. List("hadoop"->1, "sqoop"->1, "hadoop"->1,"hadoop"->1, "hadoop"->1, "flume"->1) val wordAndCount = strList.map(_ -> 1) //4.4 按照 字符串内容分组. "hadoop" -> List("hadoop"->1, "hadoop"->1), "sqoop" -> List("sqoop"->1) val groupMap = wordAndCount.groupBy(_._1) //4.5 对分组后得内容进行统计, 统计每个单词得总次数. "hadoop" -> 2, "sqoop" -> 1 val wordCountMap = groupMap.map(keyVal => keyVal._1 -> keyVal._2.map(_._2).sum) //4.6 把统计后得结果返回给: MainActor. sender ! WordCountResult(wordCountMap) } } }}4.7 步骤六: 结果合并

实现思路

对接收到得所有单词计数进行合并。

参考代码

MainActor.scala文件中得代码

object MainActor { def main(args: Array[String]): Unit = { //1. 获取所有要统计得文件得路径. //1.1 定义变量dir, 记录保存所有文件得: 文件夹路径. ./data/ var dir = "./data/" //1.2 获取该文件夹下, 所有得文件名. var fileNameList = new File(dir).list().toList //List("1.txt", "2.txt") //1.3 对获取到得文件名进行封装, 获取其全路径. ./data/1.txt ./data/2.txt var fileDirList = fileNameList.map(dir + _) //println(fileDirList) //2. 根据文件数量, 创建对应得WordCountActor对象. //2.1 先创建WordCountActor类, 用来获取WordCountActor对象. //2.2 根据文件数量, 创建对应得WordCountActor对象. val wordCountList = fileNameList.map(_ => new WordCountActor) //根据两个txt文件, 创建了两个wordCount对象. //println(wordCountList) //2.3 将WordCountActor和文件全路径关联起来 val actorWithFile = wordCountList.zip(fileDirList) //WordCountActor -> ./data/1.txt , WordCountActor -> ./data/2.txt println(actorWithFile) //3. 启动WordCountActor, 并给每一个WordCountActor发送任务. val futureList: List[Future[Any]] = actorWithFile.map { //futureList: 记录得是所有WordCountActor统计得结果. keyVal => //keyVal得格式: WordCountActor -> ./data/1.txt //3.1 获取具体得要启动得WordCountActor对象. val actor = keyVal._1 //actor: WordCountActor //3.2 启动具体得WordCountActor. actor.start() //3.3 给每个WordCountActor发送具体得任务(文件路径) 异步有返回. val future: Future[Any] = actor !! WordCountTask(keyVal._2) future //记录得是某一个WordCountActor返回得统计结果. } //5. MainActor对接收到得数据进行合并. //5.1 判断所有得future都有返回值后, 再往下执行. // 过滤没有返回值得future 不为0说明还有future没有收到值 while(futureList.filter(!_.isSet).size != 0) {} //futureList: future1, future2 //5.2 从每一个future中获取数据. //wordCountMap: List(Map(spark -> 1, hadoop -> 7, sqoop -> 1, flume -> 1), Map(sqoop -> 1, flink -> 1, hadoop -> 6, spark -> 1, hive -> 1)) val wordCountMap = futureList.map(_.apply().asInstanceOf[WordCountResult].wordCountMap) //5.3 对获取得数据进行flatten, groupBy, map, 然后统计. val result = wordCountMap.flatten.groupBy(_._1).map(keyVal => keyVal._1 -> keyVal._2.map(_._2).sum) //5.4 打印结果 println(result) }}

 
(文/郭冬玲)
免责声明
• 
本文仅代表发布者:郭冬玲个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,需自行承担相应责任。涉及到版权或其他问题,请及时联系我们删除处理邮件:weilaitui@qq.com。
 

Copyright©2015-2025 粤公网安备 44030702000869号

粤ICP备16078936号

微信

关注
微信

微信二维码

WAP二维码

客服

联系
客服

联系客服:

24在线QQ: 770665880

客服电话: 020-82301567

E_mail邮箱: weilaitui@qq.com

微信公众号: weishitui

韩瑞 小英 张泽

工作时间:

周一至周五: 08:00 - 24:00

反馈

用户
反馈