文档宝
搜索
首页
计算机
计算机应用/办公自动化
相关推荐
文档详情
14.4.2 自定义的RPC组件客户端相关实现.pdf-吴章勇 杨强-人民邮电出版社
发布:2021-04-27
约字
共页
下载文档
文本预览
下载声明
342大数据Hadoop3.X分布式处理实战*服务对象在服务器上的绑定名,客户端通过该绑定名检索到服务对象*@parammethodName*希望在服务器上调用的远程方法名*@paramar
显示全部
相似文档
14.4.
1
自定义的RPC组件
服务端
相关实现.pdf-吴章勇 杨强-人民邮电出版社
333第14章分布式垃圾消息识别系统RDBMS中,供业务系统使用SQL语句完成实时查询。(3)如果清洗后的结果仍然是海量数据,则可以将其存放到HBase之类的分
2021-04-25
约字
页
立即下载
14
.2.
3
自定义RPC组件
分析
.pdf-吴章勇 杨强-人民邮电出版社
325第14章分布式垃圾消息识别系统(3)等待方法调用结果。(4)解编(读取)返回值或返回的异常。(5)将值返回给调用程序。为了向调用程序展示比较简单的调用机制
2021-04-23
约字
页
立即下载
14.4.
4 业务
客户端实现.pdf-吴章勇 杨强-人民邮电出版社
367第14章分布式垃圾消息识别系统*@return字符串是垃圾信息的比例结果**/floatcomputeStringSpamResult(String[]w
2021-04-23
约字
页
立即下载
8.3
.2 自定义
函数
.pdf-吴章勇 杨强-人民邮电出版社
175第8章Hive高级特性返回类型签名描述stringfrom_unixtime(intunixtime)转换的秒数从Unix纪元(1970-01-0100:
2021-04-24
约字
页
立即下载
4
.2.
3 MapReduce分区与
自定义
数据类型
.pdf-吴章勇 杨强-人民邮电出版社
67第4章分布式计算框架MapReduce图4.7运行参数设置图4.8运行结果4
.2.
3MapReduce分区与
自定义
数据类型在默认情况下,MapReduce认为Reduce函数处理的是数据汇总操作,因此其针对的必定是一个Map函数清洗处理
2021-04-24
约字
页
立即下载
14.4.
3 业务服务器
实现.pdf-吴章勇 杨强-人民邮电出版社
347第14章分布式垃圾消息识别系统至此,已经完整
实现
了
自定义的RPC组件
。完整的示例代码可参考案例源代码的com.Chinasofti.pla
2021-04-24
约字
页
立即下载
7.3
.2
创建表
.pdf-吴章勇 杨强-人民邮电出版社
147第7章分布式数据仓库Hive可见,新建的数据库在HDFS上的存储路径位于hdfs://hadoop0:9000/user/hive/warehouse/
2021-04-24
约字
页
立即下载
3.1
.2
HDFS
的组件.pdf-吴章勇 杨强-人民邮电出版社
33第3章Hadoop分布式文件系统——HDFS2.大规模数据集运行在HDFS上的应用具有很大的数据集。HDFS上一个典型文件的大小一般在吉字节至太字节量级。因
2021-04-24
约字
页
立即下载
13.3.1
实现
HDFS文件操作工具
.pdf-吴章勇 杨强-人民邮电出版社
299第13章电商商品推荐系统(1)HdfsDAO.java:HDFS操作工具类。(2)Step1.java:按用户分组,计算所有物品出现的组合列表,得到用户对
2021-04-26
约字
页
立即下载
13
.2.
4 算法
实现
设计
.pdf-吴章勇 杨强-人民邮电出版社
295第13章电商商品推荐系统的整体多样性不足时,系统可以通过加入ItemCF增加整体的多样性,同样可以提高推荐的精度。4.用户对推荐算法的适应度前面大部分是从
2021-04-25
约字
页
立即下载
13.3.5
实现
任务步骤4:计算推荐结果
.pdf-吴章勇 杨强-人民邮电出版社
310大数据Hadoop3.X分布式处理实战publicstaticvoidrun1(Mappath)throwsIOException,Clas
2021-04-25
约字
页
立即下载
13.3
.2 实现
任务步骤1:汇总用户对所有物品的评分信息
.pdf-吴章勇 杨强-人民邮电出版社
302大数据Hadoop3.X分布式处理实战fsdis=fs.open(path);IOUtils.copyBytes(fsdis,System.out,409
2021-04-26
约字
页
立即下载
13.3.4
实现
任务步骤3:合并同现矩阵和评分矩阵
.pdf-吴章勇 杨强-人民邮电出版社
307第13章电商商品推荐系统3.任务调度与步骤1一样,也需要单独的任务调度方法供统一的任务调度器使用。publicstaticvoidrun(Ma
2021-04-24
约字
页
立即下载
7.3.3
自定义
分区
实现
全排序过程
.pdf-
王宏志 李春静
-人民邮电出版社
200Hadoop集群程序设计与开发在窗口中输入命令后,运行“wq!”命令并保存,此时通过sh命令运行4次新建立的文件createdatas.sh脚本,这样会
2021-04-25
约字
页
立即下载
10.1
.2
Spark伪分布式安装
.pdf-吴章勇 杨强-人民邮电出版社
205第10章内存计算框架Spark尽管创建Spark是为了支持分布式数据集上的迭代作业,但实际上它是对Hadoop的补充,可以在Hadoop文件系统中并行运行。在HadoopMR过程中,中间结果会借助磁盘传递,因此对比计算,大量的MapR
2021-04-23
约字
页
立即下载