创建与查看hdfs目录,IDEA本地运行Spark项目[演示自定义分区器]并查看HDFS结果文件

 2023-09-23 阅读 22 评论 0

摘要:文章目录 一、提出问题二、解决问题(一)添加IP到主机名的映射(二)在本地准备Spark库文件(三)在IDEA里创建Scala项目(四)添加Spark库文件到项目(五)创建自定义分区器(六)测试自定义分区器 三、打包上传,提交运行(一)新建测试自定义分区器类(二)利用IDEA将项目

文章目录

  • 一、提出问题
  • 二、解决问题
    • (一)添加IP到主机名的映射
    • (二)在本地准备Spark库文件
    • (三)在IDEA里创建Scala项目
    • (四)添加Spark库文件到项目
    • (五)创建自定义分区器
    • (六)测试自定义分区器
  • 三、打包上传,提交运行
    • (一)新建测试自定义分区器类
    • (二)利用IDEA将项目打成Jar包
    • (三)上传jar包到服务器
    • (四)提交到Spark集群运行
    • (五)查看生成的结果文件

一、提出问题

  • 一般情况下,在IDEA里编写Spark项目,涉及到HDFS文件读写或Hive操作,都是先打成jar包上传到服务

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/1/90065.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息