统计
  • 建站日期:2021-03-10
  • 文章总数:10247 篇
  • 评论总数:229 条
  • 分类总数:56 个
  • 最后更新:5月17日
文章 未分类

Spark处理json数组fastjson

小天
首页 未分类 正文
json数据格式:

[{"studentName":"lily","studentAge":12},{"studentName":"lucy","studentAge":15}]

pom:

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-core_2.11</artifactId>
    <version>2.2.1</version>
</dependency>
<dependency>
    <groupId>com.alibaba</groupId>
    <artifactId>fastjson</artifactId>
    <version>1.2.44</version>
</dependency>

val conf = new SparkConf().setMaster("local").setAppName("json test")
val sc = new SparkContext(conf)
val textFile = sc.textFile("f:/data/*.txt")
textFile.map(JSON.parseArray)  //解析为json数组
  .flatMap(_.toArray)  //json数组转为java数组,通过flatmap拉平
  .map(_.asInstanceOf[JSONObject])  //把每个对象转成jsonobject
  .map(x => (x.getString("studentName"), (x.getInteger("studentAge"), 1)))  //通过jsonobject的方法处理数据

//方法二
val yiqings = JSON.parseArray(value.reduce(_ + _), classOf[自定义样例类]).toArray().toList.asInstanceOf[List[自定义样例类]]
//转换成RDD
val value1 = sc.makeRDD(yiqings)

版权说明
文章采用: 《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权。
版权声明:未标注转载均为本站原创,转载时请以链接形式注明文章出处。如有侵权、不妥之处,请联系站长删除。敬请谅解!

-- 展开阅读全文 --
这篇文章最后更新于2021-8-6,已超过 1 年没有更新,如果文章内容或图片资源失效,请留言反馈,我们会及时处理,谢谢!
spark-RDD-交集-差集-并集
« 上一篇
IDEA Scala自动生成变量类型设置教程
下一篇 »
为了防止灌水评论,登录后即可评论!

HI ! 请登录
注册会员,享受下载全站资源特权。