pyspark数据需求写一个完整的python脚本

时间：2020-05-15 15:31:04 阅读：87 评论：0 收藏：0 [点我收藏+]

# 1.  import一些常用的库
from pyspark.sql import *
from pyspark.sql.functions import *
from pyspark.sql.types import *
import datetime

# 2. 开启一个session，这个后续写dataframe和sql函数的入口
spark = SparkSession.builder.appName("自定义一个名字").enableHiveSupport().getOrCreate()


# 3.写SQL代码，必须是正确的sql代码

sql = “”“

完整实现的sql代码，这个可以通过hue平台测试

”“”

#4. 将sql语句读入转成dataframe，然后存成csv文件，index表明要不要显示索引列

spark.sql(sql).toPandas().to_csv("文件名.csv", index=False)

原文：https://www.cnblogs.com/ivyharding/p/12894846.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)