首页 > 其他 > 详细

spark-4-文件读写

时间:2020-07-11 19:45:03      阅读:36      评论:0      收藏:0      [点我收藏+]

hdfs文件读写报错:

AccessControlException: Permission denied: user=root, access=WRITE, inode="/user/chaojunwang":chaojunwang:supergroup:drwxr-xr-x

 

【解决方法】

1. 不要sudo启动hadoop或pyspark

2. 在hadoop路径下  ./bin/hdfs dfs -chmod 777 /user   修改 hdfs 文件系统中/user/chaojunwang 路径的权限

3. 在pyspark中即可完成 hdfs 的文件读写

>>> textFile = sc.textFile("hdfs://localhost:9000/user/chaojunwang/word.txt")
>>> textFile.saveAsTextFile("hdfs://localhost:9000/user/chaojunwang/writeback.txt")
>>> textFile = sc.textFile("hdfs://localhost:9000/user/chaojunwang/writeback.txt")
>>> textFile.first()
‘It is a start for me to pyspark learning.‘

  

 

spark-4-文件读写

原文:https://www.cnblogs.com/chaojunwang-ml/p/13285061.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!