首页 > 数据库技术 > 详细

09 spark连接mysql数据库

时间:2021-05-29 08:56:04      阅读:20      评论:0      收藏:0      [点我收藏+]

spark连接mysql数据库

安装启动检查Mysql服务。

技术分享图片

spark 连接mysql驱动程序。

pyspark --jars /usr/local/spark/jars/mysql-connector-java-8.0.25.jar --driver-class-path /usr/local/spark/jars/mysql-connector-java-8.0.25.jar

技术分享图片

启动 Mysql shell,新建数据库spark,表student。

create database spark;
use spark;
create table student (id int(4), name char(20), gender char(4), age int(4));
alter table student change id id int auto_increment primary key;
insert into student values(1,‘Xueqian‘,‘F‘,23);
insert into student values(2,‘Weiliang‘,‘M‘,24);
select * from student;

技术分享图片

spark读取MySQL数据库中的数据

jdbcDF = spark.read.format("jdbc").option("url", "jdbc:mysql://localhost:3306/spark").option("driver","com.mysql.jdbc.Driver").option("dbtable", "student").option("user", "root").option("password", "123456").load()
jdbcDF.show()

技术分享图片

spark向MySQL数据库写入数据

from pyspark.sql.types import Row
from pyspark.sql.types import StructType
from pyspark.sql.types import StructField
from pyspark.sql.types import StringType
from pyspark.sql.types import IntegerType
studentRDD = spark.sparkContext.parallelize(["3 Rongcheng M 26","4 Guanhua M 27"]).map(lambda line : line.split(" "))
//下面要设置模式信息
schema = StructType([StructField("name", StringType(), True),StructField("gender", StringType(), True),StructField("age",IntegerType(), True)])
rowRDD = studentRDD.map(lambda p : Row(p[1].strip(), p[2].strip(),int(p[3])))
//建立起Row对象和模式之间的对应关系,也就是把数据和模式对应起来
studentDF = spark.createDataFrame(rowRDD, schema)
prop = {}
prop[‘user‘] = ‘root‘
prop[‘password‘] = ‘hadoop‘
prop[‘driver‘] = "com.mysql.jdbc.Driver"
studentDF.write.jdbc("jdbc:mysql://localhost:3306/spark",‘student‘,‘append‘, prop)

技术分享图片

select * from student;

技术分享图片

09 spark连接mysql数据库

原文:https://www.cnblogs.com/DongDongQiangg/p/14824151.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!