由于在建表语句中,没有指定具体使用哪个字段进行数据分发,所以系统默认使用package_id进行数据分发。
这里的数据将使用copy命令从PostgreSQL数据库中导出,如下:
如果字段中含有空值,对于txt文件,空值以\N的方式卸载,\N是null的转义。而对于csv格式,使用空值替代。如下:
同样,此方法在greenplum上有效。
使用copy命令加载数据,必须使用超级用户操作。
如上图所示,加载完成后,通过查询可见数据分布比较均匀,基本平均分布在3个Segment节点上。
原文:https://blog.51cto.com/candon123/2410841