2016年1月15日星期五

Spark SQL中DataFrame的几种写入模式

dataFrame.write.mode("xxx")进行设置

append
不改变表中已经存在记录,将新纪录写入。

overwrite
原来的记录全部删除,只有增加的记录。
举个例子:如果原来的表中有三个字段a, b, c,Overwrite的数据中只有两个字段a, b,那么原来c字段就没有了,慎用。

error
如果已经存在记录,抛出异常。

ignore
如果有已经存在的记录,DataFrame中的数据全部不会写入。

没有评论:

发表评论