并行化(和其他加载操作)是仅在执行Spark操作时执行还是在遇到它时立即执行?
请参见spark code中的def parallelize
请注意.textFile(…)的不同后果:延迟评估意味着虽然最初可能会保存一些内存,但每次执行操作时都必须读取文本文件,并且文本文件中的更改会影响改变后的所有行动.
请参见spark code中的def parallelize
请注意.textFile(…)的不同后果:延迟评估意味着虽然最初可能会保存一些内存,但每次执行操作时都必须读取文本文件,并且文本文件中的更改会影响改变后的所有行动.