Geoffrey Asked: 2023-08-20 01:09:57 +0800 CST Pyspark:将数据帧保存到具有特定大小的单个文件的多个镶木地板文件 4 如何将 Pyspark 数据帧保存到多个具有特定大小的 parquet 文件? 示例:我的数据帧在 HDFS 上使用 500GB,每个文件为 128MB。我想将其保存为 250 个 parquet 文件,每个文件为 2GB。我怎样才能存档这个? apache-spark