Manish Visave提出的问题 -coding

Manish Visave

Asked: 2024-06-10 16:01:09 +0800 CST

从spark中的csv读取数据

5

感谢您抽出时间回答这个问题。

我最近正在使用 Spark，我读到它认为 HDFS 中的一个分区 = Spark 中的一个分区。按照这个逻辑，很多情况下我们可能不会使用 HDFS 作为源。因此，如果我们使用 CSV 或任何其他基于文件的格式来读取数据，那么分区是如何分区的，或者更确切地说，由于没有显式分区，因此数据是如何分区的。

Web Analytics