polars.read_csv
vs polars.read_csv_batched
vs 和有什么不一样polars.scan_csv
?
polars.read_csv
看起来等同于pandas.read_csv
他们有相同的名字。
在哪种场景下使用哪一种以及它们有何相似/不同pandas.read_csv
?
polars.read_csv
vs polars.read_csv_batched
vs 和有什么不一样polars.scan_csv
?
polars.read_csv
看起来等同于pandas.read_csv
他们有相同的名字。
在哪种场景下使用哪一种以及它们有何相似/不同pandas.read_csv
?
polars.read_csv_batched
非常相当于pandas.read_csv(iterator=True)
.polars.scan_csv
dask.dataframe.read_csv
在您对数据帧执行类似(延迟加载)的操作之前,不会执行任何操作。应用场景:
pandas.read_csv
当我的数据比较杂乱或者结构比较复杂并且数据不太大的时候我使用polars.read_csv
当我的数据文件非常大(> 10GB)时我使用。这是完全基于我(卑微)意见的答案。