在使用以前的 Spark 版本时,我总是在指定列名时感到困惑:我应该使用String
还是col object
。
pyspark.sql.functions.regexp_replace(str,pattern,replacement)[来源]
我正在运行版本 3.1.2 的集群,并且两者都可以正常工作:
df1.withColumn("modality",F.regexp_replace(F.col("name"),"i","")).display()
df1.withColumn("modality",F.regexp_replace("name","i","")).display()
从文档中我本来以为只允许使用字符串,但实际上两者都可以。我如何在 API 文档中看到是否还允许使用 col 对象(在最新的 API 中这一点非常清楚,但在之前的 API 中却不是这样)。