对列进行字符串操作是否先将Categorical
整个列转换为字符集String
,然后执行操作,或者在可能的情况下是否直接对(可能小得多的)分类词典进行操作?
例如df.filter(pl.col('my_category').cast(pl.String).str.contains(...))
(还有str.starts_with(...)
朋友等)或df.with_columns(pl.col('my_category').cast(pl.String).str.replace(...).cast(pl.Categorical))