Tenho estes dados:
import polars as pl
pl.DataFrame({
'region': ['EU', 'ASIA', 'AMER', 'Year'],
'Share': [99, 6, -30, 2020],
'Ration': [70, 4, -10, 2019],
'Lots': [70, 4, -10, 2018],
'Stake': [80, 5, -20, 2021],
})
# shape: (4, 5)
# ┌────────┬───────┬────────┬──────┬───────┐
# │ region ┆ Share ┆ Ration ┆ Lots ┆ Stake │
# │ --- ┆ --- ┆ --- ┆ --- ┆ --- │
# │ str ┆ i64 ┆ i64 ┆ i64 ┆ i64 │
# ╞════════╪═══════╪════════╪══════╪═══════╡
# │ EU ┆ 99 ┆ 70 ┆ 70 ┆ 80 │
# │ ASIA ┆ 6 ┆ 4 ┆ 4 ┆ 5 │
# │ AMER ┆ -30 ┆ -10 ┆ -10 ┆ -20 │
# │ Year ┆ 2020 ┆ 2019 ┆ 2018 ┆ 2021 │
# └────────┴───────┴────────┴──────┴───────┘
Quero ordenar as colunas com base na Year
linha, deixando a region
coluna primeiro. Então, idealmente, estou procurando por isto:
shape: (4, 5)
┌────────┬──────┬────────┬───────┬───────┐
│ region ┆ Lots ┆ Ration ┆ Share ┆ Stake │
│ --- ┆ --- ┆ --- ┆ --- ┆ --- │
│ str ┆ i64 ┆ i64 ┆ i64 ┆ i64 │
╞════════╪══════╪════════╪═══════╪═══════╡
│ EU ┆ 70 ┆ 70 ┆ 99 ┆ 80 │
│ ASIA ┆ 4 ┆ 4 ┆ 6 ┆ 5 │
│ AMER ┆ -10 ┆ -10 ┆ -30 ┆ -20 │
│ Year ┆ 2018 ┆ 2019 ┆ 2020 ┆ 2021 │
└────────┴──────┴────────┴───────┴───────┘
Como isso pode ser alcançado? Tentei usar sort
a função polars, mas não consegui fazer o que eu precisava.
.sort()
funciona em linhas.Você pode remodelar com
.unpivot()
e.sort()
depois.pivot()
voltar para o formato amplo.Ou faça isso no "nível Python" e classifique as séries pelo último valor.