我有一个数据框:
ID Deal Party Commodity startdate enddate price quantity mtmvalue
---- ----- ----- --------- --------- ------- ------ -------- ---------
J1 Sell J (stock1, stock2) 01Jan23 01Feb23 10.00 10 100.00
J4 Buy J (stock1, stock2) 01Jan23 01Feb23 5.00 5 25.00
J2 Sell J (stock1, stock2) 01Jan23 01Feb23 10.00 10 100.00
J3 Buy J (stock1, stock2) 01Jan23 01Feb23 5.00 10 50.00
我需要按交易、商品和开始日期将数据分组在一起,以便我的数据框如下所示:
ID Deal Party Commodity startdate enddate price quantity mtmvalue
---- ----- ----- --------- --------- ------- ------ -------- ---------
J1 Sell J (stock1, stock2) 01Jan23 01Feb23 10.00 10 100.00
J2 Sell J (stock1, stock2) 01Jan23 01Feb23 10.00 10 100.00
J3 Buy J (stock1, stock2) 01Jan23 01Feb23 5.00 10 50.00
J4 Buy J (stock1, stock2) 01Jan23 01Feb23 5.00 5 25.00
我这样做将创建两个组,但我希望它在一个数据框中:
df.groupby(['Deal', 'Commodity', StartDate'])
我如何保留原始数据框中的分组?
你在找吗
sort_values
?注意:此处没有足够的信息来正确地将 J3 排在 J4 之前。