如何将 for 循环拆分为 3 个单独的数据框？

Question

Pro Q

Asked: 2024-06-28 10:14:41 +0800 CST2024-06-28 10:14:41 +0800 CST 2024-06-28 10:14:41 +0800 CST

如何在索引 Pandas DataFrame 后预测结果类型

772

我有一只 Pandas DataFrame，定义如下：

df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Aritra'],
                   'Age': [25, 30, 35],
                   'Location': ['Seattle', 'New York', 'Kona']},
                  index=([10, 20, 30]))

但是，当我对此进行索引时DataFrame，我无法准确预测索引将产生什么类型的对象：

# (1) str
df.iloc[0, df.columns.get_loc('Name')]
# (2) Series
df.iloc[0:1, df.columns.get_loc('Name')]

# (3) Series
df.iloc[0:2, df.columns.get_loc('Name')]
# (4) DataFrame
df.iloc[0:2, df.columns.get_loc('Name'):df.columns.get_loc('Age')]

# (5) Series
df.iloc[0, df.columns.get_loc('Name'):df.columns.get_loc('Location')]
# (6) DataFrame
df.iloc[0:1, df.columns.get_loc('Name'):df.columns.get_loc('Location')]

请注意，上面的每一对都包含相同的数据。（例如，(2)一个包含单个字符串的 Series、(4)一个包含单个列的 DataFrame 等）

为什么它们会输出不同类型的对象？我如何预测将输出哪种类型的对象？

根据数据，规则似乎是基于索引中有多少个切片（冒号）：

0 切片（(1)）：标量值
1 片（(2)，(3)，(5)）：Series
2 片（(4)，(6)）：DataFrame

但是，我不确定这是否总是正确的，即使它总是正确的，我想知道为什么会这样背后的机制。

我花了一些时间查看索引文档，但它似乎没有清楚地描述此行为。该函数的文档iloc也没有描述返回类型。

我也对loc而不是的同一问题感兴趣iloc，但是，由于loc包括，结果并不那么令人困惑。（也就是说，您无法获得具有不同类型的索引对，而索引应该提取完全相同的数据。）

1 个回答

Voted

mozway · Answer 1 · 2024-06-28T13:34:19+08:00

您已经了解了大概意思。简单来说，重要的不是项目的数量，而是索引器的类型。

您可以将索引作为 0D（使用标量），现在我们只考虑索引：

df.iloc[0]

df.loc[0]

或 1D (带有切片或可迭代)：

df.loc[[0]]

df.loc[1:2]

df.loc[:0]

然后规则很简单，考虑两个轴，如果两者都是 0D，则会得到一个标量（这里是一个字符串），如果两者都是 1D，则会得到一个 DataFrame，否则是一个 Series：

columns      0D         1D
index                     
0D       scalar     Series
1D       Series  DataFrame

以下示例可说明这一点：

type(df.iloc[1:2, 1:2])        # 1D / 1D
# pandas.core.frame.DataFrame

type(df.iloc[:0, :0])          # 1D / 1D
# pandas.core.frame.DataFrame  (EMPTY DataFrame)

type(df.iloc[[], []])          # 1D / 1D
# pandas.core.frame.DataFrame  (EMPTY DataFrame)

type(df.iloc[[1,2], 0])        # 1D / 0D
# pandas.core.series.Series

type(df.iloc[0, [0]])          # 0D / 1D
# pandas.core.series.Series

type(df.iloc[0, 0])            # 0D / 0D
# str

如何在索引 Pandas DataFrame 后预测结果类型

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

如何在索引 Pandas DataFrame 后预测结果类型

1 个回答

相关问题