将复制活动的序列号添加到 Blob

Question

robertspierre

Asked: 2024-12-21 16:32:17 +0800 CST2024-12-21 16:32:17 +0800 CST 2024-12-21 16:32:17 +0800 CST

readr 没有理由说列数比预期的少

772

我正在尝试使用从partyfacts读取以下 CSV 文件readr。

导入出了问题，其实没有问题。

download.file("https://partyfacts.herokuapp.com/download/external-parties-csv/", "partyfacts-external-parties.csv")
df <- readr::read_csv("partyfacts-external-parties.csv", show_col_types = FALSE)

警告：一个或多个解析问题，请调用problems()您的数据框获取详细信息，

例如：

dat <- 轰隆隆（...）

问题（dat）

让我们看看我们有什么：

nrow(problems(df))

86

problems(df)[1,]

# A tibble：1 × 5 行 col 预期实际文件
<int> <int> <chr> <chr> <chr>
35519 15 17 列 15 列 /home/raffaele/Downloads/external-parties.csv

但实际上并没有任何问题。

第 35519 行是：

BIH,elecglob,292,SNSD,独立社会民主党联盟,独立社会民主党联盟,1998,2014,19.1,2006,,,2019-02-08 19:26:26.193233+00:00,2021-03-12 10:15:38.362019+00:00,30450,292,2019-02-08 19:26:26.296626+00:00

它正确包含 17 列，而不是 15 列。

其余 84 个问题属于相同性质（读取的列数少于预期）且适用类似的推理（源文件中的列数是正确的）。

编辑：我报告的行文本是从文本编辑器中获取的。显然行号与我从 R 中获取的不一样。

1 个回答

Voted

user2554330 · Answer 1 · 2024-12-21T23:41:35+08:00

文件很大，很难检查。诊断此类问题的一种方法是删除没有问题的行，使文件变小。我这样做了，得到了这个文件，只保留了前两行，第一行显示错误，以及之后的一行（也显示错误）：

country,dataset_key,dataset_party_id,name_short,name,name_english,year_first,year_last,share,share_year,description,comment,created,modified,external_id,partyfacts_id,linked
ALB,manifesto,75721,DBSH,E Djatha e Bashkuar e Shqipërisë,United Albanian Right,1996,1997,5.0,1996,,,2013-01-01 18:18:05.413000+00:00,2023-06-05 10:39:57.075788+00:00,1914,674,2013-01-01 18:33:17.889000+00:00
BEN,gps,60,ABT,,Alliance pour un Benin triomphant,2011,2019,2.9,2015,,,2020-07-16 17:39:48.143406+00:00,2021-03-12 10:16:03.729055+00:00,47733
BEN,gps,64,AE,,Eclaireur,2011,2019,3.7,2015,,,2020-07-16 17:39:57.563352+00:00,2021-03-12 10:16:03.731436+00:00,48035

上面显示的第三行和第四行位于原始文件的第 35440 行左右，如您所见，它们不遵循与上一行相同的格式：缺少最后两个字段。

read.csv()不会抱怨这个文件，因为据记录，除非您使用调用它，否则会用空白填充缺失的字段fill = FALSE。当我这样做时，我收到错误。

readr 没有理由说列数比预期的少

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

readr 没有理由说列数比预期的少

1 个回答

相关问题