AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / user-21891079

Joshua Shew's questions

Martin Hope
Joshua Shew
Asked: 2024-06-11 06:03:36 +0800 CST

在 R 中可以为“R_MAX_VSIZE”输入什么值?

  • 7

我正在 R 中进行内存密集型操作。我在这个网站上看到了一些关于增加内存限制的建议,R_MAX_VSIZE但我还没有找到关于可以输入哪些类型的值以及如何读取它们的明确解释。

环境变量接受/有效的格式是什么R_MAX_VSIZE?

以下是我目前发现的内容:

  1. R 基础文档 - 内存:可用于数据存储的内存

    最大向量堆大小可以通过环境变量设置R_MAX_VSIZE

    我在此帮助页面上找不到有关允许使用哪些值的更多信息。

  2. Graeme Frost在 MacOS 上对R 的回答错误:矢量内存耗尽(达到限制?)

    这个答案建议将值设置为“100Gb”。当我在自己的机器上遇到这个问题时,这实际上解决了我的问题,但还有其他答案表明其他值是有效的。

  3. Connor Dibble对错误的回答:向量内存耗尽(达到限制?)R 3.5.0 macOS

    这个答案设置的值export R_MAX_VSIZE=32000000000不包含单位,所以我假设它被解释为字节。

  • 1 个回答
  • 26 Views
Martin Hope
Joshua Shew
Asked: 2024-03-15 22:59:44 +0800 CST

当标题作为向量给出时,如何读取 CSV 的特定列

  • 10

我有一个没有标题行的大型 CSV 文件,并且标题可以作为向量提供给我。我想使用文件列的子集而不加载整个文件。所需列的子集作为单独的列表提供。

编辑:在这种情况下,标题列表中提供的列名称很重要。该 MRE 只有 4 个列名称,但该解决方案应该适用于具有预先指定列名称的大型数据集。问题是列名称仅在外部提供,而不是作为 CSV 文件中的标题。

1,2,3,4
5,6,7,8
9,10,11,12
header <- c("A", "B", "C", "D")
subset <- c("D", "B")

到目前为止,我一直以以下方式读取数据,这得到了我想要的结果,但首先加载整个文件。

# Setup

library(readr)

write.table(
  structure(list(V1 = c(1L, 5L, 9L), V2 = c(2L, 6L, 10L), V3 = c(3L, 7L, 11L), V4 = c(4L, 8L, 12L)), class = "data.frame", row.names = c(NA, -3L)),
  file="sample-data.csv",
  row.names=FALSE,
  col.names=FALSE,
  sep=","
)

header <- c("A", "B", "C", "D")
subset <- c("D", "B")

# Current approach

df1 <- read_csv(
  "sample-data.csv",
  col_names = header
)[subset]

df1
# A tibble: 3 × 2
      D     B
  <dbl> <dbl>
1     4     2
2     8     6
3    12    10

如何在不先加载整个文件的情况下获得相同的结果?

相关问题

  • 仅读取选定的列,包括第一行中的标题。
  • 如何将文件中的选定列读入 R?read.table(和之间的折衷方案scan?) [重复]未指定文件外部的列名称,答案不适用于这种情况。
  • 如何跳过读取 readr [重复] 中的某些列是不同的,因为它似乎是跳过未知的第一列并跨多个文件读取已知的第二和第三列。在这个问题中,数据类型不一定是事先知道的。
  • 有没有办法在读取 csv [重复] 时省略第一列:根据位置跳过列,而不是根据外部提供的列名称列表中的位置跳过列。
  • 4 个回答
  • 75 Views
Martin Hope
Joshua Shew
Asked: 2023-12-31 01:54:30 +0800 CST

如何设置污迹和清理过滤器,以便它引用存储库跟踪的脚本

  • 7

我有一个使用 Jupyter Notebook 文件进行数据分析的项目,我使用 clean/smudge 过滤器将输出和某些元数据保留在 git 之外。有时我会对过滤器进行调整,我希望自动应用这些更改,而不必git config每次都要求我的协作者运行命令。

如何配置过滤器来运行存储库跟踪的脚本?

出于此问题的目的,我们假设 clean 命令是如何在使用 git commit 时清除 Jupyter Notebook 的输出和元数据?:

jupyter nbconvert --ClearOutputPreprocessor.enabled=True --ClearMetadataPreprocessor.enabled=True --to=notebook --stdin --stdout --log-level=ERROR

这通常配置为...

git config filter.<filter-name>.clean "<command>"

...并与.gitattributes包含以下内容的 a 一起使用。

*.ipynb filter=<filter-name>

相关问题

  • .gitattributes 污迹和清理过滤器作为存储库的一部分很接近,但与设置过滤器相关git clone,而不是使用存储库跟踪过滤器中的更改
  • 如何跟踪存储库/项目中特定于系统的配置文件?是一个关于跟踪存储库中的任何配置文件的更普遍的问题,而不是解决这个问题的细节。
  • 允许使用 git clone 配置污迹和干净过滤器的安全风险是什么?是关于在 上设置过滤器,而不是在使用存储库中的脚本进行克隆后git clone设置过滤器。
git
  • 2 个回答
  • 34 Views
Martin Hope
Joshua Shew
Asked: 2023-08-20 06:36:04 +0800 CST

安装后 LibreOffice SDK 文件夹应该放在哪里?

  • 5

我下载了 SDK,因为我尝试在 Mac 上使用 LibreOffice Calc 的宏。我的宏正在运行,但我不确定此时如何处理 SDK 安装文件夹。SDK 文件夹当前位于我的“下载”文件夹中。请参阅下面我引用的文件夹的内容:

LibreOffice7.5_SDK
├── bin
├── classes
├── config.guess
├── config.sub
├── configure.pl
├── docs
├── examples
├── include
├── index.html
├── setsdkenv_unix
├── setsdkenv_unix.sh.in
├── settings
└── share
  • 可以转移到其他地方吗?
  • 可以删除吗?
  • 有没有它通常去的地方?

相关的SO问题LibreOffice SDK:How install and config LibreOffice SDK in mac对于这个问题没有帮助,因为它是关于安装过程中的错误,而不是关于安装后要做什么。

作为安装成功的确认,我的$HOME目录包含该setsdkenv_unix脚本。我按照LibreOffice 安装指南中的安装说明进行操作

libreoffice
  • 1 个回答
  • 17 Views

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    重新格式化数字,在固定位置插入分隔符

    • 6 个回答
  • Marko Smith

    为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会?

    • 2 个回答
  • Marko Smith

    VScode 自动卸载扩展的问题(Material 主题)

    • 2 个回答
  • Marko Smith

    Vue 3:创建时出错“预期标识符但发现‘导入’”[重复]

    • 1 个回答
  • Marko Smith

    具有指定基础类型但没有枚举器的“枚举类”的用途是什么?

    • 1 个回答
  • Marko Smith

    如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误?

    • 6 个回答
  • Marko Smith

    `(表达式,左值) = 右值` 在 C 或 C++ 中是有效的赋值吗?为什么有些编译器会接受/拒绝它?

    • 3 个回答
  • Marko Smith

    在 C++ 中,一个不执行任何操作的空程序需要 204KB 的堆,但在 C 中则不需要

    • 1 个回答
  • Marko Smith

    PowerBI 目前与 BigQuery 不兼容:Simba 驱动程序与 Windows 更新有关

    • 2 个回答
  • Marko Smith

    AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String”

    • 1 个回答
  • Martin Hope
    Fantastic Mr Fox msvc std::vector 实现中仅不接受可复制类型 2025-04-23 06:40:49 +0800 CST
  • Martin Hope
    Howard Hinnant 使用 chrono 查找下一个工作日 2025-04-21 08:30:25 +0800 CST
  • Martin Hope
    Fedor 构造函数的成员初始化程序可以包含另一个成员的初始化吗? 2025-04-15 01:01:44 +0800 CST
  • Martin Hope
    Petr Filipský 为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会? 2025-03-23 21:39:40 +0800 CST
  • Martin Hope
    Catskul C++20 是否进行了更改,允许从已知绑定数组“type(&)[N]”转换为未知绑定数组“type(&)[]”? 2025-03-04 06:57:53 +0800 CST
  • Martin Hope
    Stefan Pochmann 为什么 {2,3,10} 和 {x,3,10} (x=2) 的顺序不同? 2025-01-13 23:24:07 +0800 CST
  • Martin Hope
    Chad Feller 在 5.2 版中,bash 条件语句中的 [[ .. ]] 中的分号现在是可选的吗? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench 为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng 为什么 `dict(id=1, **{'id': 2})` 有时会引发 `KeyError: 'id'` 而不是 TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String” 2024-03-20 03:12:31 +0800 CST

热门标签

python javascript c++ c# java typescript sql reactjs html

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve