Eonema提出的问题 -coding

Eonema

Asked: 2025-01-17 23:42:05 +0800 CST

为什么 R 会根据 SSH 客户端的操作系统以不同的方式处理非 ASCII 字符？

在 SSH 上运行时，R 似乎会根据 SSH 客户端的操作系统以不同的方式处理非 ASCII 字符。

例如，如果我使用运行 macOS（14.6.1）的计算机在 Ubuntu 机器（22.04.5）上启动 R 会话，并运行：

units::set_units(12.7, "\U00B5m")

我得到：

12.7 [µm]

但是，在同一台服务器上运行相同的表达式，但由 Windows 客户端（10.0.19045.4170）运行，结果如下：

Error: In '<U+00B5>m', '<U+00B5>m' is not recognized by udunits.

我认为这可能与每个操作系统上的命令行如何通过 SSH 发送字符表示有关。但是，如果我在服务器上保存以下脚本（使用 macOS 计算机上的 SSH 上的 vim 编写）：

#!/bin/Rscript

print(nchar("µm"))

并从 macOS 客户端（例如ssh <user>@<host> "./print_micron.R"）通过 SSH 执行它，我得到：

[1] 2

ie"µ"是一个双字节字符。但如果我从 Windows 客户端执行它，我会得到：

[1] 3

即"µ"变成两个独立的字符，每个字节一个。

这挑战了我对 SSH 上命令执行方式的直觉，因为我认为 R 的行为完全由服务器决定。为什么客户端操作系统会影响 R 表示非 ASCII 字符的方式？

Eonema

Asked: 2024-12-27 07:05:42 +0800 CST

替换函数（例如names<-）在像那样调用时似乎不使用惰性求值names(x) <- c("a", "b")。

为了演示，让我们定义一个函数来获取数字的小数部分和相应的替换函数 - 但在替换函数内部，包含一行来打印解除约束的value参数。

fractional <- function(x) { 
  x %% 1 
}

`fractional<-` <- function(x, value) {
  print(rlang::enexpr(value))
  invisible(x %/% 1 + value)
}

现在如果我们fractional<-直接调用，它会打印我们给出的表达式value：

x <- 10.1
`fractional<-`(x, 0.2 + 0.2)
#> 0.2 + 0.2

但是如果我们以赋值形式调用它，它会打印表达式的求值结果：

x <- 10.1
fractional(x) <- 0.2 + 0.2
#> [1] 0.4

语言定义解释了替换函数，例如：

names(x) <- c("a","b")

相当于

`*tmp*` <- x
x <- "names<-"(`*tmp*`, value=c("a","b"))
rm(`*tmp*`)

但这并不能重现这种行为：

x <- 10.1

`*tmp*` <- x
x <- "fractional<-"(`*tmp*`, value=0.2 + 0.2)
rm(`*tmp*`)

#> 0.2 + 0.2

其中内部发生了什么事情<-使得它在value评估后被传递，有什么方法可以规避这种行为？fractional<-

编辑： @SamR 指出使用substitute捕获了承诺中的表达式：

x <- 10.1
`fractional<-` <- function(x, value) {
  print(substitute(value))
  invisible(x %/% 1 + value)
}
fractional(x) <- 0.2 + 0.2

#> 0.2 + 0.2

因此，显然我错误地认为value在传递给之前对进行了评估fractional<-。但是，我仍然非常想知道为什么 base::substitute 在这里按预期工作，而 rlang::enexpr 和朋友却没有。毕竟，在内部enexpr使用substitute：

enexpr <- function(arg) {
  .Call(ffi_enexpr, substitute(arg), parent.frame())
}

在 R Studio 中进行调试表明，无论是以赋值形式调用fractional(x) <- 0.2 + 0.2还是以前缀形式调用时"fractional<-"(x, 0.2 + 0.2)，fractional<-都会传递一个未评估的承诺value：

当以前缀形式调用时，它仍未被计算：

但是在以赋值形式调用时，会在调用之后进行评估enexpr：

我想知道这是否与在赋值形式中该函数由原始函数调用有关<-？但不清楚为什么会有所不同。