这个位置的“let”表达式是不稳定的

Question

bill999

Asked: 2024-09-13 05:45:50 +0800 CST2024-09-13 05:45:50 +0800 CST 2024-09-13 05:45:50 +0800 CST

如何将字符串拆分成两部分（而不丢弃其他部分）

772

假设我有这些数据：

clear all
set obs 2
gen title = "dog - cat - horse" in 1
replace title = "chicken - frog - ladybug" in 2
tempfile data
save `data'

我可以将其分为三个部分：

use `data', clear
split title, p(" - ")

我可以将它们分成两部分，丢弃第三部分：

use `data', clear
split title, p(" - ") limit(2)

是否有现成的解决方案可以将其拆分成两个部分，但将第一个拆分字符 (在本例中为破折号) 之后的所有内容分组到第二个变量中？在 R 中，我将使用separate该extra="merge"选项 (请参阅tidyr 仅分离前 n 个实例)。

换句话说，对于第一行，我希望第一个观察结果是，title1并且dog结果title2是cat - horse。

我意识到使用自定义代码可以做到这一点（请参阅Stata 将字符串拆分为几部分），但我希望使用类似于 Stata split/R的简单命令separate来实现我的目标。

1 个回答

Voted

Nick Cox · Answer 1 · 2024-09-13T11:30:36+08:00

目前这不是官方split命令中的选项。（全面披露：我是之前的作者。）

您可以编写自己的命令。这个命令需要更多的通用性和更多的错误检查，但它可以满足您对数据示例的要求。详细信息：是否需要修剪空格？

clear all
set obs 2
gen title = "dog - cat - horse" in 1
replace title = "chicken - frog - ladybug" in 2

gen title1 = trim(substr(title, 1, strpos(title, "-") - 1))
gen title2 = trim(substr(title, strpos(title, "-") + 1, .))

program split2
    syntax varname(string), parse(str) [suffixes(numlist int min=2 max=2)]
    
    if "`suffixes'" == "" local suffixes "1 2"
    tokenize "`suffixes'"
    
    gen `varlist'`1' = trim(substr(`varlist', 1, strpos(`varlist', "`parse'") - 1))
    gen `varlist'`2' = trim(substr(`varlist', strpos(`varlist', "`parse'") + strlen("`parse'"), .))
end 

split2 title, parse("-") suffixes(3 4)

list 
    
     +--------------------------------------------------------------------------------+
     |                    title    title1           title2    title3           title4 |
     |--------------------------------------------------------------------------------|
  1. |        dog - cat - horse       dog      cat - horse       dog      cat - horse |
  2. | chicken - frog - ladybug   chicken   frog - ladybug   chicken   frog - ladybug |
     +--------------------------------------------------------------------------------+

还请注意该egen函数ends()及其head选项tail。使用该函数需要两次调用。它每次只生成一个变量。

如何将字符串拆分成两部分（而不丢弃其他部分）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

如何将字符串拆分成两部分（而不丢弃其他部分）

1 个回答

相关问题