我正在尝试从.txt
带分隔符的文件生成多个文件。在本例中,列分隔符为|
,记录分隔符为:║
。
这是我正在尝试的代码:
awk -F'║', -vOFS=, -vc=1 '
NR == 1 {
for (i=1; i<NF; i++) {
if ($i != "") {
g[c]=i;
f[c++]=$i
}
}
}
NR>2 {
for (i=1; i < c; i++) {
print $1,$2, $g[i] > "output_"f[i]".tex"
}
}' biennalis.txt
的内容biennalis.csv
大致如下:
name|content
║Is-id27-ref06-01-13-1914|El año de la muerte del rey Ozías vi al Señor sentado en un trono excelso y elevado, y sus haldas llenaban el templo. Unos serafines se mantenían erguidos por encima de él; cada uno tenía seis alas: con un par se cubrían la faz, con otro par se cubrían los pies, y con el otro par aleteaban, y se gritaban el uno al otro:
\textquote{Santo, santo, santo, el Señor de los ejércitos: llena está toda la tierra de su gloria.}.
Se conmovieron los quicios y los dinteles a la voz de los que clamaban, y la casa se llenó de humo.
Yo dije:
\textquote{¡Ay de mí, que estoy perdido, pues soy un hombre de labios impuros, y entre un pueblo de labios impuros habito: que al rey el Señor de los ejércitos han visto mis ojos!}
Entonces voló hacia mí uno de los serafines con una brasa en la mano, que con las tenazas había tomado de sobre el altar, y tocó mi boca y dijo:
\textquote{He aquí que esto ha tocado tus labios: se ha retirado tu culpa, tu pecado está expiado.}
Y percibí la voz del Señor que decía:
\textquote{¿A quién enviaré? ¿y quién irá de parte nuestra}?
Yo contesté:
\textquote{Heme aquí: envíame.}
Dijo:
\textquote{Ve y di a ese pueblo: \textquote{Escuchad bien, pero no entendáis, ved bien, pero no comprendáis.} Engorda el corazón de ese pueblo, hazle duro de oídos, y pégale los ojos, no sea que vea con sus ojos y oiga con sus oídos, y entienda con su corazón, y se convierta y se le cure.}
Yo pregunté:
\textquote{¿Hasta dónde, Señor?}
Y él me contestó:
\textquote{Hasta que se vacíen las ciudades y queden sin habitantes, las casas sin hombres, la campiña desolada, y haya alejado el Señor a las gentes, y cunda el abandono dentro del país. Aun el décimo que quede en él volverá a ser devastado como la encina o el roble, en cuya tala queda un tocón. Este tocón será semilla santa.}
║Is-id27-ref01-01-18-0045|Visión de Isaías, hijo de Amós, acerca de Judá y de Jerusalén, en tiempos de Ozías, Jotán, Ajaz y Ezequías, reyes de Judá.
Oíd, cielos, escucha tierra, que habla el Señor: \textquote{Hijos he criado y educado, y ellos se han rebelado contra mí.
El buey conoce a su amo, y el asno el pesebre de su dueño; Israel no me conoce, mi pueblo no comprende}.
¡Ay, gente pecadora, pueblo cargado de culpas, raza malvada, hijos corrompidos! Han abandonado al Señor, han despreciado al santo de Israel, le han vuelto la espalda.
我期望的最终结果是单独的文件,其名称是第一列的内容,内容是第二列的内容:
Is-id27-ref06-01-13-1914.tex
El año de la muerte del rey Ozías vi al Señor sentado en un trono excelso y elevado, y sus haldas llenaban el templo. Unos serafines se mantenían erguidos por encima de él; cada uno tenía seis alas: con un par se cubrían la faz, con otro par se cubrían los pies, y con el otro par aleteaban, y se gritaban el uno al otro:
\textquote{Santo, santo, santo, el Señor de los ejércitos: llena está toda la tierra de su gloria.}.
...
Is-id27-ref01-01-18-0045.tex
Visión de Isaías, hijo de Amós, acerca de Judá y de Jerusalén, en tiempos de Ozías, Jotán, Ajaz y Ezequías, reyes de Judá.
Oíd, cielos, escucha tierra, que habla el Señor: \textquote{Hijos he criado y educado, y ellos se han rebelado contra mí.
...
ETC ...
执行命令时的错误如下:
awk: syntax error at source line 10
context is
print $1,$2, $g[i] > >>> "output_"f <<< [i]".tex"
awk: illegal statement at source line 10
您的脚本似乎正在执行与您尝试的操作完全不同的事情。假设实际输入文件的格式正确,让我们放弃您已有的操作并重试。
这会将任何包含
║
或 的|
行拆分,并使用第一个字段作为新文件名的基础。它会获取前面的任何内容║
并将其附加到之前打开的文件(如果有的话),因此分隔符可以出现在一行中的任何位置;但如果一行包含多个分隔符,这将以特殊的方式中断。这关键地假设您
║
在第一个条目之前以及|
文件名和您想要的该文件中的文本之间有一个。演示:https://ideone.com/jsRJKf
我原来的答案在 Linux 上运行良好,但在 MacOS 上却不行:
我们只需指示 Awk 使用正确的记录和字段分隔符,然后指示它将第二个字段打印到名称源自第一个字段的文件中。
如上所述,为了使其正常工作,您必须
║
在第一个条目之前以及|
文件名和您想要在该文件中的文本之间有一个。演示:https://ideone.com/LU1y4Y
输入或输出重定向右侧未加括号的表达式是未定义的行为,因此不同的 awk 会对其执行不同的操作,有些会执行您想要的操作,而其他则会失败,正如您当前看到的那样。更改此设置:
更改为:
来解决这个具体问题
您可能遇到的下一个问题是,您没有在操作过程中关闭输出文件,因此您可能会遇到进程一次可以打开的文件数的限制。要解决该问题,请将您的循环更改为:
该
if
语句seen[]
是为了确保脚本在第一次写入时清空任何现有的输出文件 - 如果您在脚本之外处理该问题,那么您可以删除该if
语句。