我有一个看起来像的文件:
如何删除“ colaboracion \ d +”和“ organismo:”之间的换行符?它看起来应该像这样:
colaboracion1: - 3 a�os (2003-2006) adjunto al coordinador del �rea de Inform�tica de la Agencia Nacional de Evaluaci�n y Prospectiva (ANEP).- Experto evaluador y revisor de proyectos para la Comisi�n Europea desde 2001.- Experto evaluador de agencias de evaluaci�n de Argentina, Chile, Israel, Francia y de varios organismos auton�micos (Galicia, Castilla y Le�n, Andaluc�a, Murcia).- A nivel nacional es evaluador habitual de ANECA y ANEP (proyectos del Plan Nacional I+D+i, Torres Quevedo, Estudios y An�lisis, etc.).
如您所见,换行符已被删除。
我正在尝试使用sed或awk。有什么办法吗?
这不是重复的问题,因为此行中包含特殊字符。例如,它包含可能完全改变解析方式的破折号。
谢谢!
awk '{ sub(/[ \t\r]+$/, ""); sub(/^[ \t]+/, "") } !NF { next } /^[^[:space:]]+:/ { if (length(t)) print t; t = $0; next } { t = t $0 } END { if (length(t)) print t }' file
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句