我想删除短语中的第二部分,只要该部分的长度超过3个字符(字母和数字),并且如果字符不超过3个,则添加空格。
在以下测试集中:
CENTRAL CARE HOSPITAL/HOPITAL CENTRALE DE SOINS
ABC/DEF
FOUNDATION INSTITUTION/FUNDATION DEL INSTITUTO
HAPPY SPRING BREAK 20/20
结果应为:
CENTRAL CARE HOSPITAL
ABC DEF
FOUNDATION INSTITUTION
HAPPY SPRING BREAK 20 20
我的第一次尝试是
([^\/]+$)
但是,斜杠后的所有字符串都消失了,因为它没有任何限制。我需要包含一个否定的前瞻性声明,当斜杠后的字符串超过3个字符时,我需要删除这些字符串:
text= re.sub(r'(^[^\/]+)(?:[\/])(?![A-Z]{3})',r'\1 ',text,re.IGNORECASE)
我得到以下不正确的信息:
CENTRAL CARE HOSPITAL/HOPITAL CENTRALE DE SOINS
ABC DEF
FOUNDATION INSTITUTION/FUNDATION DEL INSTITUTO
HAPPY SPRING BREAK 20 20
如何摆脱前面的斜杠和字符串?
谢谢