Estou tentando extrair o texto desejado de um conjunto de texto fornecido. Criei a função abaixo.
def extract_name(title):
matches = re.findall(r'\b[A-Z0-9\s&.,()-]+(?:\s*\(\d\))?\b', title)
return ', '.join(matches) if matches else None
Mas, ele produz indesejados (, ,
para alguns títulos. Por exemplo, meus títulos são como abaixo.
THETA COMMERCIALS (2005) LIMITED, TEST CONNECTIONS LTD (In Relation), NANO CARE LIMITED (In Relation)
Resultado esperado:THETA COMMERCIALS (2005) LIMITED, TEST CONNECTIONS LTD, NANO CARE LIMITED