Estou tentando extrair informações desta página . Quero obter os nomes da coluna mais à esquerda. Mas qualquer nome de classe, seletor ou XPath que eu tento, retorna uma lista vazia. Este é o meu código com um nome de classe de exemplo, mas outros que tentei também não funcionaram. Por favor, ajude-me a selecionar o nome de classe ou seletor correto. Obrigado. Meu código:
import selenium
from selenium.webdriver.chrome import options
from selenium.webdriver.common.by import By
chrome_options = options.Options()
chrome_options.add_experimental_option("detach", True)
get_page = selenium.webdriver.Chrome(options = chrome_options)
get_page.get(r"https://app.folk.app/shared/US-VCs-oc71Oi94yB9vwbfh1XWIQPHTAGQE7FQ1?_gl=1*i6fxi5*_gcl_au*MjAxNDc5NDg2MC4xNzQzOTk2NzMy*_ga*MTczMTg1ODA3OS4xNzQzOTk2NzI5*_ga_WRYT325C9X*MTc0NDA0NDYyMi4yLjAuMTc0NDA0NDYyMy41OS4wLjY3MzkyNTk0MA..*_fplc*djJ1clZwbjFnR1RBUU9EQTkyTU9DaFQlMkZ4SUZhdG9ENHR3QUE0cFFTQjFaU21JQkJ6SFNxYktTbThSVyUyQjFJVEdKWUZVbEMwNGplN1paMG1mcTlXZnhqVUJNQ1ZxQnY4RVZaSVl3enJya2VxQjZZU0ZVdUs3ZFdxOGZOOFJTZyUzRCUzRA..")
list_of_investors = get_page.find_elements(By.CLASS_NAME, "c-jMIjwW-drVgRi")
for l in list_of_investors:
print (l.text)
O conteúdo da página depende fortemente da renderização em JavaScript. Portanto, é essencial
WebDriverWait
garantir que os elementos necessários estejam totalmente carregados antes de tentar interagir com eles.Além disso, o nome da classe usado anteriormente parece estar incorreto, pois não há conteúdo associado a ele. Após análise, identifiquei os seguintes nomes de classe relacionados aos nomes dos investidores:
c-jMIjwW c-jxvbnT c-jMIjwW-drVgRi-variant-textMedium c-jMIjwW-iepcqn-truncate-true
.Veja abaixo o código corrigido e completo, onde usei o nome da classe "c-jMIjwW-drVgRi-variant-textMedium":