lógica de raspagem
com todas as url mapeadas e conhecendo os dados é hora de montar uma estratégia de raspagem. usando geradores dentro das funções da classe PeneiraoSpider
, assim as urls são montadas com as informações dos geradores anteriores até onde estão as informações que serão extraídas.
selecionando os campeonatos
como o objetivo não é extraír informação de todos os campeonatos disponíveis, precisamos filtrar os dados que são extraídos na função parse_years