Tratamento dos dados presentes no csv gerado pelo museu paraese Emilio Goeldi sobre anelideos. Com foco na redução de redundancia entre colunas distintas e tratamento dos valores ausentes que poderiam ser deduzidos a partir de outras informalções. Por se tratar de um arquivo csv com colunas geradas seguindo o padrão internacional gbif, as colunas que não possuiam nenhuma informação inserida, tiveram seus labels guardados em uma lista antes de serem dropadas do dataframe utilizado durante o tratamento em questão. Colunas com valores fixos para todos os registros foram guardadas em um dicionário, com o intuito de diminuir a complexidade do dataframe ao mesmo tempo que mantinha as informações gerais presentes.
Treatment of data present in the CSV file generated by the Museu Paraense Emilio Goeldi regarding annelids. The focus is on reducing redundancy between different columns and handling missing values that could be deduced from other information. Since it is a CSV file with columns generated following the international GBIF standard, columns with no information were stored in a list before being dropped from the dataframe used during the treatment. Columns with fixed values for all records were stored in a dictionary, with the aim of reducing the complexity of the dataframe while retaining the general information.