O projeto

NaturaeData é uma iniciativa privada, que conta com a parceria pública, para criar uma base de dados moleculares e morfológicos que permita a identificação de espécies animais regionalmente.

O objetivo é criar uma biblioteca, ou banco de dados, confiável. Até agora não existem informações locais disponíveis, embora iniciativas globais de sequenciamento massivo de DNA da biodiversidade venham sendo desenvolvidas por diversos grupos de pesquisa mundiais, incluindo o Brasil. No entanto, ainda não foram integradas as informações morfológicas utilizadas para identificação das espécies, conjuntamente com os dados de sequências, de forma explícita.

A maior base de dados mundial, o GenBank, consiste principalmente de dados moleculares de animais do hemisfério norte, mas inclui também espécies representativas da fauna brasileira, cuja abrangência da diversidade existente é quase insignificante. Quando se trata de comparar espécimes potencialmente novos encontrados na fauna regional, se torna mais raro ainda encontrar representantes nos bancos globais. Mas além da dificuldade de não encontrar espécies referência, há outro problema: quando elas estão presentes nas bases mundiais, mas foram erroneamente identificadas!

Principalmente quando se trata de insetos, muitos erros decorrem da identificação de espécimes para os quais estão depositadas as sequências nos bancos de dados públicos. Ou seja, não é incomum um pesquisador comparar a sequência de uma espécie identificada por um taxônomo com aquela dita da mesma espécie depositada em um banco, e descobrir que existem diferenças significativas entre elas. É provável que a depositada tenha sido identificada erroneamente, pois muitas vezes não passou por taxônomo especialista no grupo. Ainda, é comum as sequencias serem atribuídas a um táxon pelo simples agrupamento com base em distância genética.

Percebeu-se então a necessidade de criar um banco local, envolvendo um trabalho mais criterioso e lento, comparativamente ao massivo e rápido sequenciamento de espécies em inventários de diversidade. Esta biblioteca regional será parcialmente integrada aos grandes bancos, como o GenBank.

A proposta inédita do NaturaeData é, portanto, ter um marcador molecular para cada espécie associado a uma fotografia do animal, e imagem em detalhe da principal estrutura diagnóstica da espécie, o que proporcionará confiabilidade a base de dados e permitirá a confirmação da identificação em nível específico por qualquer pessoa.
 
NaturaeData