Como usar o ClinVar – um tutorial para iniciantes

O que é ClinVar?

Para muitas pessoas, obter seu genoma sequenciado é o início de uma jornada emocionante. Freqüentemente, porém, as pessoas não sabem por onde começar a explorar seus dados de DNA. Para aprender como a genética afeta a saúde, uma ferramenta chamada ClinVar pode ser extremamente útil. Mas, como exatamente essa ferramenta funciona? Este tutorial vai te ensinar!

Você está interessado em descobrir TODAS as variantes genéticas em seu DNA para obter a maioria das ferramentas como o ClinVar? A Nebula Genomics oferece o sequenciamento do genoma completo por apenas US $ 299! Clique aqui para saber mais!

Os 99,9 por cento

O genoma humano é composto por cerca de 3 bilhões de letras espalhadas por 23 pares de cromossomos. Juntas, essas letras (também conhecidas como nucleotídeos) atuam como um manual de instruções para determinar nossas características. Da cor do cabelo de um indivíduo ao risco de doença cardíaca, o genoma contém a receita que torna cada pessoa única.

Escolha 2 pessoas aleatoriamente, e elas provavelmente terão muito mais diferenças do que semelhanças. Uma pode ser alta, precisa de óculos, tem histórico familiar de câncer de mama e odeia o sabor do coentro. A outra tem cabelo ruivo, é intolerante à lactose e sempre foi uma aluna nota dez.

Embora essas duas pessoas possam não parecer nada, elas ainda compartilham 99,9% das mesmas letras em seus genomas. Toda a variação entre dois indivíduos aleatórios, desde sua aparência até seus riscos de doença, decorre de diferenças em apenas 0,1% (ou 3 milhões) das letras no genoma!

O 0,1 por cento

As letras do genoma que podem ser diferentes entre os indivíduos são conhecidas como polimorfismos de nucleotídeo único, ou SNPs (pronuncia-se “recortes”). Por exemplo, um SNP está presente se a maioria dos indivíduos tem a letra “C” em um ponto específico do genoma, enquanto uma minoria tem um “T”. Este SNP teria 2 variantes possíveis, ou “alelos”: C e T.

Os cientistas estimam que haja potencialmente até 100 milhões de SNPs em todo o genoma. Muitos desses SNPs ocorrem dentro de genes, as sequências de DNA que atuam como instruções para a produção de proteínas, máquinas moleculares que realizam várias tarefas dentro e fora das células. Muitos mais SNPs, no entanto, ocorrem fora dessas regiões, nos chamados “DNA lixo” . Apesar do nome, esse DNA compreende cerca de 99% das informações do nosso genoma, e os cientistas continuam descobrindo cada vez mais sobre sua importância para a nossa saúde.

Independentemente disso, a identificação de SNPs é uma etapa fundamental na compreensão dos dados genômicos pessoais. Alguns SNPs podem ter um efeito poderoso na suscetibilidade de um indivíduo a uma determinada doença. Por exemplo, considere a doença de Alzheimer. Um SNP particular no APOE gene aumenta o risco de uma pessoa desenvolver a doença de Alzheimer por mais de 20 vezes !

Com os avanços nas tecnologias de testes genéticos reduzindo o custo de sequenciamento do genoma humano, mais e mais pessoas estão dando o salto para aprender sobre si mesmas por meio de seu DNA. Algumas empresas de testes genéticos dão a seus usuários acesso a seus arquivos de DNA bruto, para que possam explorar seus dados por conta própria. Embora isso dê poder aos usuários, pode ser bastante assustador ao mesmo tempo. A maioria das pessoas não está muito familiarizada com a genética humana e várias ferramentas de análise de dados. Em particular, dados milhões de SNPs, muitos usuários, compreensivelmente, não sabem como aprender o que eles significam.

Você está interessado em descobrir TODAS as variantes genéticas em seu DNA para obter a maioria das ferramentas como o ClinVar? A Nebula Genomics oferece o sequenciamento do genoma completo por apenas US $ 299! Clique aqui para saber mais!

Como usar ClinVar

Uma das ferramentas mais úteis para aprender mais sobre o que seus SNPs podem significar para a saúde é o ClinVar. É um arquivo público de acesso gratuito que visa catalogar as relações entre as variantes genéticas e seu impacto no estado de saúde.

ClinVar é administrado pelo National Institutes of Health dos Estados Unidos. Funciona como um banco de dados público central para pesquisadores e profissionais médicos depositarem informações sobre SNPs clinicamente relevantes. Por exemplo, se um novo estudo científico for publicado ligando uma variante genética a uma doença específica, essa informação pode ser enviada ao ClinVar.

Embora o ClinVar seja poderoso, muitas vezes pode parecer pesado e difícil de navegar. Aprender como pesquisar de forma eficaz no site pode desbloquear toneladas de informações adicionais de seus dados de genoma.

Basicamente, você pode pesquisar no ClinVar usando qualquer uma das três informações diferentes. Esses são:

  • ID SNP
  • Gene
  • Doença / condição

Procurando ClinVar por SNP

A maioria dos SNPs é atribuída a um ID exclusivo, geralmente começando com as letras “rs” e, em seguida, uma sequência de números (por exemplo, rs7412). A inserção desse ID pode conectar você diretamente com informações sobre a localização do SNP, quaisquer doenças às quais ele possa estar associado e muito mais.

Os arquivos de DNA bruto, independentemente do formato, geralmente contêm uma lista de variantes genéticas e seus IDs. Na Nebula Genomics, fornecemos aos nossos usuários suas variantes genéticas no formato VCF, que é o formato mais comumente usado. Para examinar suas variantes genéticas, você pode arquivar VCF com um editor de texto como o Sublime ou apenas dar uma olhada nos estudos na Biblioteca de Nebulosas. Até o momento, já analisamos mais de 8.000 variantes genéticas e novos estudos e variantes são adicionados a cada semana!

Para saber mais sobre a relevância clínica de um SNP específico, vamos usar o ClinVar. Vamos começar navegando para o site , onde a página inicial deve ter a seguinte aparência:

Página inicial da ClinVar.
Página inicial da ClinVar.

Neste site, você pode aprender mais sobre o ClinVar e como fazer novos envios. Se você já tem um SNP em mente, pode simplesmente inseri-lo na barra de pesquisa e clicar em “Pesquisar”. Aqui, estamos interessados em aprender mais sobre o SNP rs63750048.

Pesquisa ClinVar.

Se alguma informação sobre um SNP tiver sido carregada no ClinVar, o site retornará um resultado de pesquisa para esse SNP. Podemos ver rapidamente que ele está localizado em um gene chamado PSEN2 e foi associado à doença de Alzheimer tipo 4. Clicando no link (destacado na imagem), podemos aprender ainda mais sobre o SNP.

Procurar Resultados.

Nesta página, são fornecidas mais informações sobre o SNP, incluindo todas as condições às quais ele pode estar vinculado e quaisquer publicações científicas que mencionem o SNP. Para cada condição na seção “Interpretações e evidências enviadas”, você pode clicar no link “Detalhes da evidência” para saber como o SNP está conectado à doença e como foi descoberto.

Uma entrada no ClinVar.
Uma entrada no ClinVar.
Evidência em ClinVar.
Evidência em ClinVar.

Aqui, podemos ver que o SNP foi identificado em uma família italiana afetada pela doença de Alzheimer. A letra normal neste local do genoma é C, mas os testes genéticos realizados nesta família mostram que muitos membros têm um T no mesmo local, o que pode afetar o funcionamento do gene PSEN2. O relatório prossegue, observando sintomas específicos que os membros da família experimentaram.

Evidência detalhada em ClinVar.
Evidência detalhada em ClinVar.

Pesquisando ClinVar por gene

Talvez não tenhamos um SNP específico em mente e, em vez disso, gostaríamos de encontrar todos os SNPs presentes em um gene no qual estamos interessados. Assim que encontrarmos um SNP interessante, podemos retornar aos nossos próprios dados genômicos e verificar nosso status para este SNP.

Comece navegando de volta à página inicial do ClinVar e pesquise o gene sobre o qual está interessado em aprender mais. Neste caso, procuramos “BRCA”, um gene cujas variações têm sido associadas a um risco aumentado de desenvolver câncer de mama.

Pesquisa ClinVar por nome de gene.
Pesquisa ClinVar por nome de gene.

A pesquisa desse nome de gene retorna centenas de variantes do ClinVar. Alguns deles estão nos genes BRCA e outros estão em genes intimamente relacionados ao BRCA. Para evitar ser sobrecarregado pelos resultados da pesquisa, podemos filtrá-los usando opções no lado esquerdo da página. Esses incluem:

  • Significância clínica: Este SNP causa uma doença específica (patogênica e provavelmente patogênica) ou não (benigna e provavelmente benigna)? Ou é incerto quais são seus efeitos? Ou existem resultados conflitantes de diferentes estudos?
  • Consequência molecular: Qual o efeito do SNP na sequência do gene?
  • Tipo de variação: uma letra é adicionada à sequência ou excluída dela? Ou uma letra é substituída por outra (por exemplo, C para T)?
  • Status da revisão: quanta evidência clínica existe para este SNP?
Filtros ClinVar.
Filtros ClinVar.

Depois de examinar os vários SNPs em diferentes filtros, vamos aprender mais sobre a variante destacada com a caixa vermelha abaixo.

Seguindo o link, podemos aprender imediatamente mais informações sobre o SNP. Podemos ver que o SNP é uma mudança da letra G para a letra C localizada no cromossomo 13 e está potencialmente relacionado a um risco aumentado de câncer de mama. Além disso, podemos aprender a ID do SNP (rs81002796).

Significância clínica em ClinVar.
Significância clínica em ClinVar.

Pesquisando ClinVar por doença

Finalmente, se não tivermos um SNP específico ou um gene específico em mente, podemos pesquisar todos os SNPs vinculados a uma doença específica. Embora não seja obrigatório, adicionar o[disease/phenotype] a tag após um termo de pesquisa pode ajudar a limitar os resultados apenas aos mais pertinentes para a condição específica. Por exemplo, se estivermos interessados em SNPs conectados ao diabetes, podemos pesquisar no ClinVar com o termo “diabetes[disease/phenotype] ”.

Pesquisa ClinVar por nome de doença.
Pesquisa ClinVar por nome de doença.

Visto que milhares de resultados são retornados, vamos filtrar os resultados para exibir apenas aqueles que são “fatores de risco” estabelecidos para diabetes. Então, vamos aprender mais sobre o primeiro resultado.

Filtro de fator de risco.
Filtro de fator de risco.

Seguindo o link, podemos aprender que este SNP é a mudança de uma letra C para G localizada no cromossomo 1 em um gene conhecido como PTPN22. O SNP foi identificado em uma publicação em 2006.

Link para literatura.
Link para literatura.

Se tivermos interesse em saber mais sobre como o SNP foi encontrado, podemos seguir o link da publicação para saber mais sobre o estudo.

Estudo vinculado.
Estudo vinculado.

ClinVar é poderoso. Use-o com sabedoria.

Embora o ClinVar seja um banco de dados extenso que compila resultados de milhares de estudos laboratoriais e médicos, é importante observar que a ferramenta não é um conselheiro genético. Não se destina a fornecer conselhos médicos e diagnósticos. Se você suspeitar que as informações que encontrou ao longo de suas pesquisas no site podem ser relevantes para a sua saúde, é importante consultar um médico ou outro profissional de saúde licenciado para aconselhamento genético.

Gostou do nosso tutorial ClinVar? Você também pode achar este tutorial útil:

Sobre o autor