Introdução ao GEDmatch
O GEDmatch é um site de genealogia gratuito que permite aos usuários carregar seus próprios resultados de testes de DNA autossômico e encontrar indivíduos relacionados. Foi fundada por Curtis Roger em 2010. A poderosa ferramenta GEDmatch Genesis encontra segmentos correspondentes de DNA em seus 1,3 milhões de usuários, independentemente da empresa de origem dos dados originais. Os usuários podem fazer upload de dados de uma ampla variedade de sites, permitindo que as pessoas encontrem membros da família, mesmo que um use o 23andMe e o outro o AncestryDNA. Existem também outras ferramentas de DNA que permitem explorar sua ancestralidade.
Uma das principais desvantagens do GEDmatch é que ele não foi projetado para o usuário iniciante. É para isso que serve este tutorial: vamos orientá-lo sobre como se inscrever gratuitamente, carregar seus dados brutos de DNA de outros locais de teste de DNA, como observar sua ancestralidade e explorar seus relacionamentos familiares.
O GEDmatch é seguro?
O GEDmatch não fornecerá informações médicas imprecisas que possam fazer com que você busque cuidados médicos erroneamente, uma vez que não fornecerá quaisquer informações médicas ou de saúde. Também não se apresenta como a medida mais exata e precisa de etnia. As ferramentas de mistura / herança extraem dados de muitas fontes diferentes e seus resultados irão variar dependendo de qual projeto você selecionar.
Antes de começar a enviar seus dados genéticos para sites aleatórios, você deve saber mais sobre quem está recebendo esses dados. GEDmatch é atualmente propriedade da Verogen, uma empresa de genômica forense. A Verogen ganha dinheiro, em parte, permitindo que a polícia use seu banco de dados genealógico para solucionar crimes. Isso pode significar que seu DNA pode ajudar a identificar a vítima de um crime – ou o criminoso.
Como se inscrever
O registro é direto. Vou ao página de registro e preencha seu nome, apelido, se preferir que seu nome não apareça publicamente, e-mail e senha. Seu e-mail e senha serão seu login do GEDmatch.
O e-mail deve ser válido, pois o GEDmatch enviará um código de validação. Esteja ciente de que este e-mail ficará visível para outros usuários se você optar por usar a ferramenta central de correspondência de DNA um-para-muitos. Embora seu nome real seja solicitado, ele não parece ser validado.
Como fazer upload de dados para GEDmatch
O GEDmatch não oferece testes de DNA, apenas interpretação de resultados de DNA existentes. Portanto, você precisará baixar seus dados de qualquer empresa de teste baseada em SNP para a qual você enviou uma amostra. Você pode pesquisar “como baixar dados genéticos brutos de” e o nome de sua empresa de testes ou ir diretamente para os tutoriais de DNA ancestral , 23 e eu , ou DNA da árvore genealógica .
Dependendo de onde seu teste foi feito, você pode baixar um único arquivo ou uma pasta. Provavelmente será “compactado”, o que faz com que ocupe menos espaço, mas faz com que apenas um computador possa lê-lo. Para “descompactá-lo” e torná-lo legível por um humano, em um Mac, clique duas vezes nele ou, em um PC, clique com o botão direito e clique em “descompactar”. Agora você pode abri-lo no WordPad ou Excel.
GEDmatch aceitará apenas o que chama de “formato 23andMe”. Isso difere de “Formato de chamada variante” ou “VCF”. GEDmatch não aceita arquivos .vcf. Provavelmente, você poderá baixar diretamente um arquivo no formato 23andMe. Se você só consegue baixar um VCF, dê uma olhada este tutorial (role para baixo até a parte intitulada “Convertendo arquivos VCF em arquivos 23andMe”).
GEDmatch não aceita exomas ou genomas completos. Eles também não recomendam o upload de dados imputados quando um computador tenta adivinhar o que seu DNA pode estar entre os SNPs que foram realmente testados. Você deve carregar apenas dados SNP brutos.
O GEDmatch verificará se o arquivo está no formato correto e rejeitará se não estiver. Se você quiser verificar se o arquivo está no formato 23andMe, poderá abri-lo no Wordpad ou Excel. Provavelmente terá algumas linhas na parte superior que começam com uma hashtag, que são ignoradas pelo computador. O resto ficará assim:
# genótipo de posição do cromossomo rsid
rs3094315 1 752566 AA
rs3131972 1 752721 GA
rs75333668 1 762320 CC
rsID é o nome do SNP, cromossomo e posição onde o SNP é encontrado, e genótipo é o que o SNP está nessa posição. Existem duas cartas, uma de cada pai.
Agora, você pode enviar suas informações genéticas para o GEDmatch. Este botão está no lado direito da página inicial, marcado na caixa vermelha abaixo, e diz “Uploads genéricos (23andMe, FTDNA, AncestryDNA, DNA vivo e muitos outros)”.
Na página seguinte, é recomendável preencher todas as informações que você tiver. No entanto, as únicas caixas necessárias são um nome e você clica no botão de rádio informando que está autorizado a fazer upload dos dados (porque são seus, você tem a permissão deles, a pessoa está morta ou você é um agente da lei). Todo o resto é opcional. Se você não souber a resposta, deixe em branco.
O último conjunto de perguntas é opcional, mas é importante responder. Trata-se de solicitar as preferências de privacidade para este perfil de DNA, também chamado de “kit de DNA”.
A opção padrão é “Opt-in”, que permitirá que as autoridades legais acessem seus dados para pesquisas criminais. É importante observar que o GEDmatch tem sido usado para identificar criminosos, encontrando até mesmo parentes remotos. O GEDmatch foi usado para resolver o caso arquivado do Assassino do Golden State comparando o DNA da cena do crime a um terceiro ou quarto primo.
Eu escolhi “Opt-out”, o que me permite comparar meu kit com outros e permite que indivíduos que não são responsáveis pela aplicação da lei me encontrem. Outras opções incluem pesquisa, que permite que você veja combinações, mas não permite que elas vejam você, ou privada, que não permite que você encontre membros da família usando a ferramenta Genesis, mas permite que você use outras ferramentas de ancestralidade.
Mesmo que você desative ou opte por manter os dados privados, o GEDmatch ainda entregará os dados às autoridades legais se um tribunal solicitar as informações.
Clique em “Escolher arquivo”, localize o arquivo no seu computador e clique em “upload”. Depois de adicionar seu arquivo, pode levar vários minutos para que o upload ocorra. Não saia da página nem clique em atualizar. O tempo dependerá do tamanho do seu arquivo de dados genômicos e de quão boas são as velocidades de upload. Se demorar mais de dez minutos, tente novamente.
Se o seu arquivo for muito grande e lento para carregar, você pode compactá-lo novamente. Em um Mac, pressione Ctrl + clique no nome do arquivo e selecione “Compactar”. Em um PC, clique com o botão esquerdo, selecione “Enviar para” e selecione “Pasta compactada (Zipada)”.
Você verá alguns grandes números verdes sendo contados, verificando se cada um dos seus cromossomos foi encontrado em seu arquivo e, em seguida, ele lhe dará o seu “número do kit”. Você precisará disso para todas as análises no GEDmatch. Não se preocupe muito em anotá-lo em algum lugar seguro, ele aparecerá na página inicial e você poderá copiá-lo e colá-lo de lá.
Para voltar à página inicial, você precisará responder à pergunta do GEDmatch, “Quando meu kit estará disponível para a ferramenta um-para-muitos?” com “Normalmente dentro de 24 a 48 horas”. Esta é a estratégia GEDmatch para evitar que você os envie por e-mail e pergunte por que ainda não consegue encontrar os resultados.
A ferramenta um-para-muitos do GEDmatch demora um pouco para ser executada porque tem que comparar o seu DNA com o DNA de todos os 1,3 milhões de usuários. Não se preocupe, existem outras ferramentas para brincar enquanto espera.
Como olhar para o seu Aditivo / Herança
Para ver o seu Admixture (herança), você precisará encontrar o número do seu kit. O meu está destacado no retângulo verde à esquerda acima. Você pode anotar ou apenas copiar para colar mais tarde. Em seguida, clique em “Admixture (herança)” à direita da tela.
A análise de mistura funciona combinando pedaços de seus SNPs a um conjunto de referências. É importante que você esteja comparando com o conjunto certo de referências. Caso contrário, o programa pode tentar forçar uma correspondência que não seja realmente precisa, mas é o mais próximo possível e perder uma correspondência que poderia ter feito.
Esta planilha contém uma lista abrangente de cada uma das populações em cada projeto.
MDLP é boa como uma calculadora global ampla. Ele extrai dados de todo o mundo. MDLP world e MDLP world-22 são úteis para qualquer pessoa que deseja ter uma visão ampla de sua ancestralidade. MDLp world-22 inclui pigmeu, oeste-asiático, mesolítico do norte da Europa (uma amostra de DNA antiga), indo-tibetano, mesoamérica, ártico-ameríndio, sul-americano_amerente, indiano, norte-siberiano, atlântico_Mediterannean_Neolítico, samoédico, indo_iraniano, leste-siberiano , Nordeste da Europa, Sul-Africano, Norte-Amerind, Subsaharaian, East-South-Asian, Near_East, Melanésia, Paleo-Siberian e Austronesian.
Eurogenes fornece um mapa mais refinado da Europa com o Eurogenes EUtest V2 K15, incluindo North_Sea, Atlantic, Báltico, Eastern_Euro, West_Med, West_Asian, East_Med, Red_Sea, Aouth_Asian, Southeast_Asian, Siberian, Amerindian, Oceania, Nordeste da África e Subsaariana.
Dodecad tem alguns agrupamentos diferentes que fornecem boa diversidade para aqueles com herança africana (Dodecad Africa9 com Europa, NW_Africa, SW_Asia, E_Africa, Mbuti, W_Africa, Baika e San) ou Patrimônio Asiático (Dodecad V3 com East_European, West_European, Mediterrâneo, Neo_African , West_asian, South_Asian, Northeast_Asian, Southeast_Asian, East_African, Southwest_Asian, Northwest African e Palaeo_African).
HarappaWorld é direcionado para ancestrais do sul da Ásia e inclui S-Indian, Baloch, Caucasiano, NE-Euro, SE-Asian, Siberian, NE-Asian, Papuan, American, Beringian, Mediterranian, SW-Asian, San (South African Hunter-Gatherers) , E-African, Pygmy e W-African.
Ethiohelix é direcionado para aqueles de ascendência africana com Ethiohelix K10 África contendo apenas Nilo-Saharan, East-Africa2, Mbuti-Pygmy, East_Africa1, Khoi-San, West_Africa, Hadza, Biaka-Pygmy, Norte da África e Omótico.
puntDNAL extrai dados de DNA antigo, com puntDNAL K10 Ancient incluindo ASI (Ancient South Indian), Sub-Saharan, Oceania, Beringian, END (Early Neolithic Farmers), CHG (Caucasus Hunter-Gatherers), Siberian, E_Asian WHG (Western European Hunter Gather ) e ameríndio.
Gedrosia também utiliza DNA antigo com o Gedrosia Ancient Eurasia K6 incluindo Ancestral North Eurasian, Ancestral South Eurasian, East_Asian, West European Hunter-Gatherer, Natufian e Sub_Saharan.
Os resultados do teste podem ser visualizados de várias maneiras, incluindo “proporções”, que fornece um gráfico de pizza, ou “Mistura por cromossomo”, que inclui as informações sobre quais partes de seus cromossomos são identificadas como provenientes de cada região.
O gráfico de pizza é útil para ver quais são suas estimativas de ancestralidade total. A pintura do cromossomo permite que você veja quais áreas do seu genoma são de qual população e ajuda a mostrar um pouco mais da incerteza nas estimativas – áreas com várias cores podem vir de qualquer uma dessas populações, pois as populações têm DNA semelhante naquele genômico região.
Como saber se seus pais são parentes
Semelhante a como o GEDmatch permite que você encontre parentes em seu banco de dados de DNA, combinando segmentos de seu DNA com o deles, você pode verificar se seus pais eram parentes procurando por segmentos de seu próprio DNA que correspondam a si mesmo. Você tem duas cópias de cada cromossomo, uma de cada pai. e podem compará-los entre si. Se grandes pedaços corresponderem, é provável que seus pais compartilhem um ancestral comum recente.
Felizmente, meus resultados foram muito chatos.
O vermelho indica que não houve correspondência, o verde indica que houve uma correspondência e o azul indica que houve uma correspondência longa. Espera-se que algumas partidas curtas aconteçam por acaso. Várias correspondências longas indicariam que seus pais são parentes.
Como verificar se você é parente de algum humano antigo
Todos descendem de alguns humanos antigos, mas nem todos os humanos antigos foram sequenciados. Ocasionalmente, os cientistas encontram vestígios antigos que ainda têm DNA humano em boa forma para extrair informações genéticas.
Este aplicativo funciona de maneira semelhante à ferramenta de comparação de DNA um-para-muitos que você provavelmente ainda está esperando para executar. Ele compara o seu DNA com as amostras antigas e verifica se algum trecho longo corresponde.
A ferramenta permite que você altere o comprimento do alongamento correspondente. 0,5 cm é muito curto e há muitas correspondências. Muitas correspondências não indicam necessariamente que existe um relacionamento próximo. Eles são indicados em laranja. Cada barra laranja mostra qual parte dos cromossomos do homem antigo corresponde ao meu.
No entanto, se você aumentar o alongamento que precisa corresponder a um número maior, aqui 5 cM, significativamente menos alongamentos serão correspondentes. Isso significa que não sou muito parente desses humanos antigos. Não houve correspondências acima de 6cM.
Como observar segmentos correspondentes em várias pessoas
Em vez de apenas comparar seus cromossomos com outros (um para muitos), o navegador de cromossomos 3-D permite que até 9 comparações aconteçam de uma vez (muitos para muitos).
Aqui estou olhando para duas pessoas que são pais e filhos e um membro da família remotamente relacionado. As barras coloridas são as partes do cromossomo X que correspondem entre os dois indivíduos. A laranja mostra que a maior parte do cromossomo X coincide entre a mãe e o filho.
A parte central que não é destacada como uma correspondência é o centrômero. Existe um centrômero no meio de cada cromossomo. O DNA centromérico é muito repetitivo e não contém genes. Portanto, geralmente não é incluído na análise SNP.
A mãe e a criança provavelmente também têm centrômeros correspondentes, mas como nenhum SNPs foi analisado nessa área, não pode ser confirmado que eles são iguais.
As barras amarelas mostram a parte do cromossomo X que corresponde ao membro da família mais distante. Esse pedaço é menor porque o indivíduo é mais distantemente relacionado. O pedaço também corresponde à mãe e ao filho, indicando que o parente está relacionado ao filho por meio da mãe. Se o parente distante fosse parente do filho por meio do pai, não haveria correspondência.
Você pode usar o navegador de cromossomos 3D para qualquer indivíduo dos quais você tenha números de kits. No entanto, indivíduos não aparentados não terão DNA compatível e não fornecerão gráficos muito interessantes.
Como você encontra os números dos kits de indivíduos relacionados? Você usa a ferramenta um para muitos!
Como usar a ferramenta um-para-muitos
Um a dois dias depois de enviar as informações do seu DNA, você pode digitar o número do seu kit (ou de qualquer pessoa) na parte superior e clicar em pesquisar. Isso irá puxar os indivíduos que compartilham segmentos de DNA com você, também conhecidos como sua família.
A primeira coluna é o número do kit, que identifica exclusivamente o upload do DNA e permite que qualquer usuário repita qualquer análise usando aquele número de kit em vez do seu próprio. Isso significa que você pode pegar o número do kit que encontrar aqui e conectá-lo às ferramentas descritas acima: você pode descobrir sua mistura / herança, se seus pais eram parentes, ou comparar seus cromossomos com qualquer outra pessoa cujo número de kit você copie e cole.
A segunda coluna é qualquer alias que o usuário escolher para aquele kit e a terceira é o e-mail do usuário. O usuário pode não ser a pessoa de origem do DNA. Você não deve presumir que esse e-mail pertence ao seu parente, apenas que pertence a alguém com autorização para carregar as informações de DNA do seu parente.
Depois que a informação do usuário é “GED”. O GED em GEDmatch significa GE nealógico D ata. Isso vem do GEDCOM ( GE nealógico D ata COM comunicação) formato de arquivo.
Se você tiver uma árvore genealógica detalhada no software de pesquisa genealógica, ela pode ser exportada no formato GEDCOM e carregada no GEDmatch. Isso permitirá que você vincule árvores genealógicas usando o recurso de parentesco na ferramenta um-para-muitos do GEDmatch. Se um kit tiver uma entrada GEDCOM associada a ele, aparecerá como um link nesta coluna.
Idade em dias refere-se a quanto tempo atrás o kit foi carregado. O tipo descreve. Sexo é um binário Masculino ou Feminino que o usuário indicou ao enviar o kit. Outras entradas que o usuário pode ter indicado são os haplogrupos: Mt e Y.
Mt é a abreviatura de mitocôndrias. As mitocôndrias são transmitidas de mãe para filho e não se recombinam ou se fragmentam a cada geração, como acontece com a maior parte do genoma. Ele permite que as pessoas rastreiem sua linhagem diretamente através de suas mães.
Y é semelhante a Mt, mas apenas para homens. Apenas as extremidades do cromossomo Y são capazes de se recombinar com o cromossomo X, o que significa que a maior parte do cromossomo Y é passada de pai para filho intacta. Isso permite que os homens rastreiem sua linhagem por meio de seus pais.
O GEDmatch não lhe dirá seu haplogrupo, mas você poderá descobrir se seus parentes tiverem as informações do haplogrupo. Se você compartilha um ancestral materno comum, você tem o mesmo haplogrupo Mt. Se você for homem e compartilhar um ancestral paterno comum com outro homem, terá o mesmo haplogrupo Y.
O próximo é o “cM total” da partida. CentiMorgans são uma medida do comprimento do DNA que leva em consideração a frequência com que certos pontos se recombinam. Duas colunas depois é “Maior”, que indica o segmento mais longo que corresponde entre dois indivíduos.
Uma coluna “Gerações” fornece uma estimativa do número de gerações distantes entre dois indivíduos. 1 representa uma relação pai-filho, 1,2 é irmão, 1,4 é meio-irmão, tio ou avô. 2 seria um primo porque o último ancestral comum era há 2 gerações, 2.6 seria um primo de primeiro grau quando removido, 3 seria o primo de segundo grau com o último ancestral comum há 3 gerações. A previsão divide-se em 4.
O indivíduo do exemplo tem dois parentes de primeiro grau, pais ou filhos, um parente de 1,5 grau, como uma tia, e um parente de segundo grau, provavelmente um primo. Meus próprios resultados foram todos além dos parentes de 4º grau.
A fonte indica a empresa pela qual os dados genômicos foram gerados ou que os dados foram migrados (transferidos) do antigo site GEDmatch. A capacidade de extrair de diferentes kits de teste de DNA um dos benefícios originais do GEDmatch. Se um usuário deseja pesquisar por membros da família, ele não precisa comprar os kits Ancestry e 23andMe. O usuário pode pesquisar todos os dados de DNA carregados, independentemente do serviço de teste de DNA.
A coluna “Sobreposição” descreve quantos SNPs foram realmente comparados. Isso não é executado para kits migrados. O novo sistema genesis não precisa que os kits tenham testado exatamente os mesmos SNPs para dizer que dois indivíduos estão relacionados. No entanto, mais SNPs que correspondem diretamente significam mais certeza na correspondência.
Como iterar com GEDmatch
Muito da diversão do GEDmatch é poder ver as conexões entre as pessoas. Se um número suficiente de seus parentes tiver carregado seus dados, você pode encontrá-los, ver quais estão relacionados entre si e construir sua árvore genealógica. Depois de encontrar os números dos kits de pessoas relacionadas a você, você pode realizar qualquer análise sobre essa pessoa que você mesmo faria. Isso pode permitir que você identifique de onde vieram diferentes partes de sua herança.
Mesmo se você não tiver nenhum parente próximo, pode encontrar os números dos kits de estranhos e encontrar suas conexões familiares e aprender sobre sua história familiar e herança. Isso pode ser divertido de uma forma intrometida, mas, lembre-se, qualquer outra pessoa pode fazer o mesmo com seus dados.
Como deletar seus dados do GEDmatch
Para remover seus dados do GEDmatch, clique no lápis ao lado das informações do kit na página inicial.
Você será levado à página “Gerenciamento de perfil do kit”. Esta página permite que você atualize qualquer uma das informações fornecidas para o seu kit.
A segunda guia diz “Remoção do kit”. Se você clicar nele, você será levado à página mostrada abaixo. Digite sua senha e clique em excluir.
GEDmatch FAQ
O que é GEDmatch? O que o GEDmatch faz?
Como usar o GEDmatch?
O GEDmatch é seguro?
Como fazer upload para GEDmatch?
Como usar a mistura GEDmatch?
O que significa GEDmatch?
Quem é o proprietário do GEDmatch?
Como encontrar o haplogrupo no GEDmatch?
O que é GEDmatch Genesis?
O GEDmatch é preciso?
O GEDmatch é gratuito?
O que é WHG no GEDmatch?
Você gostou deste tutorial? Você também pode achar este tutorial útil:
- Nosso revisão do GEDmatch
- Como baixar o seu 23andMe e AncestryDNA dados?
- Como usar o Nebula Library ?
- Como usar ClinVar ?
- Como explore seus dados genômicos ?
- Teste de DNA durante a gravidez?