Phred
Home Introdução Phred Phrap Consed Links

 

Esta página contém maiores detalhes sobre o software Phred.

Objetivos

O principal objetivo do Phred é realizar a transformação de cromatogramas (traces), provenientes das máquinas de seqüenciamento, em seqüências de DNA. Baseado na análise do cromatograma, ele também associa um fator de qualidade para cada base da seqüência gerada. Esse fator, como será explicado a seguir, é de enorme valor para as demais fases do seqüenciamento de DNA. 

Interface

A seguir é ilustrada a comunicação com o software Phred. Basicamente ela se dá via arquivos, que podem ter diversos formatos, tanto de entrada quanto de saída.  A figura ilustra estes formatos:



Fator de Qualidade

Um dos pontos fortes do Phred é a geração de arquivos de qualidade descrevendo a confiança que pode-se ter em cada base nomeada. A qualidade de cada base varia entre 4 e 60 e indica a chance da base estar correta. Dessa forma, quanto maior a qualidade melhor. 

O valor da qualidade é determinado pela análise do cromatograma na vizinhança de cada base. A seguir é mostrada uma tabela com a relação entre o valor de qualidade (Q) e o nível de confiança que pode-se assumir. Também é mostrada a fórmula utilizada pelo Phed para a geração desses valores.



Exemplo

Como ilustração de uso do Phred, é mostrado a seguir o resultado da execução do Phred sobre o arquivo de cromatograma (no formato ABI 377) LCP5AGGEU!LIKAA05.g.
A execução produz dois  arquivos no formato FASTA. Um contendo a seqüência nomeada e outro contendo os valores de qualidade para cada base na seqüência.



Visualização usando TraceViewer

Como foi mencionado, o Phred comunica-se via arquivos, ou seja, ele não possui recursos de visualização do cromatograma, o que torna bastante difícil a análise da qualidade do seu resultado. Para prover esse recurso, alguns softwares já foram desenvolvidos com o objetivo de mostrar o trace de entrada para o Phred (um cromatograma), as decisões tomadas pelo Phred (bases nomeadas) e a qualidade de cada base. Entre esse programas, um que merece destaque é o TraceViewer. Primeiro porque ele permite o upload de cromatogramas para um servidor potente, onde será executado o Phred sobre ele, segundo porque ele permite a visualização do resultado em um browser através de um applet simples, mas muito bom.

Abaixo estão dois exemplos de trechos do arquivo de cromatograma mencionado acima.

Uma parte de excelente qualidade (bases de 105-128). Observar que os gráficos de cada tipo de base (ACGT) se expressam claramente e apenas nos pontos em que eles irão nomear bases daquele tipo. Ou seja, eles contribuem onde é necessário e não atrapalham em outros pontos.








Uma parte de qualidade muito inferior (bases de 658-690). Observar que os gráficos de cada tipo de base se expressam de forma muito inferior e não apenas nos pontos em que eles irão nomear bases daquele tipo. Ou seja, eles atrapalham e produzem ambigüidades em certos pontos, levando a baixos valores de qualidade.








Parâmetros de execução

Ao executar o Phred, 50 parâmetros podem ser especificados de acordo com a necessidade do usuário. Por exemplo, diretório dos arquivos de entrada/saída, tipo do formato de saída, rejeitar bases cuja qualidade seja inferior a um limite especificado, etc.

Importância dos fatores de qualidade

Como foi observado, a importância dos arquivos de qualidade é muito grande. Para explicitar essa importância, cosidere o cenário onde não há tais arquivos. Quando isso ocorre, usualmente é atribuído um fator de qualidade padrão para todas as bases. Dessa forma, corre-se o risco de prejudicar toda a análise da seqüência, pois trechos bons irão receber fatores abaixo do normal, enquanto que trechos ruins recebem valores melhores que o esperado.

Dessa forma, é extremamente recomendável utilizar os fatores de qualidade durante as demais fases do processo de seqüenciamento. O único cenário em que tais valores não são aplicáveis é quando não tem-se acesso aos arquivos de cromatogramas, apenas às seqüências já em formato FASTA.