Producto


Genómica Comparativa: CG7
CG7 proporciona un completo servicio para la comparación de sets de genomas bacterianos:
1. MLST in silico
2. Análisis de SNPs en el genoma-núcleo
3. Comparación del genoma completo por pares
4. Tabla de ortólogos
 
Hemos diseñado CG7 para que pueda adaptarse a un amplio rango de tipos de proyectos: desde proyectos epidemiológicos a gran escala para analizar miles de genomas a proyectos muy específicos centrados en las diferencias funcionales que existen entre un pequeño set de cepas de interés.

Proporciona información sobre las diferencias genómicas a niveles muy distintos:
- A la menor escala, al nivel más específico: un genoma
- Comparación de dos genomas
- Proyectos de comparativa genómica a gran escala

Proyectos de comparativa genómica a gran escala:
- Análisis comparativo de genomas ensamblados de novo
- Análisis comparativo guiado por referencias

Descripción del servicio:
1. MLST in silico
Consiste en un tipaje in silico utilizando secuencias del genoma. Está basado en las sequence types (ST) definidas para cada especie en la base de datos de MLST correspondiente.
2. Análisis de SNPs en el genoma-núcleo
La búsqueda de SNV (Single Nucleotide Variants) o de SNP (Single Nucleotide Polymorphisms) se centra en el estudio del genoma conservado, también conocido como genoma-núcleo, evitando de esta forma el análisis de las regiones repetitivas, elementos móviles o regiones de fagos. La estrategia de análisis es similar a la realizada en la referencia siguiente: PubMed ID: 24066741.
Centrándonos en el genoma-núcleo y evitando trabajar con secuencias que están probablemente sujetas a la transferencia horizontal de genes o a la recombinación nos permite inferir la distancia evolutiva entre las cepas y construir árboles filogenéticos que puedan ser de interés para estudios epidemiológicos o evolutivos.
- Mapeado y SNP calling
Las reads de cada genoma se mapean frente a un genoma de referencia y luego la detección de SNV se realiza analizando localmente el alineamiento. El SNP calling se hará a lo largo todos los sitios del genoma-núcleo mapeados.
- Efectos de los SNPs detectados
El filtrado y evaluación del efecto de las variantes se realiza aportando datos de la localización de los SNPs con respecto a los genes anotados del genoma de referencia.
- Arbol filogenético
Un árbol filogenético de las cepas bajo estudio se generado en base a los SNPs detectados en el genoma-núcleo.

3. Comparación completa del genoma pair-wise con el programa Differences
- Detección de inserciones y deleciones de cualquier longitud a lo largo del genoma
El programa Differences compara dos genomas al nivel de genoma completo. Está especialmente indicado para la detección de sustituciones, e inserciones o deleciones de cualquier longitud y en cualquier región del genoma (no únicamente en el genoma-núcleo).
- Differencias en el contexto del genoma
Las diferencias entre los dos genomas comparados también se proporciona en el entorno del sistema de anotación BG7 [Pareja-Tobes-2012] para cada genoma -link esp-. Esto nos permite una mejor evaluación de sus posibles implicaciones en los cambios fenotípicos o en la identificación epidemiológica. Utilizamos la herramienta Mauve para el alineamiento de los dos genomas y luego integramos las diferencias que se han detectado con las anotaciones funcionales que se han obtenido con BG7 [Pareja-Tobes-2012]. -link esp- Esto nos permite analizar las diferencias en las secuencias génicas, así como en las regiones intergénicas no codificantes.

4. Tabla de ortólogos: la comunidad del pangenoma
Primero construimos un set de "proteínas pangenómicas", que incluye todas las proteínas codificadas por todos los genes de todos los genomas del set a comparar. Después, detectamos las proteínas ortólogas de cada genoma y construimos una tabla de ortólogos.
Se facilitará también una rica anotación funcional para cada proteína que se clasifique como una "proteína pangenómica".
 
 
 
 
Permalink  
 
Desarrollado por Web4Bio