Análisis de datos de RNA-Seq 👾
Instructora: Dra. Evelia Coss, Posdoc de la Dra. Alejandra Medina, LIIGH-UNAM
Clases para los alumnos de Ciencias Genomicas de 4to semestre de la ENES, Juriquilla (27 Feb - 1 Marzo 2024). Formando parte de la clase de Bioinformática y Estadística 2.
Descripción
El módulo consta de sesiones teóricas y prácticas impartidas de forma presencial, que cubrirán aspectos básicos del tópico como:
- Calidad y limpieza de archivos fastq
- Alineamiento y ensamblaje con el genoma de referencia usando STAR
- Generación del archivo de cuentas crudas
- Importar datos en R
- Normalización y corrección por batch
- Expresión diferencial con DESEq2 y edgeR
- Análisis funcional de los genes detectados
- Visualización grafica de los resultados
Se darán presentaciones detalladas del uso de programas clave, todos de código fuente abierto, usando datos tomados de las bases de datos. También se presentará el uso de algunos scripts de Bash y R muy sencillos, con el objetivo de aprender los aspectos básicos de estos lenguajes para el análisis de datos transcriptómico.
Contenido 📌
- Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos
- Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads
- Dia 3. Importar datos en R, Normalización y Corrección por batch / DEG con DESeq2
- Dia 4. GSEA - Análisis funcional
Dia 1. Aspectos generales de RNA-Seq / Control de calidad de los datos
- Fecha: martes 27 de Febrero 2024
- Presentación:
- Datos:
/mnt/Guanina/bioinfo24/data/Clase_RNASeq2024/
- Tarea: Elegir en equipos los transcriptomas que emplearán en su proyecto - Información diapositiva 58 y moodle ENES
- Lecturas y cursos recomendados:
Dia 2. Diversos pipeline para Alineamiento, ensamblaje y conteo de reads
- Fecha: miércoles 28 de Febrero 2024
- Presentación:
- Lecturas y cursos recomendados:
Dia 3. Importar datos en R, Normalización y Corrección por batch effect 🪲 / DEG con DESeq2
- Fecha: jueves 29 de Febrero 2024
- Presentación:
- Scripts: https://github.com/EveliaCoss/RNAseq_classFEB2024/tree/main/Practica_Dia3/scripts/
- Lecturas y cursos recomendados:
Dia 4. GSEA - Análisis funcional
- Fecha: viernes 1 de marzo 2024
- Presentación:
- Lecturas y cursos recomendados:
Requisitos
- Contar con una terminal en tu sistema operativo
- Los paquetes que emplearemos en R v4.0.2, se encuentran presentes en el cluster DNA, por lo que, no es necesario instalar nada en nuestras computadoras.
- Nodo de prueba (qlogin)
Pipeline ⚡
Pasos a seguir para el análisis de los datos de RNA-Seq
-
Script load_data_inR.R
:
1) Importar datos en R (archivo de cuentas) + metadatos y 2) Crear una matriz de cuentas con todos los transcriptomas
-
Script DEG_analysis.R
:
3) Crear el archivo dds
con DESeq2
, 4) Correr el análisis de Expresión Diferencial de los Genes (DEG), 5) Normalización de los datos, 6) Detección de batch effect y 7) Obtener los resultados de los contraste de DEG
-
Script VisualizacionDatos.R
:
8) Visualización de los datos
-
Script GOterms_analysis.R
:
9) Análisis de Terminos funcionales (GO terms)
Clase de retroalimentación (24 mayo 2024)
Clases previas 📗
En la clase previa les enseñe a crear reportes en Rmarkdown, si necesitan revisar la clase les dejo el link: https://github.com/EveliaCoss/RmarkdownGraphs_notes
También aprendimos a crear llaves (ssh-keygen) y alias para acceder a los servidores de una manera segura y rápida: https://github.com/EveliaCoss/keygen
Cursos para practicar 📕
Referencias 📚