En este curso, aprenderá varios temas de estadísticas, incluidos problemas de pruebas múltiples, tasas de error, procedimientos de control de tasas de error, tasas de descubrimiento falso, valores q y análisis exploratorio de datos. Luego presentamos el modelado estadístico y cómo se aplica a los datos de alto rendimiento. En particular, discutiremos distribuciones paramétricas, incluidas binomial, exponencial y gamma, y describiremos la estimación de máxima verosimilitud. Brindamos varios ejemplos de cómo se aplican estos conceptos en la secuenciación de próxima generación y los datos de microarrays. Finalmente, discutiremos los modelos jerárquicos y los bayes empíricos junto con algunos ejemplos de cómo se usan en la práctica. Proporcionamos ejemplos de programación R de una manera que ayudará a establecer la conexión entre los conceptos y la implementación.
Dada la diversidad de antecedentes educativos de nuestros estudiantes, hemos dividido la serie en siete partes. Puede tomar la serie completa o cursos individuales que le interesen. Si eres estadístico, deberías considerar saltarte los primeros dos o tres cursos; de manera similar, si eres biólogo, deberías considerar saltarte algunas de las lecciones introductorias de biología. Tenga en cuenta que los aspectos estadísticos y de programación de la clase aumentan en dificultad relativamente rápido en los primeros tres cursos. Para el tercer curso, se enseñarán conceptos estadísticos avanzados, como modelos jerárquicos, y para el cuarto, habilidades avanzadas de ingeniería de software, como computación paralela y conceptos de investigación reproducibles.