Parcours Bioinformatique et modélisation Specialization in Bioinformatics and Modeling

diatom

Photo Stephen Nagy

Master d'informatique Master of Computer science

Responsables Directors :
Alessandra Carbone et and Martin Weigt,
Professeurs, Département d'Informatique Professors, Computer science Department
Coordination : Emilie Auger
Secrétariat Pédagogique BIM, 24-25.216
Tel : +33 (0)1 44 27 53 80
Email : master.info.bim@upmc.fr

Master de Biologie Moléculaire et Cellulaire Master of molecular and Cellular Biology

Responsables Directors :
Stéphane Le Crom (M2) et and Philippe Lopez (M1),
Professeurs, Département de Biologie Professors, Biology Department
Coordination : Carine Joseph
Secrétariat Master BMC, 33-34.111
Tel : +33 (0)1 44 27 35 35
Email : carine.joseph@upmc.fr

Contexte en M1 et M2 Context in the first and second year of Master

Pour garantir des bases solides en Informatique, BIM propose aux informaticiens une première année (M1) de cours approfondis en informatique partagés avec d’autres parcours et couvrant les connaissances nécessaires en algorithmique, combinatoire et statistiques pour les informaticiens, et aux biologistes des cours de programmation avancée. Tous les étudiants suivent des cours de statistiques et d'introduction aux bases de la biologie, à la bioinformatique et à la modélisation de systèmes biologiques complexes. Ces modules permettent aux étudiants de se familiariser avec la pluridisciplinarité grâce au contenu des enseignements et à travers la collaboration entre étudiants de disciplines différentes, provenant de l'informatique, du parcours BIM au sein de BMC et du parcours de mathématiques appliquées à la biologie. To ensure a solid foundation in computer science, BIM offers IT professionals the first year (M1) advanced courses in computer shared with other specialties and covering the necessary knowledge in algorithms, combinatorics and statistics for computer scientists, and biologists courses Advanced programming. All students take statistics courses and an introduction to the basics of biology, bioinformatics and modeling of complex biological systems. These modules allow students to become familiar with the multidisciplinary teaching content through and through collaboration between students from different disciplines, from computer science, the course BIM in BMC and course applied mathematics to biology.

Le parcours Bioinformatique et Modélisation (BIM) est aujourd'hui partagée entre les mentions Informatique et Biologie Moléculaire et Cellulaire (BMC). Le but principal de ce parcours est de former des étudiants venant d'origines différentes à comprendre les méthodes informatiques et mathématiques pour la biologie et à savoir les exploiter au mieux dans l'analyse de données. The specialization in Bioinformatics and Modeling (BIM) is now shared between the Computer Science and Molecular and Cellular Biology (BMC) departments. The main goal of this specialization is to train students from different backgrounds to understand the computer and mathematical methods in biology and namely exploit them in the data analysis.

Les deux parcours partagent certains modules, et les étudiants suivent en outre des modules de leur mention (informatique ou biologie). Le détails des UE possibles est donné ci-dessous. The two programs share some units, and students also follow the modules of their specialty (computer science or biology). The details of possible teaching units is given below.

Mention
Informatique (BIM)
Computer Science
Specialty (BIM)
Mention
Biologie Moléculaire et Cellulaire (BMC)
Molecular and Cellular Biology
Specialty (BMC)
Responsables Directors Pr. Alessandra Carbone,
Pr. Martin Weigt,
Dept. d'informatique de l'UPMC UPMC Comp. Science Dept
Pr. Stéphane Le Crom,
Pr. Philippe Lopez,
Dept. de Biologie de l'UPMC UPMC Biology Dept
Coordination Emilie Auger
Couloir 24-25 - Bureau 216
Tel. office : +33 (0)1 44 27 53 80
mel : master.info.bim@upmc.fr
Carine Joseph
Secrétariat Master BMC, 33-34.111
Tel. office : +33 (0)1 44 27 35 35
mel : carine.joseph@upmc.fr

Pour les deux semestres du M1, il est possible de choisir les Unités d'enseignements (UE) parmis plusieurs masters d'informatique (et accessoirement de biologie ou mathématique) comme résumé sur les tableaux ci dessous. Plus d'informations sur toutes les différentes mentions du master d'informatique ici
Chaque semestre nécessite de totaliser 30 ECTS d'enseignement (6 ECTS par UE)
For the two semesters of the M1, it is possible to choose the Teachings Units (TU) among several computers masters (and incidentally biology or mathematics) as summarized in the tables below. More information on all the different references to the master computer here
Each semester requires a total of 30 ECTS Teaching (6 ECTS by ET)

UEs du premier semestre First Semester TUs

 
Mention informatique Computer Science Specialty
Mention BMC Mol. Biol. Specialty
UEs obligatoires Mandatory TUs
4V005 (BMC-Biochimie)
4V007 (BMC-Génétique)
UEs conseillées Recommended TUs
MOGPL (Info-ANDROIDE)
LRC (Info-DAC)
BIMA (Info-IMA)
MODEL, COMPLEX (Info-SFPN)
IL (Info-STL)
 
UEs Ouverture Perspective TUs
MLBDIA (Info-DAC)
ALGAV (Info-STL)
MOGPL (Info-ANDROIDE)
BIMA (Info-IMA)

*contient une partie spécifique suivant la mention : introduction à la biologie (BIM-info), ou programmation avancée (BIM-BMC) *contains specific courses according to the specialty: Introduction to Biology (BIM-info) or advanced programming (BIM-BMC)

UEs du second semestre Second Semester TUs

 
Mention informatique Computer Science Specialty
Mention BMC Mol. Biol. Specialty
UEs obligatoires
MV448
SBAS, MMCN, MV418 (BMC-Biochimie)
UEs conseillées Recommended TUs
SMA (Info-ANDROIDE)
ARF (Info-DAC)
IG3D (Info-IMA)
UEs Ouverture Perspective TUs
IAMSI (Info-DAC)
FLAG (Info-SFPN)
ARF (Info-DAC)
SMA (Info-ANDROIDE)

Semestre 1, descriptif des UEs First semester, TUs description

Algorithmes sur les arbres et les graphes en bioinformatique (AAGB) TOP
A. Carbone, M. Boccara, M. Carpentier

Cette UE est suivi par les étudiants de Biologie et d’Informatique. Il est divisée en deux sous-parties. La première partie présente aux étudiants d’informatique une introduction aux concepts et mécanismes fondamentaux de biologie moléculaire et cellulaire. En parallèle, les étudiants de biologie suivront une introduction à la programmation. La deuxième partie, suivie par les deux groupes réunis, introduit une variété de problèmes de modélisation et d’analyse de données en bioinformatique qui ont amené à proposer des solutions algorithmiques qui exploitent les notions combinatoires d'arbres et de graphes. Une partie des concepts introduits dans la première partie sera reprise, présentée dans un langage plus formel et manipulée algorithmiquement pour résoudre un problème biologique d'actualité.

Programme de la partie d'introduction à la biologie (M. Boccara) :
- Que trouve-t-on dans une cellule ? Les compartiments, ce qu'ils contiennent, leurs fonctions dans la cellule (les molécules simples, les membranes, les polymères de sucres) ;
- Quelques notions de bioénergétique. Les types de liaisons fortes et faibles en biologie ;
- Grands types de macromolécules biologiques structure et propriétés des acides aminés et des protéines (protéines structurales et protéines enzymatiques) ;
- Structure des acides nucléiques ADN et ARN ;
- Mécanismes d'expression de l'information génétique transcription chez les bactéries et chez les eucaryotes ;
- Régulations géniques (protéines régulatrices ex l'opéron Lactose la régulation chez les eucaryotes (régulateurs diverses, chromosomes, chromatine, nucléosome, microARN) ;
- Séquences d'ADN dans un génome : gènes et ADN répété, mutations et épi-mutations ;
- Réplication de l'ADN et cycle cellulaire ;
- Introduction à la signalisation cellulaire ;
- Cycle d'un virus le phage Lambda et sa régulation ;

Programme de la partie d'introduction à la programmation (M. Carpentier) :
Maîtriser la programmation impérative par l'apprentissage d'un langage informatique de référence. L'UE présente sous un angle impératif les structures de données les plus couramment utilisées en programmation (listes, piles, arbres, introduction aux graphes). L’accent sera particulièrement mis sur la gestion explicite de la mémoire (pointeurs et allocation dynamique). Les principes de la compilation séparée seront présentés en cours et pratiqués en TP (.h, .c, .o et Makefile). Une réflexion sur la complexité des algorithmes présentés sera menée et les principales méthodes d'accès aux fichiers seront présentées. Les TP seront réalisés dans un environnement Linux standard en utilisant les outils les plus couramment répandus : gcc, ddd.

Programme de la partie algorithmes en bioinformatique (A. Carbone) :
-Introduction aux problèmes computationnels en bioinformatique ;
- Algorithmes de reconstruction de longues séquences d'ADN d'après leur séquençage ;
- Algorithmes de reconstruction d'arbres phylogénétiques: méthodes basées sur les distances, par parcimonie et par maximum de vraisemblance ;
- Algorithmes pour analyser les réarrangements des génomes ;
- Réseaux biologiques, analyse de leurs propriétés et modèles de génération aléatoire.

Systèmes dynamiques discrets et continus en biologie et médecine (MM062) TOP
Y. Maday

L'objectif est de proposer quelques éléments de modélisation en biologie, écologie et sciences du vivant et introduire, à partir de ces modèles, quelques outils mathématiques qui seront illustrés par des simulations et implémentations numériques.

Programme prévisionnel :
- modèles de dynamique de population discrets et continus : équations différentielles ordinaires, stabilité, bifurcation
- modèles de compétition, écologie, proie prédateur : analyse matricielle ;
- modèles d'épidémiologie : déterministes et aléatoires ;
- dynamique spatiale, réaction, diffusion, phénomènes non locaux, texture : analyse des équations aux dérivées partielles (EDP), théorèmes de point fixe ;
- approximation des EDP: différences finies et éléments finis, basés sur freefem++.

Semestre 2, descriptif des UEs Second semester, TUs description

Statistiques en bioinformatique et algorithmes sur les séquences (SBAS) TOP
A. Carbone, M. Weigt

Cette UE fournit aux étudiants une introduction aux concepts et approches statistiques en bioinformatique. Une ample variété de problèmes d'analyse des séquences biologiques sont présentés ainsi que leurs solutions algorithmiques. Ce module est divisé en deux sous-parties: une première partie concerne les statistiques appliquées en Bioinformatique et la deuxième touche plusieurs problèmes d'analyse des séquences biologiques auxquels certaines des approches statistiques seront appliquées.

Programme prévisionnel:
- Chaînes de Markov I : Ilots CpG, bases théoriques.
- Chaînes de Markov II : théorème ergodique, distributions invariantes.
- Modèles de Markov cachés I : Algorithmes de Viterbi, backward-forward.
- Modèles de Markov cachés II : Apprentissage des paramètres, HMM de profiles pour familles protéiques.
- Echantillonnage : importance sampling, Monte Carlo Markov Chain, Gibbs sampling.
- Algorithmes d'alignement de séquences par paires et multiple.
- Nouvelles approches au problème de la détection d'homologies lointaines.
- Algorithmes exactes de recherche de motifs: motifs d'ADN et matrices de poids spécifiques des positions.
- Algorithmes probabilistes de recherche de motifs: Gibbs sampling, projections aléatoires, EM.
- Algorithmes pour la recherche des gènes procaryotes et eucaryotes.
- Algorithmes pour la prédiction des structures secondaires de l'ARN.

Projet M1 BIM (UE mutualisée avec les autres parcours)TOP
A. Carbone

L'objectif est de permettre d'approfondir des notions apprises en cours et de s'approcher des thématiques de recherche en bioinformatique, soit en développant un programme, soit en utilisant des programmes existants pour traiter des données biologiques, soit en analysant des données biologiques avec des approches statistiques.

Modèles mathématiques et computationnels en neurosciences (MMCN) TOP
M. Desroches, D. Sheynikhovich

Cette UE Introduit les modèles mathématiques et computationnels développés dans les neurosciences. La première partie du cours donne aux étudiants la formation en systèmes dynamiques stochastiques nécessaire à la compréhension de ces modèles. La deuxième partie est dédiée aux aspects plus computationnels en neurosciences. Elle introduit la modélisation et l’analyse théorique en tant qu'outils mathématiques pour la compréhension de problématiques telles que le traitement de l'information, l’apprentissage et la mémoire dans le système nerveux. D’une part, l’enseignement s'appuie sur la présentation de modèles canoniques, aux niveaux moléculaire, cellulaire et à l'échelle des réseaux de neurones. D’autre part, il introduit des méthodes d’analyse bio-statistique autour des thèmes du codage neuronal de l'information et des mécanismes d’adaptation sous-tendant l’optimisation des processus perceptifs et mnésiques. Afin de développer en premier lieu un savoir-faire concret et appliqué, la moitié de l'enseignement dédié aux aspects computationnels consistera en des travaux dirigés.

Les acides nucléiques: de la molécule unique à la cellule (MV418) TOP
J. Cognet, C. Hountondji

Cette unité d'enseignement d'interface introduit les notions fondamentales d'interaction moléculaire requises pour l'entrée dans certains enseignements de M2 ainsi que les concepts essentiels de la modélisation moléculaire.

Cette unité d'enseignement est constituée d'une partie commune suivie par l'ensemble des étudiants et d'une partie spécifique dépendant de la mention de rattachement. La partie commune présente les acides nucléiques qui sont au centre de multiples processus déterminant le vivant à toutes ses échelles, moléculaire, cellulaire et tissulaire. Ces molécules sont donc aussi bien des cibles à visée thérapeutique que des nano-objets dans des circuits moléculaires. Cette unité d'enseignement vise à montrer comment les acides nucléiques interviennent dans le vivant, comment il est possible de les manipuler et comment leur connaissance permet de comprendre leurs interactions avec d'autres molécules. Pour les étudiant(e)s de la mention "Biologie Moléculaire et Cellulaire", la partie spécifique prolonge la partie commune avec des exemples et des applications. Pour les étudiant(e)s de la mention "Informatique", la partie spécifique correspond à une mise à niveau en biologie. Elle permettra d'aborder les concepts et les mécanismes essentiels de la biologie moléculaire.

Programmation avancée en Python et introduction à la gestion de bases de données (MV448) TOP
M. Carpentier, E. Duprat

Maîtriser la programmation objet par l'apprentissage d'un langage informatique de référence. Thèmes abordés : programmation en Python et la gestion de bases de données. Conseillée dans les cas exceptionnels d’étudiants en informatique n'ayant pas une forte compétence de programmation. Cette UE est obligatoire pour les biologistes.