Bannière Faculté des sciences DIC
 
Description
Title : SÉMINAIRE: Prise en compte des connaissances du domaine dans l'analyse transcriptomique : Similarité sémantique, classification fonctionnelle et profils flous
Tutor : Sid Ahmed Benabderrahmane
Number : 37/18
Status : Not exceeded
Begin : Thursday, 08 November, 2018 à 10:30AM
Location : Salle PK-5115, Pavillon Président-Kennedy (PK), 201, avenue du Président-Kennedy, H2X 3Y7
Bookable : 12

Résumé

L'analyse de données transcriptomique a pour but d'identifier les gènes qui présentent des variations d'expression entre différentes situations biologiques: par exemple entre des échantillons de tissu sain et de tissu malade, et de caractériser ces gènes à partir de leurs annotations fonctionnelles. Par conséquence, la difficulté dans le traitement de ce genre de données se situe dans leur nature complexe, hétérogène et volumineuse.

Dans le cas d'un projet avec l'Inca (Institut Français du Cancer), j'ai proposé des contributions pour la prise en compte des connaissances du domaine pendant le processus de fouilles et d'extraction de connaissances. Tout d'abord j'ai définis une nouvelle mesure de similarité sémantique et fonctionnelle (IntelliGO) entre les gènes, qui considère au mieux les annotations fonctionnelles issues de l'ontologie GO ('Gene Ontology'). Cette mesure a été ensuite utilisée, après une étape d'évaluation rigoureuse, dans un processus de classification fonctionnelle et d'enrichissement des gènes (Clustering, Bi-Clustering avec les treillis de Galois, Ranking, ...etc). En troisième, j'ai proposé une approche différentielle d'extraction de profils d'expression avec la logique floue, pour étudier la variation des niveaux d'expression des gènes entre différentes situations biologiques (état normal, état cancéreux, ...). Ensuite, une étape d'analyse de recouvrement est réalisée, entre les clusters fonctionnels obtenus avec IntelliGO, et les profils d'expression, pour mettre en évidence les gènes ayant à la fois les mêmes variations d'expression et des annotations fonctionnelles similaires. Finalement, cette mesure de similarité a été généralisée à d'autres vocabulaires structurés en graphe acyclique dirigé et enraciné (rDAG), pour étudier les effets secondaires des médicaments sur le marché pharmaceutique.

Biographie

Sid Ahmed Benabderrahmane est actuellement chercheur associé à l’université d'Edinburgh dans le groupe fouille et base de données, où il participe dans le projet ADAPT financé par DARPA (https://galois.com/project/adapt/), pour la détection d'anomalies et des menaces persistantes en cybercriminalité avec des approches d'apprentissage et de fouilles de données: motifs fréquents ou rares, motifs de graphes, ... etc. Auparavant il était chercheur postdoc à l’université de Paris 8, où il a travaillé sur les méthodes d'apprentissage profond appliquées aux séries temporelles. 

Sid Ahmed a eu son master en informatique à l’université d'Evry Paris-Saclay, puis son doctorat à l’université de Nancy Lorraine, où il a travaillé sur la fouille de données bio-médicales relatives aux cancers.