Détection d’anomalies sur des données biologiques par SVM

dc.contributor.authorMahdjane, Karima
dc.date.accessioned2017-03-21T09:42:21Z
dc.date.available2017-03-21T09:42:21Z
dc.date.issued2012-10-14
dc.description66 f. : ill. ; 30 cm. (+ CD-Rom)en
dc.description.abstractL’objectif de ce travail est de détecter des anomalies sur des données biologiques en effectuant une classification de ces dernières en deux catégories : normales et pathologiques. Pour ce faire, nous avons choisi d’utiliser un algorithme nommé « Séparateurs à vaste marge (SVM) ». Les données utilisées dans cette étude sont issues de la base de données internationale UCI «University of California Irvin ». Ces données sont caractérisées par N exemples d’apprentissages (patients). Chaque exemple est représenté par un vecteur de caractéristiques (attributs) et associé à une classe label. Dans un premier temps, nous avons estimé les performances des SVM en calculant le taux de bonne classification, la sensitivité et la spécificité sur chaque base. Ensuite, une procédure de sélection automatique d’attributs a été effectuée afin de réduire le volume de l’information à traiter et par conséquent de réduire le temps de calcul et la complexité du classificateur. Les algorithmes utilisés pour cette tâche sont « Support Vector Machines Recursive Feature Elimination (SVM-RFE) », le «test du Students (t-test)» et « entropie ». Ces algorithmes attribuent à chaque attribut un score de pertinence puis les ordonnent dans un ordre décroissant. La sélection d’un sous ensemble d’attributs se fait par validation croisée, le sous ensemble choisi est celui pour lequel le taux de bonne classification est max. Les résultats obtenus montrent que les SVM sont des techniques très efficaces et que leur performance en généralisation s’améliore toujours en sélectionnant un sous ensemble d’attributs pertinents.en
dc.identifier.citationOption : télédétectionen
dc.identifier.otherMAG.ELN.97-12
dc.identifier.urihttps://dspace.ummto.dz/handle/ummto/576
dc.language.isofren
dc.publisherUniversité Mouloud Mammerien
dc.subjectSupport Vector Machinesen
dc.subjectClassification superviséen
dc.subjectApprentissage statistiqueen
dc.subjectUCIen
dc.subjectEntropieen
dc.subjectSélection automatique d’attributsen
dc.subjectT-testen
dc.subjectSVM-RFEen
dc.titleDétection d’anomalies sur des données biologiques par SVMen
dc.typeThesisen

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Mahdjane Karima.pdf
Size:
1.25 MB
Format:
Adobe Portable Document Format
Description:
pdf
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: