Projects with this topic
-
pt_kmeans is a high-performance, pure PyTorch K-Means implementation for CPU/GPU, featuring K-Means++ initialization, hierarchical clustering, and cluster splitting, optimized for large-scale datasets.
Updated -
Le projet est réalisé par ALVAREZ Océane et IBRAHIM Benita, étudiantes en M1 Bio-informatique parcours BBS (Bio-informatique et biologie des Systèmes) de l'Université de Toulouse. Ce projet de fouille de données est un projet réalisé dans le cadre de l'UE : Fouille de données, dirigée par Mr. Roland Barriot : @rbarriot.
Durant cette étude des analyses seront effectuées sur R en fonction d'un dataset choisi. Le projet se décomposera en trois parties : La première consistera en une analyse exploratoire complète du jeu de données enfin d'en comprendre la structure. La seconde correspondra à la phase de conception, durant laquelle une réflexion sera menée sur les méthodes d’analyse à mettre en œuvre et sur les objectifs à poursuivre. Enfin, la troisième partie portera sur la mise en œuvre des analyses choisies, accompagnée d'une évaluation des résultats qui seront obtenus et d'une discussion sur de potentielles améliorations.
En raison d'une appétence particulière pour le domaine de la santé, le choix s'est orienté sur un dataset relatif aux maladies cardiovasculaires. Pour plus d’informations sur les données, consultez la section dédiée et le README.md explicatif : https://gitlab.com/alvarez_oceane/fouille-projet/-/tree/master/data
L'objectif de notre étude est d'obtenir et d’identifier une ou plusieurs méthodes de classification supervisée capables de prédire correctement le type de douleur thoracique à partir des variables cliniques disponibles dans le dataset. Plusieurs méthodes seront comparées comme Naive Bayes, K-NN, LDA et Random Forest. L’obtention d’un ou plusieurs modèles fiables pour prédire correctement la classe des patients à partir des variables explicatives est attendu. Tout comme la visualisation des performances des modèles et la sélection du modèle final le plus pertinent.
Les codes, le rapport et chaque Rmd utilisé lors de l'étude sont disponibles sur ce git.
Updated -
Projet d’analyse du comportement des utilisateurs Instagram à partir d’un large dataset synthétique (plus d’un million d’utilisateurs).
Le projet explore :
Analyse exploratoire des données (EDA) Prédictions de variables comportementales (stress, âge, clics publicitaires, revenu) Identification de profils utilisateurs avec clustering (KMeans) Interprétation des résultats statistiques en lien avec la vie réelleMéthodologie : visualisation, corrélations, sélection de modèles, entraînement, évaluation et interprétation.
Technologies : Python, Pandas, NumPy, Matplotlib, Scikit-learn, Jupyter.
Projet réalisé dans le cadre de la formation Développeur en Intelligence Artificielle (Simplon).
Updated -
Library and tools for similarity measurement, classification and clustering of digital content and segmentation images from digitized document
Updated -
this project was done on a text dataset with labels about topics, the goal from this project is to make it as a small reference for myself about clustering and its metrics and reduction techniques, it was not intended for anyone else, but if you find it useful feel free to learn from it and show your friends
deployment link: https://orthodox-clusteringfr-gb3ygqya9aicctlx5qdwft.streamlit.app/
Updated -
El Sistema / Red Distribuida EPA El Sistema
CI/CD Catalog (unpublished)Una arquitectura de red distribuida diseñada para la gestión, preservación y acceso al patrimonio audiovisual de El Sistema. EDICIÓN EN DESARROLLO
Updated -
XCut - solving normalized cut on graphs using expander decomposition
Updated -
A regular expression generator for arbitrary sets of strings. Returns the patterns with exact or generalised character sets, depending on the choice of the user, and facilitates clustering over patterns to create superpatterns.
Updated -
Cluster analysis of conformere ensembles
Updated -
Search for patterns in river water samples data
Updated -
A program that utilizes cluster computing and parallel programming to simulate trading strategies on the Nordic stock market.
Updated -
My attempts to solve homework from the Moscow Institute of Physics and Technology course
Updated -
Collection of completed data-mining (university course) on python
Updated -
A simple spectral clustering example made with Python.
Updated -
The end.. and maybe the beginning of the LinuxPMI kernel clustering extensions. Based on openmosix.
Updated -
Clustering and rescheduling algorithms for the Social Internet of Energy. Related scientific manuscripts: https://ieeexplore.ieee.org/abstract/document/8784194 https://www.mdpi.com/1424-8220/20/13/3704
Updated -
MSMCluster is a plugin for MegaMol that clusters and visualizes the clustering of molecular surface map images.
Updated -