Envoyer un mail à l’auteur
xavier at ultra-fluide.com

Ressources

Ultra-Fluide propose ici une liste d'outils open source pour le datamining.

Cette liste n'est certainement pas exhaustive. Elle se restreint aux logiciels que nous connaissons et qui nous ont parus efficaces. Toute proposition visant à compléter cette page sera bien venue : techno at ultra-fluide.com.

Il existe par ailleurs de nombreux produits commerciaux vendus pour le datamining. Ultra-Fluide a cependant choisi d'exprimer son opinion, subjective naturellement, que les points forts supposés des logiciels commerciaux (interface, documentation, support) ne compensent pas certains inconvénients relatifs notamment aux coûts ou au code propriétaire.
Les logiciels commerciaux disposent également bien souvent de budgets spécifiques visant à les faire connaitre. Nous nous en tenons donc ici à une liste de produits open source.

R-projet :

R est un langage et une infrastructure spécialisés pour les traitements statistiques. R est l'un des nombreux projets GNU distribué sous licence GPL (logiciel libre). R est écrit en langage compilé (principalement en C), ce qui autorise de bonnes performances. La qualité de cet environnement et son ouverture ont permis à une myriade de théoriciens, statisticiens et informaticiens de compléter cette plate-forme d'un nombre impressionnant de fonctionnalités. Des dizaines de packages offrant des milliers de fonctions en font probablement la plate-forme la plus complète. Ce n'est cependant pas l'outil le plus simple d'abord.

Scilab et Mixmod :

Scilab est un langage et une infrastructure spécialisés pour les traitements mathématiques numériques et la modélisation. Scilab est un projet de l'INRIA et de l'Ecole Nationale des Ponts et Chaussées. Sa licence autorise une utilisation gratuite ainsi que la modification des sources. Scilab supporte un spectre très large d'applications, et de nombreuses contributions sont opérationnelles sur cette plate-forme.
Mixmod est une contribution de l'INRIA, du Laboratoire de Mathématique de Besançon et du Laboratoire Heudiasys de Compiègne qui fonctionne sur Scilab. Mixmod propose des fonctionnalités de clustering (analyse discriminante et maximum de vraisemblance). Mixmod est relativement simple d'utilisation et s'avère adapté pour un volume raisonnable de données.

Autoclass-c :

Logiciel spécialisé dans le clustering (analyse discriminante et maximum de vraisemblance). Développé par un laboratoire de la NASA et disponible dans le domaine publique. Outil performant écrit en C qui n'a plus évolué depuis le milieu 2002.


Agence de communication Ultra-Fluide : 01 47 70 23 32 - contact at ultra-fluide.com - 44 rue Richer 75009 Paris.