Pour aller plus loin

Le processus de découverte d'informations ne se limite pas à la fouille de données. C'est aussi l'art de de trouver une documentation adaptée et de qualité.

Cette page propose quelques sites intéressants, généralement francophones. Avec une petite part d'arbitraire dans le choix, forcément...

Quant aux livres, ils ne font pas l'objet d'une page bibliographique, pas davantage que les sites web. Les renvois sont indiqués sur les pages concernées. Cependant, les ouvrages qui figurent dans mon "anthologie" sont indiqués au bas de cette présente page.

coucher soleil

 

La mèche

On peut traduire Data mining par "fouille de données", en particulier dans un cadre d'exploitation minière. C'est pourquoi la mèche est le visuel récurrent de ce site...

Mèche

 

 

Liens Amazon Canada

CANADA

 

histogramme

 

Planète

 

 

 

Sélection Amazon France de livres en anglais

 

 

Et pour faire de sustantielles économies tout en étant livré souvent dès le lendemain matin en mains propres :

Sélection de sites à informations gratuites

 

Statistiques et data mining

Explications

Le glossaire de la modélisation :

http://www.aiaccess.net/

Méthodes et mise en place de data mining :

http://data.mining.free.fr/

Cours de statistiques :

http://rfv.insa-lyon.fr/~jolion/STAT/poly.html

http://www.polymorphe.org/index.php?/Statistiques/

Applications

Thèse sur l'application de techniques prévisionnelles à une entreprise de transport de marchandises :

http://tel.archives-ouvertes.fr/tel-00487327

Logiciels

Procédures et options de SAS/STAT :

http://v8doc.sas.com/sashtml/stat/index.htm

Le glossaire de Statistica :

http://www.statsoft.com/textbook/stathome.html

Logiciels gratuits :

http://directory.fsf.org/category/mathstat/

http://freestatistics.altervista.org/fr/stat.php

La calculatrice gratuite la plus utilisée sur ce site :

Sine qua non

Glossaire multilingue

http://isi.cbs.nl/glossary/

Revue

http://www.modulad.fr/

Réseaux

La Société Française de Statistique (SFdS) :

http://www.sfds.asso.fr/

Forum :

http://statistiques.forumpro.fr/forum.htm

Mathématiques

Le site de maths le plus vaste du web (également une référence pour les statistiques) :

http://mathworld.wolfram.com/

Mathématiques du supérieur :

http://www.les-mathematiques.net/index.php3

Lycées et prépas :

http://www.bacamaths.net/

Du collège au supérieur :

http://serge.mehl.free.fr/

Coup de coeur :

http://villemin.gerard.free.fr/

Entreprise

Sélection de dossiers, articles et cours (+ de 5 000 liens)

http://www.manager-go.com/

 

Sélection de livres

Data Mining et statistique décisionnelle (Stéphane Tufféry) TECHNIP 2010. Un panorama très complet du data mining avec quelques rappels de statistiques. Plus axé sur l'opérationnel que sur les démonstrations.

Statistique exploratoire multidimensionnelle (L. Lebart, M. Piron, A. Morineau) DUNOD 2006.Un incontournable de niveau master.

Méthodes de prévision à court terme (Guy Mélard) ELLIPSES 2007. Un ouvrage particulièrement clair et opérationnel qui explore à fond certaines techniques. Avec CD-ROM. Mais il n'est plus édité...

Probabilités, analyse des données et statistiques (Gilbert Saporta) TECHNIP 2006. La référence, tant pour les statistiques que pour l'analyse de données. Bon niveau en maths exigé !

Statistiques pour économistes et gestionnaires (Brigitte Tribout) PEARSON 2007. Avec éventuellement son supplément de corrigés. Initiation très claire qui ne s'adresse pas qu'aux économistes...

Éléments de statistiques (Catherine Dehon, Jean-Jacques Droesbeke, Catherine Vermandele) SMA 2008. Une copieuse introduction aux statistiques qui aborde aussi l'analyse de données. Lecture facile.

Statistiques avec Excel, descriptives, tests paramétriques et non paramétriques à partir de la version Excel 2000 (Jean-Pierre Georgin, Michel Gouet) PUR 2005. Je dois beaucoup à cet ouvrage qui détaille des tests pour certains peu connus. Avec CD-ROM.