Le scikit-learn est un projet d'apprentissage statistique en Python relativement jeune: le développement n'a réellement commencé que début 2010. En quelques années, le projet a connu un essor fantastique: une cinquantaine de développeurs a fait des contributions non triviales, 28 ayant contribué dans les derniers 4 mois, avec un cumul de 44 000 lignes de code.
Le partage du développement et du sentiment de propriété du code est un facteur central au succès d'un projet libre. Comparé à des projets en apparence similaire que j'ai menés, le scikit-learn a un développement beaucoup plus dynamique et communautaire. Dans cette présentation, je discuterai les raisons techniques et sociales qui me semblent expliquer ce dynamisme, notamment: choix des objectifs du projet, technologies utilisées, relations humaines dans la communauté, outils de gestion de projet, marketing.