Trouvez facilement votre prochaine lecture
7 super livres pour s’initier à R sur de bonnes bases

7 super livres pour s’initier à R sur de bonnes bases

R est un langage de programmation et un environnement logiciel spécialisé dans les statistiques et l’analyse de données. Créé par Ross Ihaka et Robert Gentleman à l’université d’Auckland, en Nouvelle-Zélande, dans les années 1990, il est aujourd’hui massivement exploité par les data scientists, les statisticiens et les chercheurs du monde entier.

R compte une vaste collection de packages qui en enrichissent les fonctionnalités, couvrant des domaines tels que l’analyse statistique, la visualisation de données ou encore le machine learning. Il permet de générer des graphiques et des projections de données complexes d’une rare précision.

Vous aimeriez vous initier à R sur de bonnes bases ? Tour d’horizon des ouvrages de référence à destination des débutant(e)s.


1. R pour la statistique et la science des données (François Husson)

Disponible sur Amazon Disponible à la Fnac

Le logiciel R est un outil incontournable de statistique, de visualisation de données et de science des données tant dans le monde universitaire que dans celui de l’entreprise. Ceci s’explique par ses trois principales qualités : il est gratuit, très complet et en essor permanent. Récemment, il a su s’adapter pour entrer dans l’ère du big-data et permettre de recueillir et traiter des données hétérogènes et de très grandes dimensions (issues du Web, données textuelles, etc.).

Ce livre s’articule en deux grandes parties : la première est centrée sur le fonctionnement du logiciel R tandis que la seconde met en œuvre une trentaine de méthodes statistiques au travers de fiches. Ces fiches sont chacune basées sur un exemple concret et balayent un large spectre de techniques pour traiter des données.

Ce livre s’adresse aux débutants comme aux utilisateurs réguliers de R. Il leur permettra de réaliser rapidement des graphiques et des traitements statistiques simples ou élaborés.

Éditions PU RENNES ; 416 pages.


2. Le langage R au quotidien (Olivier Decourt)

Disponible sur Amazon Disponible à la Fnac

L’objectif de cet ouvrage est d’apprendre le traitement des données avec R à tous ceux qui doivent produire des statistiques descriptives, des graphiques et des exports de tableaux. Le contenu ne se limite pas à la modélisation statistique, mais il montre tout ce qu’il faut savoir faire avant, autour et après la construction du modèle qu’il s’agisse d’importation et de préparation des données ou de restitution des résultats.

Ce livre a été conçu pour tirer pleinement parti de R en se concentrant sur les outils les plus courants (packages de base, reshape2, dplyr, tidyr, data.table) et en proposant des exercices sur de très gros volumes de données. Ces exercices accessibles en ligne utilisent des données en open data mises à disposition du public par AirBnB (réservation de 35 000 logements parisiens sur 700 jours).

Éditions DUNOD ; 288 pages.


3. Stats faciles avec R (Guillaume Broc)

Disponible sur Amazon Disponible à la Fnac

Alors que le logiciel R est de plus en plus utilisé dans les universités francophones, il manquait encore un manuel de référence, qui guide l’utilisateur pas à pas dans le traitement de l’ensemble de ses données… Le voici !

Très complet, « Stats faciles avec R » vous aidera à déterminer le test le plus approprié pour chaque situation et à le mettre en place de manière optimale grâce aux procédures R les plus rentables. Il vous permettra aussi d’aller plus loin, depuis la vérification des présupposés et des propriétés métrologiques jusqu’aux analyses de taille d’effet et de puissance.

Feuilleter un extrait

Destiné à un lecteur débutant ou confirmé, résolument tourné vers la pratique et les besoins des étudiants et chercheurs en psychologie, ce livre fournit toutes les clés pour une prise en main rapide et ambitieuse du logiciel, sans aucun prérequis.

Écrit dans un langage clair et pédagogique, systématiquement illustré d’arbres de décision, de captures d’écran et d’interprétation des sorties, il vous aidera à comprendre R et à développer vos compétences pour pouvoir l’utiliser de manière autonome en toute situation.

Éditions DE BOECK SUP ; 456 pages.


4. Analyse de données avec R (Jérôme Pagès, Sébastien Lê, François Husson)

Disponible sur Amazon Disponible à la Fnac

Le contenu de ce livre correspond à l’enseignement d’analyse de données proposé à l’ensemble des étudiants d’Agrocampus. Il a été conçu pour des étudiants qui ne se destinent pas aux métiers de la statistique mais qui auront à traiter des données dans le cadre de leurs stages d’abord de leurs emplois ensuite.

Concrètement, le niveau d’une licence scientifique est tout à fait suffisant pour s’approprier tous les concepts introduits. Sur le plan informatique, une initiation au langage R est suffisante, au moins pour commencer.

Pour chaque méthode, la démarche adoptée est la même. Un exemple permet d’introduire la problématique et concrétise presque pas à pas les éléments théoriques. Cet exposé est suivi de plusieurs exemples traités de façon détaillée pour illustrer l’apport de la méthode dans les applications. Tout le long du texte, chaque résultat est accompagné de la commande R qui permet de l’obtenir. Toutes ces commandes sont accessibles à partir du logiciel libre FactoMineR.

Ainsi, avec cet ouvrage, le lecteur dispose d’un équipement complet (bases théoriques, exemples, logiciels) pour analyser des données multidimensionnelles. Cette édition prend en compte l’actualisation du logiciel R.

Les trois auteurs sont enseignants-chercheurs au laboratoire de mathématiques appliquées d’Agrocampus (Rennes). Ils ont une vaste expérience de l’enseignement de l’analyse des données auprès d’auditeurs variés, en particulier non mathématiciens. Ils ont publié de nombreux travaux de recherche en analyse factorielle et développent le logiciel libre FactoMineR, maintenant largement utilisé dans de nombreux pays.

Éditions PU RENNES ; 238 pages.


5. Langage R – Prendre en main les statistiques (Daname Kolani, Vincent Isoz, Aline Deschamps)

Disponible sur Amazon Disponible à la Fnac

Ce livre se compose d’un livre de référence sur le langage R pour lever la complexité apparente de ce puissant langage et permettre une prise en main aisée des statistiques de premier cycle et d’un approfondissement sous forme de vidéo pour apprendre à récupérer des données issues de diverses sources avec ce langage dédié à la Data Science.

R est un langage statistique très riche en fonctionnalités de traitement des données. Il permet l’extraction de données de sources variées, leur traitement et leur organisation. Plus encore, la multiplicité des systèmes de visualisation graphique et les nombreuses fonctions de modélisation statistique font de ce langage un outil statistique redoutable.

Avec ce livre, les auteurs proposent une présentation de R ayant pour objectif de lever la complexité apparente de ce puissant langage et de permettre une prise en main aisée des statistiques de premier cycle.

Dans la première partie du livre, le lecteur découvre de manière détaillée les fondamentaux du langage R : les variables et la syntaxe des opérations de base, les structures de données, les outils du langage pour programmer notamment les structures de contrôles, les fonctions et même la conception de packages.

Dans la seconde partie, les auteurs traitent des problématiques métiers liées aux outils d’importation et d’exportation de données, d’analyse basique et de visualisation des données, aux outils de simulation et d’inférences statistiques et aux modèles statistiques classiques (ANOVA, régression linéaire, etc.).

Chaque concept abordé est accompagné d’exemples pratiques commentés pour guider le lecteur dans son apprentissage du langage pour le traitement des statistiques de base.

Des éléments complémentaires sont disponibles en téléchargement sur le site www.editions-eni.fr.

Éditions ENI ; 748 pages.


6. Initiation à la statistique avec R (Myriam Maumy-Bertrand, Frédéric Bertrand)

Disponible sur Amazon Disponible à la Fnac

Issu d’une longue expérience de formation auprès de publics très variés, cet ouvrage accompagne l’étudiant en Licence, en Master ou en écoles d’ingénieurs dans son apprentissage de la statistique avec R.

Dans chaque chapitre, le lecteur trouvera :

  • Un cours détaillé ponctué de nombreux exemples et de rubriques méthodologiques ;
  • Des exercices répartis en deux catégories : des applications directes du cours et des problèmes plus sophistiqués permettant de généraliser les concepts ;
  • Une rubrique « Du mal à démarrer ? ». Pour les questions les plus difficiles, une indication est proposée afin d’aider à la résolution de l’exercice ou du problème ;
  • Les solutions détaillées des exercices et des problèmes.

Cette nouvelle édition enrichie est à jour des dernières évolutions du logiciel R. Les codes sont téléchargeables à partir de la page d’accueil du livre sur le site dunod.com.

Éditions DUNOD ; 456 pages.


7. Langage R et statistiques (Marie Vaugoyeau)

Disponible sur Amazon Disponible à la Fnac

Que vous soyez débutant, novice ou junior dans la science des données, ce livre est là pour vous accompagner dans l’acquisition des connaissances indispensables pour la réalisation de statistiques et l’analyse de tous types de données avec le langage R.

Une courte introduction au langage R avec RStudio vous permet, sans connaissances ni compétences spécifiques en la matière, de prendre en main rapidement l’Environnement de Développement Intégré (EDI ou IDE en anglais) le plus utilisé, ainsi que la création de rapports automatisés grâce au R Markdown.

Les bases mathématiques d’un niveau de Terminale Scientifique, indispensables pour comprendre les statistiques et mieux appréhender la lecture de ce livre, sont ensuite succinctement présentées.

L’auteur fait alors la part belle aux tests d’hypothèses paramétriques et non paramétriques, c’est-à-dire aux tests statistiques courants tels que les tests de Student et de Khi-2, mais aborde aussi les régressions linéaires ou généralisées, simples et multiples, ainsi que les modèles linéaires généralisés à effets fixes ou mixtes. L’analyse en composantes principales est également détaillée. Les statistiques approfondies permettent de généraliser les mesures réalisées sur un échantillon à une population ou de comparer des groupes ou des populations entre eux.

La réalisation des différents modèles et statistiques est accompagnée de mises en application avec des exemples variés appliqués à différents domaines (biologie, physique, marketing…). L’intégralité des codes utilisés est disponible en téléchargement sur le site www.editions-eni.fr avec un script R Markdown pour chaque chapitre permettant de refaire chez soi la totalité des graphiques et des tests réalisés.

Éditions ENI ; 396 pages.

error: Contenu protégé