Introduction au logiciel

De
Publié par

  • cours - matière potentielle : introduction au logiciel
1 Notes de cours Introduction au logiciel Etienne RIVOT, Jérôme GUITTON, Tristan ROUYER Laboratoire d'Ecologie Halieutique Agrocampus Rennes Version de Septembre 2006
  • programme d'installation
  • windows charger
  • charger des librairies
  • nature des variables
  • données de tables
  • librairie flr pour l'évaluation des stocks halieutiques
  • librairies
  • librairie
  • logiciel
  • logiciels
  • variable
  • variables
Publié le : lundi 26 mars 2012
Lecture(s) : 98
Source : halieut.roazhon.inra.fr
Nombre de pages : 40
Voir plus Voir moins

Notes de cours








Introduction au logiciel













Etienne RIVOT, Jérôme GUITTON, Tristan ROUYER

Laboratoire d’Ecologie Halieutique
Agrocampus Rennes




Version de Septembre 2006



1Introduction
Un logiciel de statistique
R est un logiciel qui offre un langage et un environnement pour l’analyse statistique des données et la
représentation graphique.
Site Web : http://www.r-project.org/
Il permet notamment :
- de manipuler des données (stocker, manipuler des tables de données de grande dimension,
extraire des données de tables, résumer les données … ) ;
- d’effectuer du calcul matriciel et autres opérations mathématiques complexes ;
- de réaliser des analyses statistiques des plus simples aux plus complexes ;
- de réaliser des graphiques du plus simple au plus élaboré ;
- de programmer de façon simple et efficace ;
- de se lier avec d’autres logiciels ou langages (par exemple, possibilité de lien avec C, C++ et
Fortran pour compiler des tâches lourdes).
R utilise un langage (en fait un dialecte, c’est à dire un langage intégré et interprété plus facile à
comprendre que les langage de base type C++ et qui ne nécessite pas de compilation avant
l’exécution du programme) dérivé du langage S (AT&T Bell Laboratories). S est distribué sous le nom
du logiciel Splus. Il existe des différences entre le langage R et Splus, mais la plupart des programme
écris en Splus peuvent être transcrits en R moyennant quelques petits ajustements.
R est très utilisé dans la communauté des « biométriciens » en France et à l’étranger, et en particulier
dans la communauté halieutique.
Un logiciel libre
R appartient à la famille des logiciels « GNU Public Licence » (http://www.gnu.org/). Un logiciel sous
licence GNU est un « logiciel libre » qui permet à tout à chacun :
- de disposer du logiciel gratuitement (généralement téléchargeable gratuitement) ;
- d’utiliser le programme pour tout usage, y compris commercial ;
- d’étudier le fonctionnement du programme, de l'améliorer, le modifier, publier ces
améliorations (l'accès libre au code source est donc requis) ;
- de redistribuer des copies, gratuitement ou non, sous quelque forme que ce soit ;
Cela favorise le développement « collaboratif » du logiciel par une communauté importante
d’utilisateurs.
Le développement et la distribution de R sont assurés par plusieurs statisticiens regroupés dans le
« R Development Core Team », qui rend public ses développements dans le « Comprehensive R
Archive Network (CRAN) » (http://www.cran.r-project.org) .

2Un langage de script : une source de flexibilité
L’utilisation du logiciel R nécessite d’écrire un programme (un script) qui est une suite de commandes.
Les commandes sont des instructions interprétées qui font intervenir des opérateurs et des fonctions.
Exemple
> setwd("C:/repertoire0") (sélectionne le répertoire de travail "repertoire0")
> sqrt(x) (calcule et renvoie la racine carrée du nombre x)
Ce fonctionnement à base de script peut apparaître a priori comme moins convivial et moins
intéressant qu’un fonctionnement à base de « fenêtres » et de « menus » à sélectionner comme dans
d’autres logiciels. Mais il offre d’énorme avantages. Il permet d’écrire un programme contenant une
suite logique de traitement des données et de représentation graphique et de le stocker. Cela permet
d’automatiser les tâches et de les répéter sur d’autres jeux de données.
Un système modulaire : les librairies
Les fonctions élémentaires de R sont regroupées dans la librairie base chargée au démarrage de la
console.
Le fonctionnement collaboratif GNU permet à R d’être un logiciel statistique très réactif au
développement de nouvelles méthodes et de nouvelles applications. Cela se matérialise sous la forme
d’une bibliothèque de fonction considérable et en constant développement, disponible au
téléchargement. Ces fonctions sont regroupées dans des librairies (ou packages), qui forment des
modules qu’il est possible d’adjoindre au logiciel de base.
Exemple
> library(geoR) (télécharge la librairie de géostatistiques « geoR »)
> library(ade4) (télécharge la librairie d’analyse multivariée « ade4 »)
> library(FLCore) (télécharge la librairie FLR pour l’évaluation des stocks halieutiques)
Installer R
Il y a plusieurs moyens de se procurer le logiciel R.
1) Télécharger à partir du site officiel
http://www.r-project.org/
Il suffit alors de suivre les instructions. Un programme d’installation « setup » se charge d’installer R
sur l’ordinateur. Il est recommandé de s’aider des instructions du manuel d’installation (fichier .pdf)
que l’on trouve aussi sur le site officiel.
2) Copier le répertoire R d’une machine où il est installé
Il est possible d’installer R simplement en copiant le répertoire contenant le programme du logiciel R
(RGUI.exe, généralement stocké dans R/bin/RGUI.EXE) à partir d’un autre ordinateur.
Installer / Charger des librairies
Pour installer une librairie (ou package) supplémentaire
1) Le plus simple
Par l’intermédiaire de la fenêtre de commande Rgui de R

3à Menu « package » / « Installer une librairie » de la fenêtre de commande Rgui
Permet de la télécharger un nouveau package à partir du site CRAN et de l’installer sur votre machine
(il faut paramétrer le site miroir - choisir de préférence le site de France/Lyon).
2) Sinon
- Directement sur le site CRAN
Télécharger le module d’intérêt à l’adresse suivante :
http://cran.cict.fr/src/contrib/PACKAGES.html
Des manuels (fichier .pdf) d’utilisation de chaque package sont disponibles.
- A partir d’un fichier .zip déjà sur votre ordinateur
Il faut exécuter la commande
> install.packages()
(voir l’aide en ligne sur cette fonction)

Pour charger une librairie (déjà installée sur votre machine)
Pour que les fonctions d’un package soient disponibles dans le logiciel, il est nécessaire que ce
package soit « chargé ». Cela ne se fait pas automatiquement au démarrage de R, même si le
package est installé.
Pour charger une librairie, il faut exécuter la commande (en début de script)
> library(nom_lib)
Pour accéder à la liste des librairies déjà installée sur le système, taper la commande
> library()
Sites d’intérêt reliés à R
Site de R-project
http://www.r-project.org/
De nombreux manuels sont disponibles, ainsi que d’autres informations
Un site fournissant une myriade d’exemples de code …
http://zoonek2.free.fr/UNIX/48_R/all.html
Le site de l’Univ. Lyon 1, avec cours, TD …
http://pbil.univ-lyon1.fr/R/enseignement.html



4Environnement de travail
Assigner une variable
a <- 2
A <- 3
b <- ( (2*2) -4 + 2 )/2
Attention
Il vaut mieux éviter le signe "=" - taper ?"<-" pour plus de détails sur les assignements
R fait la différence entre minuscule et majuscules
Le meilleur réflexe : demander de l’aide !
Aide en ligne sur une fonction ou une commande
?sqrt # Retourne l'aide sur la fonction "racine carrée"
help(sqrt) # Equivalent
?"for" # Retourne l'aide sur la commande "for"
Rechercher des informations sur un thème
help.search("linear model") # Retourne une liste de ref. évoquant "linear model"
Obtenir le code de la fonction (sauf pour les fonctions primitives)
length # Indique que "length" est une fonction primitive
Gérer son environnement de travail
Sélectionner / voir un répertoire de travail
# Sélectionne un "Répertoire de travail" (Working directory)
setwd("D:/A_moi/Routines/R/InitiationR")
getwd() # Voir le répertoire courant
Attention
Toutes les actions de lecture et de sauvegarde de fichier seront faite par défaut dans ce répertoire
tant que aucune modification n'est spécifiée.
Notez que les chemins d'accès aux fichiers utilisent des "/" et pas des "\" comme dans Windows
Charger une librairie de R
library(stats) # Charge la librairie "statistique"

5Remarque
Il est aussi possible de charger une librairie à partir du menu principal « packages » de R. Une librairie
non encore installée ne pourra pas être charger. Pour installer une librairie, exécuter « Installer un
libraire » dans le menue « package » de R.
Quelques commandes utiles
ls # liste les variables de l'environnement de travail
remove(a) # supprime la variable a
rm(list = ls(a,b)) # supprime les variables a et b
rm(list = ls()) # supprime toutes les variables


¤
¤
¤
Types / Modes élémentaires
Le Type (ou mode) est la nature des variables concernées, qui peuvent être :
numeric (réel ou entier)
v <- 2 ; is(v)
character
t <- "que du blabla ce truc" ; is(t)
logique
tr <- TRUE ; is(tr) # Vrai
fs <- FALSE ; is(fs) # Faux
vm <- NA ; is(vm) # Valeur manquante
complex
c <- 2+3i ; is(c)
Exercice
# Que se passe t’il ?
v <- 2 ; t <- "que du blabla ce truc" ; u <- v+t
# Cette dernière commande retourne un message d'erreur car l"opérateur "+" n'est pas défini
pour le type "texte"


¤
¤
¤
Objets
R manipule des OBJETS (le type de l'objet x est obtenu par la commande « is(x) »). La notion
d'OBJET est fondamentale, et est finalement intuitive : à un type d'OBJET sont associés des fonctions
ou des opérations qu'il est possible d'effectuer avec.
vector
Ce sont les "objets de base" de R. Les variables de dimension 1 sont considérées comme des
vecteurs.
v <- 2 ; is(v)
t <- "texte" ; is(t)
v <- c(1,2,3) ; is(v)
matrix
m <- as.matrix(v) ; is(m) # convertit le vecteur v en matrice
data. frame
Une table de données, composée de colonnes DE MEME TAILLE. Mais les "types" des colonnes
peuvent être différents : par exemple on peut mélanger des "nombres" avec des "facteurs".
list
Une liste est un objet constitué de sous objet qui peuvent être de nature différente. Une liste peut
combiner des vecteurs, des matrices, des tables ... . Les sous-objets qui composent la liste sont
numérotés ou bien et/ou nommés.
l <- list(a=1, v = c(1,1)) ; is(l)
factor
Les facteurs sont des objets très particuliers propres aux analyses statistiques (dans une analyse de
variance par exemple). Il est important de déclarer une variable comme « facteur » pour ne pas que R
la considère comme numérique mais comme une variable qualitative.
l <- c(1,2,3)
f <- as.factor(f) ; is(f) # crée le facteur f à trois niveaux 1, 2, 3
function
Fonctions (préprogrammée ou programmée par l'utilisateur).
is(sqrt)
Exercice
# Que ce passe t’il ?
v <- c(2,1,3)

8length(v)
nrow(v)
# Cette dernière commande nrow(v) ("nombre de ligne") retourne du vide car elle s'applique à
un objet de type "matrice" et pas "vecteur".


¤
¤
¤
Manipulations et arithmétique sur les vecteurs et matrices
Opérations arithmétiques ELEMENT par ELEMENT
Toutes les fonctions arithmétiques classiques sur des nombres réels s'appliquent sur les vecteur et les
matrices ==> retournent l'opération effectuée TERME à TERME.
v <- c(1,2,3) ; w <- c(2,0,2)
v-1
v+w
v*w
v/w
v^2
sqrt(v)
exp(v)
log(w)
Exercice
# Fabriquer le vecteur v = (10,100,1000) et le vecteur w formé par la racine carrée de chaque
composante.
Vecteurs
Créer un vecteur
# Concaténer une séquence de scalaires
v <- c(3,2,1)

# Créer une séquence
v <- 1:10 # Créer une séquence de 1 à 10 (pas de 1 par défaut)
v <- 10:1 # Ordre décroissant
v <- seq(from=1, to=10, by=2) # Séq. de 1 à 10 avec un pas de 2 (ordre croissant)
v <- rep(c(1,2), times=10) # Répéter 10 fois un motif (par exemple le motif (1,2))
Concaténer deux vecteurs
w <- c(v,v)
Commandes et opérations arithmétiques SPECIFIQUES aux vecteurs
v <- c(4,2,7)
w <- c(2,2,2)

10

Soyez le premier à déposer un commentaire !

17/1000 caractères maximum.