Salta al contenuto

R, la statistica e la climatologia

Un sito che tratti di meteorologia e, soprattutto, di climatologia prima o poi si scontra con i numeri: questo è un dato di fatto, siano questi una serie storica relativa a qualche parametro o frutto di qualche calcolo. Questi numeri possono essere mutuati da altri siti, che magari hanno già svolto il grosso del “lavoro” a livello di computazione e rappresentazione, oppure scaricati come “raw data” ed elaborati in prima persona.

Nei limiti del tempo disponibile (sempre poco qui su Climate Monitor, come nel resto del mondo), abbiamo deciso fin dal primo momento di utilizzare fonti primarie ed elaborare noi stessi i numeri che ci servivano.

Ora, vorremmo spingere il limite un po’ più in là, ovvero ci siamo organizzati in modo tale da poter “standardizzare” il nostro workflow per poi condividerlo con voi, nei risultati (e già lo si faceva prima) ma soprattutto nei dati e nelle elaborazioni. L’obiettivo? Sicuramente questa strategia aumenterà l’interazione nella community di Climate Monitor e questo, a conti fatti, non potrà portare che ad un ulteriore arricchimento di tutti noi.

Come ottenere questo obiettivo? Partiamo dall’inizio. In ambito scientifico internazionale, il miglior software per applicazioni statistico-matematiche è “R”. Se già lo utilizzate, potete saltare questo paragrafo, in quanto daremo una breve descrizione del pacchetto per chi, invece, non lo conosce ma magari è interessato ad approfondire l’argomento e, perchè no, ad installarlo sul proprio pc e cominciare a “giocare” con i numeri. Wikipedia ci aiuta a scrivere la storia di questo software: R è un ambiente di sviluppo specifico per l’analisi statistica dei dati che utilizza un linguaggio di programmazione derivato e in larga parte compatibile con S. Venne scritto inizialmente da Robert Gentleman e Ross Ihaka. È un software libero in quanto viene distribuito con la licenza GNU GPL, ed è disponibile per diversi sistemi operativi (ad esempio Unix, GNU/Linux, Mac OS X, Microsoft Windows). Il suo linguaggio orientato agli oggetti (Object oriented Language, OOL) deriva direttamente dal pacchetto S distribuito con una licenza non open source e sviluppato da John Chambers e altri presso i Bell Laboratories.

Molto bene! Si tratta di software libero, quindi ognuno di noi può scaricarlo sul proprio pc senza spendere un euro (teniamo conto che altri applicativi matematici, forse più belli da vedere, ma di certo non più potenti costano dai 1000€ in su).

Visitiamo il sito ufficiale di R: The R Project for Statistical Computing

L’implementazione e la condivisione dei dati su CM è, per ora, in via sperimentale ciò significa che nel corso del tempo potremmo correggere la rotta.

Iniziamo!

Gli utenti Windows possono scaricare l’ultima release da qui, gli utenti Linux da qui e infine gli utenti Mac da qui.

R si presenta sotto forma di interfacci testuale, una volta terminata l’installazione e lanciato il programma, ecco come appare ai nostri occhi:

Shell R

Una delle caratteristiche più apprezzabili di R è quella di poter installare pacchetti aggiuntivi che ne potenziano ed estendono le funzioni. Per i nostri scopi, noi abbiamo installato la seguente libreria:

tseries: è una libreria programmata per eseguire analisi su serie storiche, possiamo installarla con il semplice comando:

install.packages("tseries")

Finito (vi aspettavate che fosse più complesso?). Ora siamo pronti per analizzare le future serie di dati che pubblicheremo sul sito. Avete consigli o richieste? Siamo a vostra disposizione.

Reblog this post [with Zemanta]
Related Posts Plugin for WordPress, Blogger...Facebooktwitterlinkedinmail
Published inAmbienteAttualitàClimatologiaR

5 Comments

  1. Duepassi

    Splendido, ho cosa studiare.
    A dir la verità, ero già pieno per una quarantina di vite, e questo mi amareggia un po’ (non essere sicuro di avere davanti a me una quarantina di vite 🙂 ) ma cercherò di fare un po’ di posto anche per questa R, senza la quale non potrei nemmeno scrivere il mio cognome.
    Scherzi a parte, grazie per questa iniziativa.
    Chiedo clemenza però per i tempi di apprendimento.
    Guido Botteri

  2. admin

    Buonasera Rodolfo, grazie per l’indicazione!

  3. Per installare R in ubuntu è sufficiente digitare:
    sudo apt-get install r-base

    voilà

    ciao e grazie per questa guida, sarà molto interessante questo “corso”

    Rodolfo

  4. Grazie Lucas, è importante avere il vostro riscontro, soprattutto per capire se procedere lungo questa strada o abbandonarla per mancanza di interesse. Per noi è sicuramente un esperimento molto, molto interessante. Speriamo lo sia anche per voi!

    A breve rilasceremo i primi codici per eseguire una semplice ma basilare operazione: costruire a casa propria le anomalie termiche in base alle 4 metriche più in voga: RSS, UAH, GISS e HadCRUT. Più in là, invece, faremo una “irruzione” nel mondo dell’attività solare. Insomma, ce n’è per tutti i gusti!

    C.Gravina

  5. Lucas

    Bellissima iniziativa! Rendere partecipe tutta la comunity di queste analisi non potrà che arricchire le conoscenze di ciascuno di noi! Nell’ultimo periodo ho avuto modo di apprendere e utilizzare un linguaggio di programmazione, il “python”, per mettere su programmini per l’analisi di strutture genomiche, e devo dire che è stato molto interessante e “divertente”. Quindi sicuramente sarà la stessa cosa anche con l’analisi di dati climatici!
    Aspettiamo vostre notizie!

    Lucas

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Categorie

Termini di utilizzo

Licenza Creative Commons
Climatemonitor di Guido Guidi è distribuito con Licenza Creative Commons Attribuzione - Non commerciale 4.0 Internazionale.
Permessi ulteriori rispetto alle finalità della presente licenza possono essere disponibili presso info@climatemonitor.it.
scrivi a info@climatemonitor.it
Translate »