ANALISI DATI

Scienze Ambientali ANALISI DATI

0512700005
DIPARTIMENTO DI CHIMICA E BIOLOGIA "ADOLFO ZAMBELLI"
CORSO DI LAUREA
SCIENZE AMBIENTALI
2022/2023

OBBLIGATORIO
ANNO CORSO 2
ANNO ORDINAMENTO 2016
PRIMO SEMESTRE
CFUOREATTIVITÀ
432LEZIONE
224ESERCITAZIONE
Obiettivi
L'INSEGNAMENTO SI PROPONE DI APPROFONDIRE LE BASI DEL RAGIONAMENTO STATISTICO, MOSTRARE COME ORGANIZZARE I DATI, PRODURRE GRAFICI DESCRITTIVI ED ESPLORATIVI, AIUTARE A COMPRENDERE L’UTILIZZO DI MODELLI STATISTICI PER L’ANALISI DEI DATI, SPIEGARE COME COMUNICARE E DISCUTERE I RISULTATI DI UN’ANALISI DATI AMBIENTALI. NELL’INSIEME, L'INSEGNAMENTO MIRA AD APPROFONDIRE SIA ASPETTI METODOLOGICI SIA ASPETTI APPLICATIVI E PRATICI MEDIANTE L’UTILIZZO DEL LINGUAGGIO STATISTICO R. PERTANTO I RISULTATI ATTESI SONO: I) CONOSCENZA E COMPRENSIONE DEI CONCETTI CHIAVE DELLA STATISTICA APPLICATA ALL’ANALISI DEI DATI AMBIENTALI E DELL’USO DEL SOFTWARE R NELL’ANALISI DI DATI, II) CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE ESPRESSA ATTRAVERSO LE ATTIVITÀ DI LABORATORIO IN CUI SI RICHIEDE L’APPLICAZIONE DEI CONCETTI STATISTICI METODOLOGICI ALL’ANALISI DI DATI AMBIENTALI. III) AUTONOMIA DI GIUDIZIO ESPRESSA ATTRAVERSO LA SCELTA DEI METODI STATISTICI DI ANALISI DEI DATI E LA CAPACITÀ CRITICA, IL RIGORE METODOLOGICO, E LA CONOSCENZA DELLE IPOTESI SOTTOSTANTI I METODI UTILIZZATI. IV) ABILITÀ COMUNICATIVE DI PRESENTARE LE COMPETENZE ACQUISITE CON LESSICO PROPRIO ED ATTRAVERSO LA STESURA DI RAPPORTI PROFESSIONALI CHE DESCRIVANO I RISULTATI OTTENUTI DURANTE L’ANALISI DI CASI STUDIO.
Prerequisiti
GLI ARGOMENTI TRATTATI NEL CORSO RICHIEDONO DI AVERE LA CAPACITÀ DI UTILIZZARE GLI STRUMENTI DELL’ALGEBRA LINEARE QUALI MATRICI, VETTORI, E RELATIVE OPERAZIONI, IL CALCOLO DEGLI AUTOVALORI E DEGI AUTOVETTORI. E’ UTILE PER LO STUDENTE CHE VOGLIA SEGUIRE IL CORSO CON PROFITTO SAPER UTILIZZARE IL FORMALISMO MATEMATICO A LIVELLO DI UN CORSO UNIVERSITARIO DI MATEMATICA GENERALE. INOLTRE, IL CORSO RICHIEDE DI AVERE LA CAPACITÀ UTILIZZARE IL COMPUTER PER SVOLGERE LE ESERCITAZIONI PRATICHE. NON È RICHIESTA UNA CONOSCENZA PREGRESSA DEL LINGUAGGIO DI PROGRAMMAZIONE R.GLI ARGOMENTI TRATTATI NEL CORSO RICHIEDONO DI AVERE LA CAPACITÀ DI UTILIZZARE GLI STRUMENTI DELL’ALGEBRA LINEARE QUALI MATRICI, VETTORI, E RELATIVE OPERAZIONI, IL CALCOLO DEGLI AUTOVALORI E DEGI AUTOVETTORI. E’ UTILE PER LO STUDENTE CHE VOGLIA SEGUIRE IL CORSO CON PROFITTO SAPER UTILIZZARE IL FORMALISMO MATEMATICO A LIVELLO DI UN CORSO UNIVERSITARIO DI MATEMATICA GENERALE. INOLTRE, IL CORSO RICHIEDE DI AVERE LA CAPACITÀ UTILIZZARE IL COMPUTER PER SVOLGERE LE ESERCITAZIONI PRATICHE. NON È RICHIESTA UNA CONOSCENZA PREGRESSA DEL LINGUAGGIO DI PROGRAMMAZIONE R.
Contenuti
L’INSEGNAMENTO È DIVISO IN ASPETTI TEORICO-METODOLOGICI (32 ORE DI DIDATTICA FRONTALE) ED ASPETTI TECNICO-APPLICATIVI (24 ORE DI DIDATTICA IN LABORATORIO) PER UN TOTALE DI 56 ORE E 6CFU.

GLI ASPETTI TEORICO-METODOLOGICI AFFRONTATI SONO:
-LA STATISTICA NELLA RICERCA AMBIENTALE
-IL DISEGNO SPERIMENTALE ED IL CAMPIONAMENTO
-TIPI DI DATI E SCALE DI MISURAZIONE.
-CLASSIFICAZIONE IN TABELLA.
-RAPPRESENTAZIONI GRAFICHE DI DISTRIBUZIONI UNIVARIATE.
-LE MISURE DI TENDENZA CENTRALE: MEDIA, MODA E MEDIANA.
-MISURE DI DISPERSIONE E VARIABILITÀ
-INDICI DI FORMA: SIMMETRIA E CUTOSI.
-DISTRIBUZIONI E LEGGI DI PROBABILITÀ
-ELEMENTI DI CALCOLO COMBINATORIO SEMPLICE
PERMUTAZIONI, DISPOSIZIONI E COMBINAZIONI SEMPLICI.
-DEFINIZIONE DI PROBABILITÀ.
-LE DISTRIBUZIONI DISCRETE: BINOMIALE, MULTINOMIALE, POISSONIANA, GEOMETRICA.
-LE DISTRIBUZIONI CONTINUE: UNIFORME, NORMALE O DI GAUSS, GAMMA, ESPONENZIALE,
-DISTRIBUZIONI CAMPIONARIE DERIVANTI DALLA NORMALE E UTILI PER L’INFERENZA: CHI-QUADRATO, T DI STUDENT, F DI FISCHER
-CONFRONTO TRA DISTRIBUZIONI OSSERVATE E ATTESE
-VERIFICA DELLE IPOTESI
-INFERENZA SU UNA O DUE MEDIE CON IL TEST T DI STUDENT
-TEST NON PARAMETRICI
-ANOVA
-REGRESSIONE LINEARE SEMPLICE.
-REGRESSIONE LINEARE MULTIPLA.
-APPROFONDIMENTI SULLA REGRESSIONE LINEARE: VALUTAZIONE DI UN MODELLO DI REGRESSIONE.
-MISURE DI DISTANZA, SIMILARITÀ E DISSIMILARITÀ: PROPRIETÀ MATEMATICHE ED ESEMPI.
-TRASFORMAZIONI DI VARIABILI CASUALI.
-INTRODUZIONE AL CLUSTERING,
-CLUSTERING GERARCHICO: IDEE, PRINCIPI ALLA BASE ED ALGORITMI
-CLUSTERING PARTIZIONALE: IDEE, PRINCIPI ALLA BASE ED ALGORITMI


GLI ASPETTI TECNICO-PRATICI AFFRONTATI SONO:
(ESERCITAZIONI SVOLTE MEDIANTE L’UTILIZZO DEL SOFTWARE STATISTICO R)
- INTRODUZIONE ALL’AMBIENTE DI PROGRAMMAZIONE R.
- R E I PACCHETTI DI R, ISTALLAZIONE E GESTIONE DEL SOFTWARE ATTRAVERSO LINEA DI COMANDO.
- R STUDIO.
-DATI E STRUTTURE DATI IN R
-LETTURA E SCRITTURA FILE IN R
-UTILIZZO DI FUNZIONI GRAFICHE IN R
-STRUTTURE DI CONTROLLO IN R
-FUNZIONI E GRAFICI DELLA STATISTICA DESCRITTIVA IN R
-DISTRIBUZIONI DI PRABABIOLITA' IN R
-REGRESSIONE LINEARE SEMPLICE IN R
-REGRESSIONE LINEARE MULTIPLA IN R
Metodi Didattici
L’INSEGNAMENTO PREVEDE 56 ORE DI DIDATTICA TRA LEZIONI ED ESERCITAZIONI PRATICHE (6 CFU). IN PARTICOLARE SONO PREVISTE 32 ORE DI DIDATTICA FRONTALE SUGLI ASPETTI TEORICO-METODOLOGICI E 24 ORE DI ESERCITAZIONI IN AULA CON IL COMPUTER PER GLI ASPETTI TECNICO-APPLICATIVI.
IL CORSO È ORGANIZZATO NEL SEGUENTE MODO: LEZIONI IN AULA SU TUTTI GLI ARGOMENTI DEL CORSO (16 LEZIONI DI 2 ORE CIASCUNA), ESERCITAZIONI PRATICHE CON IL COMPUTER SU TUTTI GLI ARGOMENTI DEL CORSO (8 LEZIONI DI 3 ORE CIASCUNA). LE ESERCITAZIONI TECNICO-PRATICHE SEGUIRANNO LE LEZIONI TEORICHE SULLO STESSO ARGOMENTO.
PER LE ESERCITAZONI PRATICHE GLI STUDENTI UTILIZZARANNO IL PROPRIO COMPUTER E DOVRANNO ISTALLARE IL SOFTWARE STATISTICO R (CHE È OPEN-SOURCE).
PER LE ESERCITAZIONI PRATICHE GLI STUDENTI POTRANNO LAVORARE SIA IN MODO INDIVIDUALE CHE DIVISI IN COPPIE.
PER CIASCUNA PARTE DEL CORSO VERRÀ FORNITO MATERIALE DIDATTICO SPECIFICO CONSISTENTE IN SLIDES DEL CORSO, ESEMPI DI DATASET E ESERCIZI TIPICI SVOLTI MEDIANTE L’UTILIZZO DEL SOFTWARE STATISTICO R.
IL MATERIALE VERRÀ FORNITO ALL'INIZIO DEL CORSO. GLI STUDENTI SONO INVITATI A LEGGERE IL MATERIALE FORNITO PRIMA DELLA LEZIONE CORRISPONDENTE AL FINE DI RENDERE PIÙ INTERATTIVA E PROFICUA LA LEZIONE STESSA.
LA FREQUENZA DELLE LEZIONI DI TEORIA NON È OBBLIGATORIA, QUELLA DELLE ESERCITAZIONI PRATICHE CON IL SOFTWARE R È FORTEMENTE CONSIGLIATA.
Verifica dell'apprendimento
IL RAGGIUNGIMENTO DEGLI OBIETTIVI DELL’INSEGNAMENTO È CERTIFICATA MEDIANTE IL SUPERAMENTO DI UN ESAME CON VALUTAZIONE IN TRENTESIMI E SI INTENDE SUPERATA CON IL VOTO MINIMO DI 18/30.
L’ESAME PREVEDE UNA PROVA SCRITTA ED UNA PROVA PRATICA.
IL VOTO FINALE DIPENDE DAI PUNTEGGI RIPORTATI NELLE SINGLE PROVE.
LA PROVA SCRITTA CONSISTE IN 3 DOMANDE SUI CONTENUTI TEORICI E METODOLOGICI INDICATE NEL PROGRAMMA DELL’INSEGNAMENTO (5 PUNTI A DOMANDA).
LA PROVA PRATICA CONSISTE IN UNA SERIE DI ESERCIZI DA SVOLGERE CON IL SUPPORTO DEL SOFTWARE STATISTICO R MEDIANTE I METODI PRESENTI NEL PROGRAMMA DI INSEGNAMENTO (PER UN TOTALE DI 15 PUNTI).
IL VOTO MINIMO(18/30) SARA' ATTRIBUITO AGLI STUDENTI CHE DIMOSTRANO UNA LIMITATA CONOSCENZA DEI PRINCIPI CHIAVE DELLA STATISTICA DESCRITTIVA/INFERENZIALE E/O UNA CONOSCENZA LIMITATA DEL LINGUAGGIO DI PROGRAMMAZIONE DEL SOFTWARE R.
IL VOTO MASSIMO (30/30) SARA' ATTRIBUITO AGLI STUDENTI CHE DIMOSTRANO UN'OTTIMA CONOSCENZA SIA DEI PRINCIPI TEORICI CHE PRATICI DELLA STATISTICA E CHE SANNO MANEGGIARE CON CONFIDENZA IL SOFTWARE R.
LA LODE POTRÀ ESSERE ATTRIBUITA AGLI STUDENTI CHE RAGGIUNGONO IL VOTO MASSIMO DI 30/30 E CHE DIMOSTRINO DI SAPER DISPORRE DELLE CONOSCENZE ACQUISITE IN MODO AUTONOMO E CRITICO.
Testi
1)WALTER W. PIEGORSCH, A. JOHN BAILER “ANALYZING ENVIRONMENTAL DATA” – WILEY (2005)
2)RICHARD G. BRERETON “CHEMOMETRICS – DATA ANALYSIS FOR THE LABORATORY AND CHEMICAL PLANT” – WILEY (2003)
3)PETER DALGAARD - "INTRODUCTORY STATISTICS WITH R" - SPRINGER
4)APPUNTI DEL CORSO
Altre Informazioni
TUTTE LE LEZIONI ED ESERCITAZIONI SARANNO TENUTE FORNENDO ESEMPI E CASI STUDIO DI INTERESSE.
LINGUA DI EROGAZIONE DELL'INSEGNAMENTO: ITALIANO
  BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2022-09-16]