Biologia | STATISTICA APPLICATA
Biologia STATISTICA APPLICATA
cod. 0522100042
STATISTICA APPLICATA
0522100042 | |
DIPARTIMENTO DI CHIMICA E BIOLOGIA "ADOLFO ZAMBELLI" | |
CORSO DI LAUREA MAGISTRALE | |
BIOLOGIA | |
2022/2023 |
OBBLIGATORIO | |
ANNO CORSO 1 | |
ANNO ORDINAMENTO 2022 | |
PRIMO SEMESTRE |
SSD | CFU | ORE | ATTIVITÀ | |
---|---|---|---|---|
SECS-S/02 | 3 | 24 | LEZIONE | |
SECS-S/02 | 3 | 36 | LABORATORIO |
Appello | Data | Sessione | |
---|---|---|---|
STATISTICA APPLICATA | 28/06/2023 - 09:00 | SESSIONE ORDINARIA |
Obiettivi | |
---|---|
L’obiettivo del corso consiste nel fornire alle studentesse e agli studenti i) le basi del ragionamento statistico, ii) gli strumenti per organizzare dati sperimentali, produrre grafici descrittivi ed esplorativi, iii) la capacità di utilizzare modelli statistici per l’analisi di dati sperimentali, iv) le competenze per comunicare e discutere i risultati di un’analisi dati biologici, v) le competenze per applicare tali concetti in modo autonomo tramite l’analisi di dati reali da eseguire durante le attività di laboratorio. Nell’insieme il corso mira ad approfondire sia aspetti metodologici che applicativi mediante l’utilizzo del software statistico R. |
Prerequisiti | |
---|---|
Elementi di algebra lineare quali matrici, vettori e relative operazioni come il calcolo degli autovalori ed autovettori di una matrice quali possono essere acquisiti a livello di insegnamento di matematica generale in una laurea scientifica triennale. Capacità di utilizzare il computer per svolgere esercitazioni pratiche |
Contenuti | |
---|---|
Lezioni teoriche (24 ore) -Dalla probabilità alla statistica: Probabilità, stimatori misure di correlazione, misure di associazione ed elementi di statistica descrittiva (6 ore). -Regressione lineare semplice e multipla (4 ore). -Misure di distanza, similarità e dissimilarità e trasformazioni di variabili casuali (2 ore). -Algoritmi per il Clustering gerarchico e il Clustering partizionale (4 ore). -Analisi delle componenti principali (PCA) (4 ore). -Multidimensional scaling metrico o non metrico oppure modelli di regressione generalizzata a seconda dell’interesse (4 ore). Attività di laboratorio (36 ore) -Introduzione all’ambiente di programmazione R (2 ore). -Dati e strutture dati, lettura e scrittura di file, utilizzo di funzioni grafiche, strutture di controllo in R (6 ore). -Funzioni e grafici della statistica descrittiva in R (2 ore). -Regressione lineare semplice e regressione lineare multipla (6 ore). -Funzioni di distanza, similarità e dissimilarità in R (3 ore). -Clustering gerarchico e clustering partizionale (6 ore). -Analisi delle componenti principali (6 ore). -Multidimensional scaling o modelli di regressione generalizzata (3 ore). -Come creare report professionali mediante R e Rmarkdown (2 h). |
Metodi Didattici | |
---|---|
L’insegnamento prevede 60 ore di didattica tra lezioni teoriche ed esercitazioni in aula con il computer. Durante le esercitazioni si propone agli studenti l’analisi di dati disponibili in letteratura. Il metodo di risoluzione consiste nella formulazione del problema statistico, nella pianificazione delle fasi per l’analisi, e infine nell’analisi e discussione dei risultati. Quest’ultima fase promuove l’abilità a valutare la ragionevolezza risultati ottenuti e a verificare la coerenza con le metodologie utilizzate |
Verifica dell'apprendimento | |
---|---|
Il raggiungimento degli obiettivi previsti sarà verificato mediante 1)Prova scritta che consiste nella redazione di un elaborato (progetto) svolto con il supporto del software statistico R contenente l’analisi di uno o più datasets mediante i metodi presenti nel programma di insegnamento (regressione, clustering, PCA, MDS o altro) tale da aderire ai dettami della ricerca computazionale riproducibile. 2)Prova orale che consiste nella discussione dell’elaborato in una presentazione di 5 minuti e nella risposta a almeno 3 domande sui contenuti teorici e metodologici indicati nel programma. La prova orale è atta verificare la capacità di esposizione ricorrendo all’utilizzo della terminologia scientifica appropriata e la capacità di organizzazione autonoma dell’esposizione sugli stessi argomenti Il voto finale è espresso in trentesimi, di cui massimo 10 punti per la prova scritta (progetto), massimo 5 punti per la presentazione orale dell’elaborato e massimo 5 punti per ciascuna delle 3 domande. |
Testi | |
---|---|
Materiale didattico fornito dal docente, ed almeno uno dei seguenti testi (limitatamente ai capitoli relativi al programma di insegnamento) -BRIAN EVERITT AND TORSTEN HOTHORN. AN INTRODUCTION TO APPLIED MULTIVARIATE ANALYSIS WITH R, SPRINGER 2011 -ZELTERMAN, D. APPLIED MULTIVARIATE STATISTICS WITH R. SPRINGER (2015) -HÄRDLE, W.K. AND SIMAR, L., APPLIED MULTIVARIATE STATISTICAL ANALYSIS, FOURTH EDITION. SPRINGER (2015) -PETER DALGAARD. INTRODUCTORY STATISTICS WITH R, 2ND EDITION. SPRINGER 2008 -ALAIN F. ZUUR, ELENA N. IENO, ERIK H.W.G. MEESTERS. A BEGINNER’S GUIDE TO R. SPRINGER 2009 |
BETA VERSION Fonte dati ESSE3 [Ultima Sincronizzazione: 2023-06-01]