| Insegnamento | Linguistica Computazionale e Elaborazione del parlato |
| CFU | 9 |
| Settore Scientifico Disciplinare | L-LIN/01 ING-INF/05 |
| Metodologia didattica | Lezioni Frontali |
| Nr. ore di aula | 54 |
| Nr. ore di studio autonomo | 171 |
| Mutuazione | no |
| Annualità | II |
| Periodo di svolgimento | II semestre |
| Docente | Ruolo | SSD docente |
|---|---|---|
| Sabato Marco Siniscalchi | PO | ING-INF/05 |
| Sandra Villata | RTD-B | L-LIN/01 |
| Propedeuticità | Machine Learning |
| Sede delle lezioni | Dipartimento di Ingegneria e Architettura |
| N | Nome del modulo | Docente | Durata in ore |
|---|---|---|---|
| 1 | Elaborazione del Parlato | Marco Sabato Siniscalchi | 36 |
| 2 | Linguistica Computazionale | Sandra Villata | 18 |
| Orario delle lezioni |
|---|
|
L’orario delle lezioni sarà pubblicato sulla pagina web del sito Unikore: https://gestioneaule.unikore.it/agendaweb_unikore/index.php?view=easycourse&_lang=it |
| Obiettivi formativi |
|---|
|
L’insegnamento ha lo scopo di fornire una solida introduzione alla linguistica computazionale e alla elaborazione del parlato, due branche fondamentali dell’intelligenza artificiale. Lo scopo di questo corso è quello di fornire una descrizione teorica valida e tecnicamente accurata dei moderni sistemi di elaborazione del parlato con tecniche statistiche e di machine learning. Nel modulo di linguistica computazionale, il corso tratterà le espressioni regolari e i concetti base di morfologia. Verranno anche introdotti elementi della teoria acustico-fonetiche – unità di base dei suoni del parlato sono caratterizzate in relazione alle loro proprietà linguistiche e misure acustiche. Si studierà il processo di produzione del parlato, la rappresentazione del parlato nei domini del tempo e della frequenza, i principali suoni e le principali caratteristiche (feature) del parlato (vocali, consonati) e i sistemi di trascrizione fonetica. Infine, accenni sui modelli probabilistici per la pronuncia e modelli n-gram. L’obiettivo del corso è fornire agli studenti solide basi teoriche che consentano loro di selezionare, applicare e valutare diversi metodi per applicazioni dell’elaborazione del parlato nel mondo reale, ad esempio nel campo medico o della sicurezza informatica. Gli studenti acquisiranno anche le competenze richieste per ideare nuovi approcci basati sui framework che verranno presentati durante le lezioni. Il corso prevede esercitazioni che consentiranno agli studenti di esercitare le nozioni teoriche sui dati reali utilizzando moderni framework di programmazione ampiamente utilizzati sia dalle comunità di ricerca che dalle aziende. |
| Contenuti del Programma | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
| Risultati di apprendimento (descrittori di Dublino) |
|---|
|
Alla fine del corso, gli studenti dovranno aver conseguito le seguenti abilità, conoscenze e competenze: Conoscenza e capacità di comprensione: L’insegnamento si propone di completare la formazione di base necessaria per la progettazione sistematica e strutturata di un sistema di machine learning. Lo studente saprà comprendere le motivazioni teoriche alla base dei diversi approcci di classificazione, regressione e clustering le loro principali proprietà e dominio di applicazione ei loro limiti. Conoscenza e capacità di comprensione applicate: Lo studente alla fine del corso acquisirà una buona conoscenza dei principali principi di base dell’apprendimento automatico statistico applicato al riconoscimento e alla classificazione di pattern. Acquisirà inoltre le conoscenze delle principali tecniche di classificazione, inclusi i modelli gaussiani lineari generativi e gli approcci discriminativi basati sulla regressione logistica, le support vector machine e le reti neurali artificiali. Inoltre saprà distinguere tra modelli parametrici e non parametrici. Sarà in grado di implementare i diversi algoritmi utilizzando framework di programmazione diffusi (Python) e saprà applicare metodi diversi a compiti reali, valutarne criticamente l’efficacia e analizzare quali strategie sono più adatte alle diverse applicazioni. Infine saprà trasferire le conoscenze e le capacità acquisite per risolvere nuovi problemi di classificazione e regressione, sviluppando nuovi metodi basati sui framework che verranno discussi durante l’insegnamento. Autonomia di giudizio: Lo studente sarà in grado di valutarne la qualità di una soluzione in termini di semplicità, leggibilità, efficienza e possibilità di riutilizzo. L’autonomia di giudizio sarà valutata esaminando le soluzioni proposte dagli studenti a problemi di media complessità. Capacità di apprendere: Lo studente acquisirà la capacità per apprendere i processi di analisi dei requisiti di una proposta progettuale. Inoltre avrà gli strumenti per approfondire autonomamente le conoscenze di base impartite durante il corso. |
| Testi per lo studio della disciplina |
|---|
|
Testo principale: X. Huang, A. Acero, and H.-W. Hon, Spoken Language Processing – A guide to Theory, Algorithm, and System Development. Prentice Hall PTR, Upper Saddle River, NJ, United States Materiale didattico a disposizione degli studenti: Testi di riferimento: Testi di approfondimento: |
| Metodi e strumenti per la didattica |
|---|
|
I metodi didattici prevedono lezioni frontali. Tutti gli strumenti utili al corso verranno forniti in aula e messi a disposizione dello studente. La frequenza dell’insegnamento è fortemente consigliata ma non obbligatoria. |
| Modalità di accertamento delle competenze | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
L’esame consisterà in una prova scritta che verte sui contenuti dell’insegnamento. La prova si compone di domande a risposta chiusa, domande che richiedono sintetiche riposte aperte sui contenuti trattati durante l’insegnamento, le letture assegnate, ed i testi di riferimento, ed esercizi che richiedono di applicare le conoscenze acquisite durante l’insegnamento. I punti associati ad ogni domanda saranno chiaramente indicati nella prova d’esame accanto ad ogni domanda. La somma dei punti delle domande dei due moduli (linguistica computazionale ed elaborazione del parlato) sarà uguale a 32 per ogni modulo, per un totale di 64 punti. Il voto finale sarà calcolato attraverso una media ponderata tra i due moduli che rifletterà i diversi CFU di ognuno. L’esame si considera superato con una votazione minima di 18. La tabella di conversione dei punti in 30esimi è la seguente:
|
| Date di esame |
|---|
|
Le date di esami saranno pubblicate nell’agenda web del sito Unikore: https://gestioneaule.unikore.it/agendaweb_unikore/index.php?view=easytest&_lang=it |
| Modalità e orario di ricevimento |
|---|
|
Il ricevimento è in presenza. Il ricevimento avverrà dopo la fine dell’orario delle lezioni. Si prega di contattare il docente con sufficiente anticipo per fissare il ricevimento. |
Università degli Studi di Enna “Kore” – Cittadella Universitaria – 94100 Enna (EN)
C.F.: 01094410865- PARTITA IVA COMUNITARIA: IT01094410865 – P.E.C.: protocollo@pec.unikore.it
Fatturazione elettronica – Codice Destinatario: KRRH6B9