Seleziona la tua lingua

La figura illustra i terremoti (sx) e le stazioni (dx) selezionate per il datset INSTANCE. La grandezza dei simboli è proporzionale alla magnitudo ed all’utilizzo (numero di letture di fasi P e S) di ogni stazione.

Michelini A., Lauciani V., Giunchi C., Jozinovic D., Gaviano S.

 

È stata avviata la compilazione di un dataset di forme d’onda dei terremoti italiani e dei metadati associati con la finalità di facilitare la realizzazione di algoritmi di analisi basati sull’intelligenza artificiale. INSTANCE (“the ItaliaN Seismic daTAset for artificial intelligeNCE”) si pone come obiettivo la costituzione di un prodotto di riferimento derivante delle reti di monitoraggio sismico INGV in ambito machine learning e deep learning, Per realizzare il dataset sono stati selezionati quasi 57.000 terremoti (magnitudo 0 - 6,5), relativi al periodo 2005-2019, da un totale di ~315.000 eventi. A questi terremoti sono associate circa 1,5 milioni di forme d’onda. Inoltre fanno parte del dataset 20.000 tracce a tre componenti corrispondenti solamente a rumore, che sono utili per calibrare le soglie di detezione degli eventi e in generale per rendere più efficace il riconoscimento delle fasi sismiche . Ogni forma d’onda presente nel data set ha una lunghezza temporale di 120 s. Le tracce sono estratte principalmente dall’archivio EIDA di INGV. I metadati di ogni traccia del dataset, usualmente utilizzati come “labels” nelle analisi di “machine learning”, contengono informazioni estratte dal bollettino sismico dell’INGV (http://terremoti.ingv.it/en/bsi) mediante il webservice FDSN “event”. Sono stati inseriti 40 campi per traccia che forniscono sia informazioni relative alla stazione dalla quale provengono i dati (es., tempo di arrivo, qualità, polarità, …) che le informazioni di sorgente (localizzazione, magnitudo, meccanismo e moment tensor se disponibili). Tutti i metadati sono stati raccolti in un file tabellare csv. Ciò li rende facilmente fruibili per svolgere (anche indipendentemente dalle forme d’onda) analisi su qualità delle stazioni, statistiche per evidenziare quali stazioni contribuiscono maggiormente alle localizzazioni del catalogo INGV, o sulle dromocrone per differenti zone e tragitti. Per quanto riguarda le forme d’onda che, al momento sono tutte presenti come ‘raw data’, essi saranno convertite in formato hdf5 per facilitare l’I/O. Contestualmente, si sta identificando la maniera ottimale per rendere disponibile anche una versione delle forme d’onda (con gli associati metadati) in unità fisiche, tramite l’applicazione della funzione di trasferimento del sensore, per consentire analisi dello scuotimento effettivamente verificatosi.