Stream computing in LARKC
Ricerca UE FP7
-
Data inizio: 01/04/2008
Durata: 24 mesi
Sommario
LarKC è un progetto del Settimo Programma Quadro della Comunità Europea con lo scopo di trattare la massa di informazioni eterogenee, come i dati dei social media. Il ruolo del Politecnico e del Cefriel, che formano un’unità di ricerca comune all’interno di LarKC, è rivolto allo Stream Computing, ovvero ai compiti di interrogazione e ragionamento su Streams RDF. Le sorgenti dei dati stream-based come i sensori, i feeds, i click di flusso e le quotazioni dei titoli sono diventate sempre più importanti in molti campi di applicazione. I flussi di dati sono ricevuti in continuazione e in real-time, sia implicitamente ordinati dal tempo di arrivo, che associati in modo esplicito attraverso l’uso di timestamp. Dato che è generalmente impossibile immagazzinare interamente un flusso di dati, i Data Stream Management System (DSM) permettono di registrare in continuazione le interrogazioni che restituiscono nuovi risultati non appena circolano nuovi dati nei flussi. Allo stesso tempo, il ragionamento su grandi raccolte di dati RDF sta avanzando velocemente, e SPARQL ha guadagnato il ruolo del linguaggio di interrogazione standard per i dati RDF. Inoltre, i motori SPARQL sono ora in grado di interrogare repository integrate e raccolte di dati provenienti da fonti multiple. Eppure, le grandi conoscenze di base ora accessibili tramite SPARQL sono statiche, e l’evoluzione della conoscenza non è adeguatamente supportata. Vi è una forte necessità per la convergenza dei motori SPARQL e della gestione dei flussi di dati.
Risultati del progetto ed eventuali pubblicazioni scientifiche/brevetti
La combinazione di dati statici RDF con informazioni riguardanti il flusso porta alla considerazione dei flussi, un passo importante che permette un ragionamento logico in tempo reale su enormi e rumorosi flussi di dati al fine di supportare il processo decisionale per un numero estremamente elevato di utenti simultanei. Finora, questo passaggio ha ricevuto scarsa attenzione da parte della comunità del Web Semantico.
C-SPARQL, che abbiamo introdotto nel 2008, è un'estensione di SPARQL progettato per esprimere interrogazioni continue, cioè, le query registrate su entrambi i repository RDF e stream RDF. Le query di C-SPARQL possono essere considerate come input per sistemi specializzati (o ‘reasoners’) che valutano, attraverso la loro conoscenza su di un dominio, le decisioni da prendere in tempo reale. In tali applicazioni, i questi sistemi operano su immagini istantanee di conoscenza, che sono continuamente aggiornate da query registrate. E' importante notare che, in questa prospettiva, essi possono ignorare i cambiamenti del tempo e l'esistenza dei flussi. Abbiamo anche esplorato l'uso di un reasoner che è a conoscenza della natura tempo-dipendente dei dati nel 2010, proponendo un algoritmo per la manutenzione incrementale di istantanee.
Pubblicazioni:
C-SPARQL, che abbiamo introdotto nel 2008, è un'estensione di SPARQL progettato per esprimere interrogazioni continue, cioè, le query registrate su entrambi i repository RDF e stream RDF. Le query di C-SPARQL possono essere considerate come input per sistemi specializzati (o ‘reasoners’) che valutano, attraverso la loro conoscenza su di un dominio, le decisioni da prendere in tempo reale. In tali applicazioni, i questi sistemi operano su immagini istantanee di conoscenza, che sono continuamente aggiornate da query registrate. E' importante notare che, in questa prospettiva, essi possono ignorare i cambiamenti del tempo e l'esistenza dei flussi. Abbiamo anche esplorato l'uso di un reasoner che è a conoscenza della natura tempo-dipendente dei dati nel 2010, proponendo un algoritmo per la manutenzione incrementale di istantanee.
Pubblicazioni:
- Emanuele Della Valle, Stefano Ceri, Frank van Harmelen, Dieter Fensel. It's a Streaming World! Reasoning upon Rapidly Changing Information. IEEE Intelligent Systems 24(6): 83-89 (2009)
- Emanuele Della Valle, Stefano Ceri, Davide Francesco Barbieri, Daniele Braga, Alessandro Campi: A First Step Towards Stream Reasoning. FIS 2008: 72-81
- Davide Francesco Barbieri, Daniele Braga, Stefano Ceri, Emanuele Della Valle, Michael Grossniklaus: C-SPARQL: a Continuous Query Language for RDF Data Streams. Int. J. Semantic Computing 4(1): 3-25 (2010)
- Davide Francesco Barbieri, Daniele Braga, Stefano Ceri, Emanuele Della Valle, Michael Grossniklaus: Querying RDF streams with C-SPARQL. SIGMOD Record 39(1): 20-26 (2010)
- Davide Francesco Barbieri, Daniele Braga, Stefano Ceri and Michael Grossniklaus. An Execution Environment for C-SPARQL Queries. EDBT 2010
- Davide Francesco Barbieri, Daniele Braga, Stefano Ceri and Emanuele Della Valle and Michael Grossniklaus, Continuous Queries and Real-time Analysis of Social Semantic Data with C-SPARQL, in SDoW 2009 Colocated with ISWC 2009.
- Davide Francesco Barbieri, Daniele Braga, Stefano Ceri, Emanuele Della Valle, Michael Grossniklaus: C-SPARQL: SPARQL for continuous querying. WWW 2009: 1061-1062
- Davide Francesco Barbieri, Daniele Braga, Stefano Ceri, Emanuele Della Valle, Yi Huang, Volker Tresp, Achim Rettinger, Hendrik Wermser: Deductive and Inductive Stream Reasoning for Semantic Social Media Analytics. IEEE Intelligent Systems 25(6): 32-41 (2010)
- Davide Francesco Barbieri, Daniele Braga, Stefano Ceri, Emanuele Della Valle, Michael Grossniklaus. Incremental Reasoning on Streams and Rich Background Knowledge. In. 7th Extended Semantic Web Conference (ESWC 2010)
- Heiner Stuckenschmidt, Stefano Ceri, Emanuele Della Valle and Frank van Harmelen. Towards Expressive Stream Reasoning. Proceedings of the Dagstuhl Seminar on Semantic Aspects of Sensor Networks, 2010.