Diverse Size-/Object Summaries for Keyword Search

  • Datum: –16.15
  • Plats: Polacksbacken ITC/2347
  • Föreläsare: Georgios Fakas
  • Arrangör: Institutionen för informationsteknologi
  • Kontaktperson: Georgios Fakas
  • Docentföreläsning

Docentföreläsning i ämnet datavetenskap med inriktning mot databasteknik

Institutionen för informationsteknologi inbjuder härmed alla intresserade till docentföreläsning i ämnet datavetenskap med inriktning mot databasteknik.

Föreläsare: Georgios Fakas

Titel:  Diverse Size-l Object Summaries for Keyword Search

Ordförande: Professor Sverker Holmgren

Docenturnämndens representant: Professor Carolina Wählby

Föreläsningen ges på engelska.

Sammanfattning: The abundance and ubiquity of graphs (e.g., online social networks such as Google+ and Facebook; bibliographic graphs such as DBLP) necessitates the effective and efficient search on them. Given a set of keywords that can identify a data subject (DS), a recently proposed keyword search paradigm produces a set of object summaries (OSs) as results. An OS is a tree structure rooted at the DS node (i.e., a node containing the keywords) with surrounding nodes that summarize all data held on the graph about the DS. OS snippets, denoted as size-l OSs, have also been investigated. A size-l OS is a partial OS containing l nodes such that the summation of their importance scores results in the maximum possible total score. However, the set of nodes that maximize the total importance score may result in an uninformative size-l OSs, as very important nodes may be repeated in it, dominating other representative information. In view of this limitation, we investigate the effective and efficient generation of two novel types of OS snippets, i.e., diverse and proportional size-l OSs, denoted as DSize-l and PSize-l OSs. Namely, besides the importance of each node, we also consider its relevance to the other nodes in the OS and the snippet. We conduct an extensive evaluation on two real graphs (DBLP and Google+). We verify effectiveness by collecting user feedback, e.g., by asking DBLP authors (i.e., the DSs themselves) to evaluate our results. In addition, we verify the efficiency of our algorithms and evaluate the quality of the snippets that they produce.

Föreläsningen, som är ett lärarprov för den som ansökt om att bli antagen som docent, ska kunna följas av studenter och andra med kunskaper på grundutbildningsnivå inom ämnet, men kan även vara av intresse för en bredare publik. Föreläsningen varar 45 minuter med efterföljande frågestund och diskussion och kommer att ges på engelska.

Välkomna!