Kamran Shaukat / Nayyer Masood / Sundas Mehreen Fatima Haider
Librería Samer Atenea
Librería Aciertas (Toledo)
Kálamo Books
Librería Perelló (Valencia)
Librería Elías (Asturias)
Donde los libros
Librería Kolima (Madrid)
Librería Proteo (Málaga)
Os dados tabulares são uma fonte de informação disponível na Web. Começámos a trabalhar na recolha de tabelas HTML retiradas da Web. Em primeiro lugar, serão identificadas tabelas de boa qualidade e, em seguida, será efectuada a correspondência de esquemas. A correspondência de esquemas identifica o número de correspondências que determinam os elementos semelhantes de dois esquemas diferentes. As colunas e os valores dos dados são comparados um após o outro para fazer corresponder o esquema. Durante a pesquisa de dados tabulares na Web, o motor de pesquisa pode devolver o URL em vez de devolver os dados tabulares, o que constitui o principal problema. Por isso, estamos a trabalhar nesta questão: extraímos dados de páginas Web tabulares e extraímos o seu esquema e depois fizemos a correspondência do esquema identificando a correspondência de elementos semelhantes através de uma técnica baseada em corpus. Após a correspondência do esquema, preenchemos os dados das páginas HTML juntando as tabelas relacionadas numa tabela HTML, o que é mais adequado e útil para os utilizadores.