Inicio > > Bases de datos > Partitionierung Zur Effizienten Duplikaterkennung in Relationalen Daten
Partitionierung Zur Effizienten Duplikaterkennung in Relationalen Daten

Partitionierung Zur Effizienten Duplikaterkennung in Relationalen Daten

Uwe Draisbach

92,62 €
IVA incluido
Disponible
Editorial:
Springer Nature B.V.
Año de edición:
2012
Materia
Bases de datos
ISBN:
9783834817723
92,62 €
IVA incluido
Disponible

Selecciona una librería:

  • Librería Samer Atenea
  • Librería Aciertas (Toledo)
  • Kálamo Books
  • Librería Perelló (Valencia)
  • Librería Elías (Asturias)
  • Donde los libros
  • Librería Kolima (Madrid)
  • Librería Proteo (Málaga)

Duplikate bzw. Dubletten sind mehrere Datensätze, die das gleiche Realweltobjekt beschreiben, etwa mehrfach erfasste Kunden in einem CRM-System oder unterschiedliche Repräsentationen eines Produkts. Das Auffinden dieser Duplikate ist auch für moderne Computer eine komplexe und zeitintensive Aufgabe. Uwe Draisbach vergleicht zwei der einschlägigen Partitionierungsstrategien, die eine intelligente Auswahl von zu vergleichenden Datensatzpaaren treffen. Daraus entwickelt er ein verallgemeinertes Verfahren und zeigt, dass eine intelligente Auswahl der Datensatzpaare den Aufwand signifikant reduzieren kann, ohne die Qualität der Duplikaterkennung wesentlich zu verringern. Die Arbeit wurde mit dem „Information Quality Best Master Degree Award' der Deutschen Gesellschaft für Informations- und Datenqualität ausgezeichnet.

Artículos relacionados

  • Mastering MongoDB 7.0 - Fourth Edition
    Arek Borucki / Leandro Domingues / Marko Aleksendrić
    Gain MongoDB expertise and discover advanced queries and Atlas insights with this ultimate guide to version 7.0Key FeaturesEnhance your proficiency in advanced queries, aggregation, and optimized indexing to achieve peak MongoDB performanceMonitor, back up, and integrate applications effortlessly with MongoDB AtlasImplement security thorough RBAC, auditing, and encryption to en...
  • Bases de datos en SQL server
    Darin Jairo Mosquera Palacios / Edwin Rivas Trujillo / Luis Felipe Wanumen Silva
    El diseño y la implementación de sistemas y la manipulación de bases de datos utilizan los lenguajes LDD (Lenguaje de Definición de Datos) y LMD (Lenguaje de Manipulación de Datos). Los autores ofrecen una obra que permita el uso de estos lenguajes a quienes están encargados de administrar sistemas informáticos y sus desarrolladores. El libro presenta una propuesta para modelar...
    Disponible

    10,35 €

  • Practical MongoDB Aggregations
    Paul Done
    Begin your journey toward efficient data manipulation with this robust technical guide and enhance your aggregation skills while building efficient pipelines for a variety of tasksKey Features:Build effective aggregation pipelines for increased productivity and performanceSolve common data manipulation and analysis problems with the help of practical examplesLearn essential str...
  • Data Observability for Data Engineering
    Michele Pinto / Sammy El Khammal
    Discover actionable steps to maintain healthy data pipelines to promote data observability within your teams with this essential guide to elevating data engineering practicesKey FeaturesLearn how to monitor your data pipelines in a scalable wayApply real-life use cases and projects to gain hands-on experience in implementing data observabilityInstil trust in your pipelines amon...
    Disponible

    53,54 €

  • Redis Stack for Application Modernization
    Luigi Fugaro / Mirko Ortensi
    Discover the multi-model capabilities of Redis Stack as a document store and vector database, with support for time series, stream processing, probabilistic data structures, and moreKey FeaturesModel, index, and search data using JSON and vector data typesModernize your applications with vector similarity search, documents hybrid search, and moreConfigure a scalable, highly ava...
    Disponible

    54,72 €

  • Data Mining and Data Warehousing
    Parteek Bhatia
    ...
    Disponible

    134,11 €