Name: Partitionierung Zur Effizienten Duplikaterkennung in Relationalen Daten
Price: 92.62 EUR
Availability: InStock
Author: Uwe Draisbach
ISBN: 9783834817723

Inicio > > Bases de datos > Partitionierung Zur Effizienten Duplikaterkennung in Relationalen Daten

Editorial:: Springer Nature B.V.
Año de edición:: 2012
Materia: Bases de datos
ISBN:: 9783834817723

92,62 €

IVA incluido

Disponible

Selecciona una librería:

Librería Samer Atenea
Librería Aciertas (Toledo)
Kálamo Books
Librería Perelló (Valencia)
Librería Elías (Asturias)
Donde los libros
Librería Kolima (Madrid)
Librería Proteo (Málaga)

Sobre IBD

Sinopsis

Duplikate bzw. Dubletten sind mehrere Datensätze, die das gleiche Realweltobjekt beschreiben, etwa mehrfach erfasste Kunden in einem CRM-System oder unterschiedliche Repräsentationen eines Produkts. Das Auffinden dieser Duplikate ist auch für moderne Computer eine komplexe und zeitintensive Aufgabe. Uwe Draisbach vergleicht zwei der einschlägigen Partitionierungsstrategien, die eine intelligente Auswahl von zu vergleichenden Datensatzpaaren treffen. Daraus entwickelt er ein verallgemeinertes Verfahren und zeigt, dass eine intelligente Auswahl der Datensatzpaare den Aufwand signifikant reduzieren kann, ohne die Qualität der Duplikaterkennung wesentlich zu verringern. Die Arbeit wurde mit dem „Information Quality Best Master Degree Award' der Deutschen Gesellschaft für Informations- und Datenqualität ausgezeichnet.

Artículos relacionados

Mastering MongoDB 7.0 - Fourth Edition

Arek Borucki / Leandro Domingues / Marko Aleksendrić

Gain MongoDB expertise and discover advanced queries and Atlas insights with this ultimate guide to version 7.0Key FeaturesEnhance your proficiency in advanced queries, aggregation, and optimized indexing to achieve peak MongoDB performanceMonitor, back up, and integrate applications effortlessly with MongoDB AtlasImplement security thorough RBAC, auditing, and encryption to en...
Bases de datos en SQL server

Darin Jairo Mosquera Palacios / Edwin Rivas Trujillo / Luis Felipe Wanumen Silva

El diseño y la implementación de sistemas y la manipulación de bases de datos utilizan los lenguajes LDD (Lenguaje de Definición de Datos) y LMD (Lenguaje de Manipulación de Datos). Los autores ofrecen una obra que permita el uso de estos lenguajes a quienes están encargados de administrar sistemas informáticos y sus desarrolladores. El libro presenta una propuesta para modelar...

Disponible

10,35 €
Practical MongoDB Aggregations

Paul Done

Begin your journey toward efficient data manipulation with this robust technical guide and enhance your aggregation skills while building efficient pipelines for a variety of tasksKey Features:Build effective aggregation pipelines for increased productivity and performanceSolve common data manipulation and analysis problems with the help of practical examplesLearn essential str...
Data Observability for Data Engineering

Michele Pinto / Sammy El Khammal

Discover actionable steps to maintain healthy data pipelines to promote data observability within your teams with this essential guide to elevating data engineering practicesKey FeaturesLearn how to monitor your data pipelines in a scalable wayApply real-life use cases and projects to gain hands-on experience in implementing data observabilityInstil trust in your pipelines amon...

Disponible

53,54 €
Redis Stack for Application Modernization

Luigi Fugaro / Mirko Ortensi

Discover the multi-model capabilities of Redis Stack as a document store and vector database, with support for time series, stream processing, probabilistic data structures, and moreKey FeaturesModel, index, and search data using JSON and vector data typesModernize your applications with vector similarity search, documents hybrid search, and moreConfigure a scalable, highly ava...

Disponible

54,72 €
Data Mining and Data Warehousing

Parteek Bhatia

...

Disponible

134,11 €