David Broneske
David Broneske
AG Datenbanken & Software Engineering
Aktuelle Projekte
Eine allgemeine Speicher-Engine für moderne Speicherhierarchien
Laufzeit: 01.10.2022 bis 30.09.2025
Die wissenschaftliche Forschung wird zunehmend von datenintensiven Problemen bestimmt. Da die Komplexität der untersuchten Probleme zunimmt, steigt auch der Bedarf an hohem Datendurchsatz und -kapazität. Das weltweit produzierte Datenvolumen verdoppelt sich etwa alle zwei Jahre, was zu einer exponentiellen Datenflut führt. Diese Datenflut stellt eine direkte Herausforderung für Datenbankmanagementsysteme und Dateisysteme dar, die die Grundlage für eine effiziente Datenanalyse und -verwaltung bilden. Diese Systeme verwenden verschiedene Speichergeräte, die traditionell in Primär-, Sekundär- und Tertiärspeicher unterteilt waren. Mit der Einführung der disruptiven Technologie des nichtflüchtigen Arbeitsspeichers (NVRAM) begannen diese Klassen jedoch miteinander zu verschmelzen, was zu heterogenen Speicherarchitekturen führte, bei denen jedes Speichergerät sehr unterschiedliche Leistungsmerkmale aufweist (z. B. Persistenz, Speicherkapazität, Latenz). Eine große Herausforderung ist daher die Ausnutzung der spezifischen Leistungscharakteristika dieser Speichergeräte.
Zu diesem Zweck wird SMASH die Vorteile einer gemeinsamen Speicher-Engine untersuchen, die eine heterogene Speicherlandschaft verwaltet, einschließlich herkömmlicher Speichergeräte und nichtflüchtiger Speichertechnologien. Das Herzstück dieser Speicher-Engine werden B-epsilon-Bäume sein, da diese zur effizienten Nutzung dieser unterschiedlichen Geräte verwendet werden können. Darüber hinaus werden Strategien zur Datenplatzierung und -migration untersucht, um den durch die Übertragung von Daten zwischen verschiedenen Geräten verursachten Overhead zu minimieren. Durch den Wegfall der Notwendigkeit flüchtiger Caches kann die Datenkonsistenz besser sichergestellt werden. Auf der Anwendungsseite wird die Speicher-Engine Key-Value- und Objekt-Schnittstellen bieten, die für eine Vielzahl von Anwendungsfällen genutzt werden können, zum Beispiel für das Hochleistungsrechnen (HPC) und für Datenbankmanagementsysteme. Aufgrund der immer größer werdenden Kluft zwischen der Leistung von Rechen- und Speichergeräten sowie deren stagnierender Zugriffsleistung sind außerdem Techniken zur Datenreduzierung sehr gefragt, um den Bandbreitenbedarf beim Speichern und Abrufen von Daten zu verringern. Wir werden daher Forschungsarbeiten zu Datentransformationen im Allgemeinen und zu den Möglichkeiten externer und beschleunigter Transformationen durchführen. Übliche HPC-Workflows werden durch die Integration von SMASH in das bestehende JULEA-Storage-Framework unterstützt, während Datenbanksysteme die Schnittstelle von SMASH direkt nutzen können, um Daten zu speichern oder abzurufen.
Abgeschlossene Projekte
ADAMANT-II: Adaptive Data Management in Evolving Heterogeneous Hardware/Software Systems
Laufzeit: 01.01.2021 bis 31.12.2023
Heterogene Systemarchitekturen bestehend aus CPUs, GPUs und FPGAs bieten vielfältige Optimierungsmöglichkeiten im Vergleich zu rein CPU-basierten Systemen. Zur vollständigen Ausnutzung dieses Optimierungspotenzials reicht es jedoch nicht, bestehende Softwarekonzepte unverändert auf nicht-von-Neumann-Architekturen wie beispielsweise FPGAs zu übertragen. Vielmehr erfordern die zusätzlichen Verarbeitungsmöglichkeiten dieser Architekturen den Entwurf neuartiger Verarbeitungskonzepte. Dies ist bereits in der Planung der Anfrageverarbeitung zu berücksichtigen. In der ersten Projektphase entwickelten wir hierfür bereits ein erstes Konzept, welches die gerätespezifischen Merkmale in unserer Plug’n’Play Architektur berücksichtigt. Allerdings sehen wir die Notwendigkeit zu dessen Weiterentwicklung, um eine noch bessere Ausnutzung der spezifischen Eigenschaften der Hardwarearchitekturen zu erreichen. Für die zweite Projektphase stellen wir daher die Hypothese auf, dass bekannte Verfahren zur Abbildung von Anfragen auf der Ebene einzelner Operatoren nicht ausreichen sind, um die erweiterten Verarbeitungsmöglichkeiten heterogener Systemarchitekturen auszunutzen.
Unser Ziel ist daher die Erforschung neuartiger Verarbeitungskonzepte und Verfahren zur Abbildung von Anfragen für heterogene Systeme, welche von der üblicherweise verwendeten Granularität auf Ebene einzelner Operatoren abweichen. Wir werden Verarbeitungseinheiten entwickeln, die eine größere Funktionalität als einzelne Operatoren bereitstellen und sich über mehrere Geräte hinweg erstrecken. Diese Verarbeitungseinheiten sind in sich heterogen und kombinieren die spezifischen Eigenschaften einzelner Architekturen. Im Ergebnis ermöglicht unsere heterogene Systemarchitektur das Bereitstellen von Datenbankoperationen und Funktionen, die in klassischen Datenbanksystemen nicht verfügbar oder nicht effizient realisierbar sind.
Zu Demonstrationszwecken haben wir drei Anwendungsfälle identifiziert, welche von heterogenen Systemarchitekturen stark profitieren können: Verarbeitung von Datenströmen mit hohem Aufkommen, approximative Anfrageverarbeitung und dynamische Multianfrageverarbeitung. Hochvolumige Datenströme erfordern eine Hardwarearchitektur, die eine Verarbeitung der Daten ohne vorherige Zwischenspeicherung ermöglicht. Dafür stellen FPGAs eine vielversprechende Plattform durch ihr datenstrombasiertes Verarbeitungsprinzip dar. Darüber hinaus eignen sich sowohl FPGAs als auch GPUs für approximierende Anfragenverarbeitungen, da sie arithmetische Operationen mit reduzierter Genauigkeit und die Realisierung von approximativen, hardwarebeschleunigten Samplingtechniken ermöglichen. Die dynamische Multianfrageverarbeitung ist aus Systemsicht sehr anspruchsvoll, da variable Systemlasten die Effizienz zuvor aufgestellter Anfragepläne reduzieren können. Hier ermöglichen die zahlreichen Parallelitätsebenen in heterogenen Systemen eine bessere Verteilung der Systemlasten.
Digitales Programmieren im Team - Adaptive Unterstützung für kollaboratives Lernen
Laufzeit: 01.03.2020 bis 28.02.2023
Das kollaborative Programmieren ist Kernbestandteil des beruflichen Alltags in der Informatik. Diese auf einer technischen und sozialen Ebene komplexen Vorgänge werden im Informatikstudium oftmals abstrakt behandelt und spielen in Fachkonzepten zum Programmierenlernen eine untergeordnete Rolle. Im Rahmen von Gruppenarbeiten müssen sich die Lernenden organisieren, koordinieren und ihre Lernprozesse regulieren - kognitiv anspruchsvolle Tätigkeiten. Um das Potential kollaborativer Lernformen für das Erlernen von Programmiersprachen und die Förderung sozialer Kompetenzen ausschöpfen zu können, müssen die Lernenden bei Bedarf didaktische Unterstützung erhalten, sowohl vor dem als auch während des Lernprozesses. Im Teilprojekt DiP-iT-OVGU werden wir - unterstützt durch die Projektpartner - auf der Basis empirischer Studien ein digitales Fachkonzept zum kollaborativen Programmierenlernen entwickeln und evaluieren, welches diesbezügliche (medien-)didaktische Ansätze enthält. Dabei zielen wir auf die Ermöglichung des Transfers an andere Hochschulen. Auf informationstechnischer Ebene wird hierfür ein Prozessmodell entwickelt, das die Nachnutzbarkeit von Forschungsdaten und die Übertragbarkeit von Datenmodellen (z.B. zur adaptiven didaktischen Unterstützung) in andere Lehrveranstaltungen bzw. Lehr-Lernsysteme ermöglicht. Das Teilprojekt ordnet sich in das Gesamtprojekt mit folgenden Zielstellungen ein:
- Analyse und Systematisierung von Einstellungen und Vorerfahrungen bei den Akteuren,
- Entwicklung konzeptioneller, mediendidaktischer Kriterien für die Einbindung kollaborativen Programmierenlernens in Lehrveranstaltungen,
- Entwicklung geeigneter Lehr-Lern-Szenarien und Erstellung eines diesbezüglichen digitalen Fachkonzepts,
- empirische Fundierung durch formative und summative Evaluation,
- Untersuchung der Effektivität von Formen der instruktionalen Anleitung angelehnt an die Bedarfe der Lernenden,
- Unterstützung des Transfers der Erkenntnisse, inhaltlich und technisch.
Query Acceleration Techniques in Co-Processor-Accelerated Main-memory Database Systems
Laufzeit: 31.08.2019 bis 31.03.2022
Das Projekt adressiert den aktuellen Schwerpunkt von Analysen in Hauptspeicherdatenbanken auf moderner Hardware: Heterogenität der Prozessoren und deren Einbindung in die Anfrageverarbeitung. Aufgrund der Vielzahl von Optimierungen und Varianten von Algorithmen und unbegrenzte Anzahl an Anwendungsfällen, ist das Erstellen des perfekten Anfrageplanes nahezu unmöglich.
Ziel der Habilitation ist es, (1) einen umfassenden Katalog von vielversprechenden Algorithmenvarianten aufzustellen, (2) eine optimale Auswahl der Varianten im Zuge der übergeordneten Anfrageoptimierung zu erlangen, (3) als auch Lastverteilung im Co-Prozessorbeschleunigten System zu erreichen.
- Der Variantenkatalog umfasst als weitere Dimensionen sowohl die Ausführung auf den spaltenorientierten Daten, als auch unter Nutzung von speziellen Indexstrukturen und beinhaltet unterschiedliche Ergebnisrepräsentationen. Aus allen möglichen Dimension wird dann eine Abstraktionsschicht entwickelt, sodass ein Algorithmus unabhängig von dessen Optimierungen definiert werden kann. Dadurch soll jede Variante effizient, mit wenig redundantem Code generiert und ausgeführt werden können.
- Aufgrund des enormen Variantenraumes bestehend aus den Dimensionen der Varianten inklusive dem Einfluss der ausführenden Prozessoren ist die Wahl einer auszuführenden Variante nicht trivial. Ziel ist es hier lern-basierte Methoden in Hinblick auf die Eignung zur Algorithmenauswahl gegenüber zu stellen, um valide Entscheidungen zu treffen. Die zu treffenden Entscheidungen sollen des Weiteren auch ausgeweitet werden auf das Erstellen von Indexen als auch der Datenverteilung in Ziel (3).
- Die Lastenverteilung in Co-Prozessorbeschleunigten Systemen wird durch den Grad der Parallelisierung beeinflusst. Dieser Grad teilt sich in mehrere Dimensionen, da Datenbankoperationen in kleinere Funktionseinheiten (sog. Primitive) aufteilen können. Diese Primitive können entweder auf dem ganzen Datenbestand laufen oder partitioniert ausgeführt werden. All diese Optimierungspotentiale (unterschiedliche Granularitätsstufen und Partitionierungsgrößen) müssen analysiert und optimal gewählt werden, um unter der gegebenen und zukünftigen Anfragelast eine angemessene Performanz zu ermöglichen. Ziel ist es, ein Modell lernen zu lassen, um optimale Verteilungen und optimierte Pläne zu erstellen. Wichtig ist hierbei, dass das Modell auch Rückschlüsse auf dessen Entscheidungen zulässt, um eine Generalisierbarkeit zu erreichen.
On the Impact of Hardware on Relational Query Processing
Laufzeit: 01.09.2013 bis 31.08.2018
Satisfying the performance needs of tomorrow typically implies using modern processor capabilities (such as single instruction, multiple data) and co-processors (such as graphics processing units) to accelerate database operations. Algorithms are typically hand-tuned to the underlying (co-)processors. This solution is error-prone, introduces high implementation and maintenance cost and is not portable to other (co-)processors. To this end, we argue for a combination of database research with modern software-engineering approaches, such as feature-oriented software development (FOSD). Thus, the goal of this project is to generate optimized database algorithms tailored to the underlying (co-)processors from a common code base. With this, we maximize performance while minimizing implementation and maintenance effort in databases on new hardware. Project milestones:
- Creating a feature model: Arising from heterogeneous processor capabilities, promising capabilities have to be identified and structured to develop a comprehensive feature model. This includes fine-grained features that exploit the processor capabilities of each device.
- Annotative vs. compositional FOSD approaches: Both approaches have known benefits and drawbacks. To have a suitable mechanism to construct hardware-tailored database algorithms using FOSD, we have to evaluate which of these two approaches is the best for our scenario.
- Mapping features to code: Arising from the feature model, possible code snippets to implement a feature have to be identified.
- Performance evaluation: To validate our solution and derive rules for processor allocation and algorithm selection, we have to perform an evaluation of our algorithms.
2024
- Bala Gurumurthy, Vasudev Raghavendra
Bidarkar, David Broneske, Thilo Pionteck, and Gunter Saake.
Exploiting Shared Sub-Expression and Materialized View Reuse for
Multi-Query Optimization.
In Journal of Information System Frontiers, June 2024.
accepted.
- Rahul Mondal, Evelina Ignatova, Daniel
Walke, David Broneske, Gunter Saake, and Robert Heyer.
Clustering graph data: the roadmap to spectral techniques.
Discover Artificial Intelligence, January 2024.
(PDF)
- Mustafa N Abbas, A Attea Bara’a,
David Broneske, and Gunter Saake.
An evolutionary algorithm with heuristic operator for detecting protein
complexes in protein interaction networks with negative controls.
IEEE Access, 2024.
- Mohamad F Enaya, Thomas Klingbeil,
Jacob Krüger, David Broneske, Frank Feinbube, and Gunter Saake.
A Case Study on the Development of the German
Corona-Warn-App.
In Journal of Systems and Software. Elsevier,
2024.
- Sadeq Darrab, Florian Kleinert, David
Broneske, and Gunter Saake.
Exploring the Advantages and Limitations of Association Rule Mining and
Decision Trees for Pattern Mining in Heart Disease Data.
The 20th International Conference on Advanced Data Mining and Applications
(ADMA2024), Springer, June 2024.
accepted.
- Sajad Karim, Johannes Wünsche,
David Broneske, Michael Kuhn, and Gunter Saake.
A Design Proposal for
a Unified B-epsilon-tree: Embracing NVM in Memory Hierarchies.
In Uta Störl, editor, Proceedings of the 35th GI-Workshop Grundlagen
von Datenbanken, Herdecke, Germany, May 22-24, 2024, volume 3710 of
CEUR Workshop Proceedings, pages 43–50. CEUR-WS.org,
2024.
- Chukwuka Victor Obionwu, Bhavya
Baburaj Chovatta Valappil, Minu Genty, Maria Jomy, Visakh Padmanabhan, Sumat
Singh Bedi Aishwarya Suresh, David Broneske, and Gunter Saake.
Expert Agent Guided Learning with Transformers and Knowledge Graphs.
volume Volume 1, pages 180–189. Proceedings of the 13th International
Conference on Data Science, Technology and Applications DATA, scitepress,
June 2024.
- Sadeq Darrab, David Broneske, and
Gunter Saake.
Exploring
the Predictive Factors of Heart Disease using Rare Association Rule
Mining.
Scientific Reports - Nature, July 2024.
2023
- Bala Gurumurthy, Vasudev Raghavendra
Bidarkar, David Broneske, Thilo Pionteck, and Gunter Saake.
What Happens When Two Multi-Query Optimization Paradigms
Combine?.
In Advances in Databases and Information Systems, September
2023.
- Chukwuka Victor Obionwu, Kalu Oji Kalu,
Paul Blockhaus, David Broneske, and Gunter Saake.
A Strategy for Retrospective Evaluation of Students SQL Learning
Engagements.
pages 1–7. 2023 3rd International Conference on Electrical, Computer,
Communications and Mechatronics Engineering (ICECCME), IEEE, May
2023.
- Chukwuka Victor Obionwu, Maximilian
Karl, David Broneske, Anja Hawlitschek, Paul Blockhaus, and Gunter Saake.
A Strategy for Structuring Teams Collaboration in University Course
Projects.
pages 32–42. In Proceedings of the 20th International Conference on Smart
Business Technologies (ICSBT 2023),, May 2023.
- Chukwuka Victor Obionwu, S.M Laique
Abbas, Visakh Padmanabhan, Taruna Tiwari, David Broneske, and Gunter Saake.
Optical image recognition strategy for keyword extraction and page
ranking for slide recommendation system.
pages 2065–2070. 2023 3rd International Conference on Electrical, Computer,
Communications and Mechatronics Engineering (ICECCME), IEEE, May
2023.
- Victor Obionwu, Vincent Toulouse, David
Broneske, and Gunter Saake.
Automatic instructional feedback, and a Lecture Hub System, a Strategy
towards Nurturing the acquisition of a structured engagement
behavior.
In International Conference on Data Management Technologies and
Applications (pp. 219-242). Cham: Springer Nature Switzerland., May
2023.
- Spoorthi Nijalingappa, Bala Gurumurthy,
David Broneske, and Gunter Saake.
Vertical Vectorized Hashing for Faster Group-By
Aggregation.
In Proceedings of the International Workshop on Big Data Management on
Emerging Hardware (HardBD), April 2023.
Accepted.
- Bala Gurumurthy, David Broneske, Martin
Schäler, Thilo Pionteck, and Gunter Saake.
Novel Insights on Atomic Synchronization for Sort-Based Group-By on
GPUs.
Distributed and Parallel Databases (DAPD), April
2023.
- Harish Kumar Harihara Subramanian, Bala
Gurumurthy, Gabriel Campero Durand, David Broneske, and Gunter Saake.
Out-of-the-Box Library Support for DBMSOperations On GPUs.
Distributed and Parallel Databases (DAPD), April
2023.
- Christopher Vox, David Broneske,
Istiaque Mannafee Shaikat, and Gunter Saake.
Data Streams: Investigating data structures for multivariate
asynchronous time series prediction problems.
In International Conference on Pattern Recognition Applications and
Methods (ICPRAM), 2023.
accepted.
- Bala Gurumurthy, David Broneske,
Gabriel Campero Durand, Thilo Pionteck, and Gunter Saake.
ADAMANT: A Query Executor with Plug-In Interfaces for
Easy Co-processor Integration.
In IEEE International Conference on Data Engineering (ICDE), April
2023.
- Chukwuka Victor Obionwu,
Damanpreet Singh Walia, Taruna Tiwari, Tathagatha Ghosh, David Broneske, and
Gunter Saake.
Towards A Strategy for Developing a Project Partner Recommendation
System for University Course Projects.
pages 144–151. 6th World Conference on Computing and Communication
Technologies (WCCCT 2023), IEEE, January 2023.
- Chukwuka Victor Obionwu, Rahul Kumar,
Suhas Shantharam, David Broneske, and Gunter Saake.
Semantic Relatedness : A Strategy for Plagiarism Detection in SQL
Assignments.
pages 158–165. 2023 6th World Conference on Computing and Communication
Technologies (WCCCT), IEEE, January 2023.
- Rahul Mondal, Minh Dung Do, Nasim Uddin
Ahmed, Daniel Walke, Daniel Micheel, David Broneske, Gunter Saake, and Robert
Heyer.
Decision tree learning in Neo4j on homogeneous and
unconnected graph nodes from biological and clinical datasets.
BMC Medical Informatics and Decision Making, 2023.
(PDF)
- Daniel Walke, Daniel Micheel, Kay
Schallert, Thilo Muth, David Broneske, Gunter Saake, and Robert Heyer.
The importance of graph databases and graph learning for
clinical applications.
Database: The Journal of Biological Databases and Curation, 2023.
Accepted review about graph databases and graph machine learning.
(PDF)
- Johannes Wünsche, Sajad Karim,
Michael Kuhn, David Broneske, and Gunter Saake.
Intelligent Data Migration Policies in a Write-Optimized Copy-on-Write
Tiered Storage Stack.
In Jean-Thomas Acquaviva, Shadi Ibrahim, and Suren Byna, editors,
Proceedings of the 3rd Workshop on Challenges and Opportunities of
Efficient and Performant Storage Systems, CHEOPS 2023, Rome, Italy, 8 May
2023, pages 17–26. ACM, 2023.
- Paul Blockhaus, Gabriel Campero Durand,
David Broneske, and Gunter Saake.
Towards a Future of Fully Self-Optimizing
Query Engines.
In 34. Workshop Grundlagen von Datenbanken,
2023.
- Chukwuka Victor Obionwu, Taruna Tiwari,
Bhavya Baburaj Chovatta Valappil, Nishanth Raikar, Damanpreet Singh Walia,
S.M Laique Abbas, chukwuemeka Okafor, David Broneske, and Gunter Saake.
A Domain specific students’ assistance system for the provision of
instructional feedback.
pages 2065–2070. 2023 International Conference on Machine Learning and
Applications (ICMLA), IEEE, September 2023.
- Chukwuka Victor Obionwu, Rahul Raj
Kanagaraj, David Broneske, Anja Buch, Christian Knopke, and Gunter Saake.
A Mediation Strategy For Communication Between an internal Chat System
and an Open Source Chat System.
International Conference on Advances in Education and Information Technology,
Springer, September 2023.
Accepted.
- Sadeq Darrab, Harshitha Allipilli, Sana
Ghani, Harikrishnan Changaramkulath, Sricharan Koneru, David Broneske, and
Gunter Saake.
Anomaly Detection Algorithms: Comparative Analysis and Explainability
Perspectives.
page 90–104. Australasian Conference on Data Science and Machine Learning
(AusDM23), Springer, 2023.
published.
- Chukwuka Victor Obionwu, Devi Prasad
Ilapavuluri, David Broneske, and Gunter Saake.
A Study Partner Recommender System Using a Community Detection
Algorithm.
Springer Nature Computer Science book series, November 2023.
Accepted.
- Sajad Karim, Johannes Wünsche,
David Broneske, Michael Kuhn, and Gunter Saake.
Assessing
Non-volatile Memory in Modern Heterogeneous Storage Landscape using a
Write-optimized Storage Stack.
In Holger Schwarz, editor, Proceedings of the 34th GI-Workshop on
Foundations of Databases (Grundlagen von Datenbanken), Hirsau, Germany, June
7-9, 2023, volume 3714 of CEUR Workshop Proceedings.
CEUR-WS.org, 2023.
2022
- Sadeq Darrab, David Broneske, and
Gunter Saake.
UCRP-miner:
Mining Patterns that Matter.
IEEE, May 2022.
- Christopher Vox, Jan Piewek,
Andreas Udo Sass, David Broneske, and Gunter Saake.
Integer Time Series Compression for Holistic Data Analytics in the
Context of Vehicle Sensor Data.
In International Conference on Connected Vehicles & Expo
(ICVVE), 2022.
- Ian Wolff, David Broneske, and Veit
Köppen.
Towards a Learning Analytics Metadata Model.
In Proceedings of the International Learning Analytics and Knowledge
Conference (LAK), 2022.
Accepted.
- Victor Obionwu, Vincent Toulouse, David
Broneske, and Gunter Saake.
Slide-Recommendation System: A Strategy for Integrating Instructional
Feedback into Online Exercise Sessions.
pages 541–548. SCITEPRESS, In Proceedings of the 11th International Conference
on Data Science, Technology and Applications, June
2022.
- Victor Obionwu, David Broneske, and
Gunter Saake.
A Collaborative Learning Environment using Blogs in a learning
management system.
In 11th International Conference on Knowledge and Education
Technology, pages 213–232. International Conference on Computer
Science and Education in Computer Science, Springer, November
2022.
- Victor Obionwu, David Broneske, and
Gunter Saake.
Leveraging Educational Blogging to Assess the Impact of Collaboration
on Knowledge Creation.
In 13th International Conference on Distance Learning and Education
(ICDLE 2022), pages 785–791. International Conference on Distance
Learning and Education ICDLE 2022, IJIET, June 2022.
- Victor Obionwu, David Broneske, and
Gunter Saake.
Microblogs-A means for simulating informal learning beyond
classrooms.
In Proceedings of the 14th International Conference on Education
Technology and Computers, pages 219–225. 14th International
Conference on Education Technology and Computers (ICETC 2022), June
2022.
- Victor Obionwu, Chukwuka, Christian
Harnisch, Kalu Kalu, David Broneske, and Gunter Saake.
An intervention strategy for mitigating the prevalence of syntax errors
during task exercise engagements.
pages 1–6. International Conference on Engineering and Emerging Technologies
ICEET 2022, IEEE, September 2022.
- David Broneske, Ian Wolff, Veit
Köppen, and Martin Schäler.
Exploiting views for collaborative research data management of
structured data.
In Proceedings of the International Conference on Asian Digital Libraries
(ICADL), pages 360–376, 2022.
- Victor Obionwu, David Broneske, and
Gunter Saake.
Topic maps as a tool for facilitating collaborative work pedagogy in
knowledge management systems.
pages 50–60. Proceedings of the 12th International Conference on Information
Communication and Management, ACM, June 2022.
2021
- David Broneske, Anna Drewes, Bala
Gurumurthy, Imad Hajjar, Thilo Pionteck, and Gunter Saake.
In-Depth Analysis of OLAP Query Performance On Heterogeneous
Hardware.
Datenbank-Spektrum, Volume 21, page 133–143, May
2021.
- Sadeq Darrab, David Broneske, and
Gunter Saake.
Modern Applications and Challenges for Rare Itemset
Mining.
International Journal of Machine Learning and Computing, Volume
11, May 2021.
- Harish Kumar Harihara Subramanian, Bala
Gurumurthy, Gabriel Campero Durand, David Broneske, and Gunter Saake.
Analysis of GPU-Libraries for
rapid Prototyping Database Operations.
In Proceedings of the International Workshop on Big Data Management on
Emerging Hardware (HardBD), pages 36–41, April
2021.
- Bala Gurumurthy, David Broneske, Martin
Schäler, Thilo Pionteck, and Gunter Saake.
An
Investigation of Atomic Synchronization for Sort-Based Group-By Aggregation
on GPUs.
In Proceedings of the International Workshop on Big Data Management on
Emerging Hardware (HardBD), pages 48–53, April
2021.
- Victor Obionwu, David Broneske, Anja
Hawlitschek, Veit Köppen, and Gunter Saake.
SQLValidator - An Online Student Playground to Learn SQL.
Datenbank-Spektrum, Springer, 21(2):73–81, March
2021.
- Muhammad Attahir Jibril, Philipp
Götze, David Broneske, and Kai-Uwe Sattler.
Selective Caching:
A Persistent Memory Approach for Multi-Dimensional Index
Structures.
Distributed and Parallel Databases (DAPD),
2021.
- Sadeq Darrab, David Broneske, and
Gunter Saake.
MaxRI: A
method for discovering maximal rare itemsets.
In 2021 4th International Conference on Data Science and Information
Technology. ACM, July 2021.
- Anh Trang Le, Gabriel Campero Durand,
Bala Gurumurthy, David Broneske, Christoph Steup, and Gunter Saake.
Design Considerations Towards AI-Driven Co-Processor
Accelerated Database Management.
In Grundlagen von Datenbanken (GvDB), April 2021.
Accepted.
- Martin Schäler, Christine Tex, Veit
Köppen, David Broneske, and Gunter Saake.
Towards
multi-purpose main-memory storage structures: Exploiting sub-space distance
equalities in totally ordered data sets for exact knn queries.
Information Systems, 2021.
- Hayastan Avetisyan and David Broneske.
Identifying and Understanding Game-Framing in Online News: BERT and
Fine-Grained Linguistic Features.
In Proceedings of the International Conference on Natural Language and
Speech Processing (ICNLSP), pages 95–107. Association for
Computational Linguistics, 2021.
- Ian Wolff, David Broneske, and Veit
Köppen.
A first metadata schema for learning analytics research data
management.
o-bib. Das offene Bibliotheksjournal/Herausgeber VDB, 8(4):1–20,
2021.
- Sadeq Darrab, Priyamvada Bhardwaj,
David Broneske, and Gunter Saake.
OPECUR: An enhanced clustering-based model for discovering unexpected
rules.
In 17th anniversary of the International Conference on Advanced Data
Mining and Applications (ADMA'21). Springer, October
2021.
- Roman Zoun, Kay Schallert, David
Broneske, Ivayla Trifonova, Xiao Chen, Robert Heyer, Dirk Benndorf, and
Gunter Saake.
An Investigation of
Alternatives to Transform Protein Sequence Databases to a Columnar Index
Schema.
Algorithms, 14(2), 2021.
- Rahul Mondal, Minh Dung Do, Nasim Uddin
Ahmed, David Broneske, Gunter Saake, and Robert Heyer.
Integrating Decision Tree Learning on the Graph Database Neo4j to
Analyze Clinical Data.
In Proceedings of the International Conference on Computational
Intelligence Methods for Bioinformatics and Biostatistics (CIBB),
2021.
- Ian Wolff, David Broneske, and Veit
Köppen.
FAIR research data management for learning analytics.
In Proceedings of DELFI Workshops, pages 158–163,
2021.
- Nicole Vorhauer-Huget, Praveen Mathew,
Hariharasudhan Gunasekaran, Minh Do, Savio Thalakkotoor, Vishnu Jayanand,
Prathap Dhanasekaran, Chinmay Hegde, Benjith Kochupurakkal, and David
Broneske.
3D Animation of
Single Stage Batch Distillation for Distance Learning.
In EDULEARN21 Proceedings, pages 476–483. IATED,
2021.
2020
- Xiao Chen, Nishanth Entoor
Venkatarathnam, Kirity Rapuru, David Broneske, Gabriel Campero Durand, Roman
Zoun, and Gunter Saake.
Analysis and
Comparison of Block-Splitting-Based Load Balancing Strategies for Parallel
Entity Resolution.
In International Conference on Information Integration and Web-based
Applications & Services (iiWAS2020), page 446–455. ACM, November
2020.
- Bala Gurumurthy, Imad Hajjar, David
Broneske, Thilo Pionteck, and Gunter Saake.
When Vectorwise Meets Hyper, Pipeline Breakers Become the
Moderator.
Eleventh International Workshop on Accelerating Analytics and Data
Management Systems Using Modern Processor and Storage Architectures
(ADMS), August 2020.
- Gabriel Campero Durand, Anshu Daur,
Vinayak Kumar, Shivalika Suman, Altaf Mohammed Aftab, Sajad Karim, Prafulla
Diwesh, Chinmaya Hegde, Disha Setlur, Syed Md Ismail, David Broneske, and
Gunter Saake.
Spread the good
around! Information Propagation in Schema Matching and Entity Resolution for
Heterogeneous Data.
Second Workshop on Data Integration to Knowlege Graphs, DI2KG
2020@VLDB, August 2020.
DI2KG Challenge Winner Paper.
(PDF)
- Anna Drewes, Jan Moritz Joseph, Bala
Gurumurthy, David Broneske, Gunter Saake, and Thilo Pionteck.
Optimising Operator Sets for Analytical Database Processing on
FPGAs.
In International Workshop on Applied Reconfigurable Computing
(ARC), pages 30–44, February 2020.
- Marcus Pinnecke, Gabriel Campero, David
Broneske, Roman Zoun, and Gunter Saake.
GridTables: A One-Size-Fits-Most H2TAP Data
Store.
Datenbank-Spektrum, Volume 2020/01/31,
2020.
- Muhammad Attahir Jibril, Philipp
Götze, David Broneske, and Kai-Uwe Sattler.
Selective Caching: A Persistent Memory Approach for
Multi-Dimensional Index Structures.
In Proceedings of the International Workshop on Big Data Management on
Emerging Hardware (HardBD), pages 115–120. IEEE,
2020.
- Mahmoud Mohsen, Norman May, Christian
Färber, and David Broneske.
FPGA-Accelerated
Compression of Integer Vectors.
In International Workshop on Data Management on New Hardware
(DaMoN), pages 1–10. ACM, June 2020.
- Sadeq Darrab, David Broneske, and
Gunter Saake.
RPP Algorithm: A
Method for Discovering Interesting Rare Itemsets.
In Fifth International Conference on Data Mining and Big Data
(DMBD), volume 1234, pages 14–25. Springer, July
2020.
- Paul Blockhaus, David Broneske, Martin
Schäler, Veit Köppen, and Gunter Saake.
Combining Two Worlds:
MonetDB with Multi-Dimensional Index Structure Support to Efficiently Query
Scientific Data.
In Proceedings of the 32nd International Conference on Scientific and
Statistical Database Management (SSDBM), pages 1–4, July
2020.
2019
- Xiao Chen, Yinlong Xu, David Broneske,
Gabriel Campero Durand, Roman Zoun, and Gunter Saake.
Heterogeneous
Committee-Based Active Learning for Entity Resolution (HeALER).
In European Conference on Advances in Databases and Information Systems
(ADBIS), LNCS, pages 69–85, September 2019.
- Gabriel Campero Durand, Rufat Piriyev,
Marcus Pinnecke, David Broneske, and Gunter Saake.
Automated Vertical Partitioning
with Deep Reinforcement Learning.
European Conference on Advances in Databases and Information
Systems, September 2019.
(PDF)
- Roman Zoun, Kay Schallert, David
Broneske, Ivayla Trifonova, Xiao Chen, Robert Heyer, Dirk Benndorf, and
Gunter Saake.
Efficient Transformation of Protein Sequence Databases to Columnar
Index Schema.
In International Workshop on Biological Knowledge Discovery and Data
Mining (BIOKDD-DEXA), volume 1062 of CCIS, pages 67–72.
IEEE, August 2019.
- Rutuja Pawar, Sepideh Sobhgol, Gabriel
Campero Durand, Marcus Pinnecke, David Broneske, and Gunter Saake.
Codd's World: Topics and their Evolution in the Database
Community Publication Graph.
In Grundlagen von Datenbanken, volume 2367, pages 1–6, June
2019.
- David Broneske.
Accelerating mono and multi-column selection predicates
in modern main-memory database systems.
PhD thesis, University of Magdeburg, May 2019.
- Xiao Chen, Gabriel Campero Durand,
Roman Zoun, David Broneske, Yang Li, and Gunter Saake.
The Best of Both Worlds: Combining Hand-Tuned and Word-Embedding-Based
Similarity Measures for Entity Resolution.
In Datenbanksysteme für Business, Technologie und Web, pages
215 – 224, March 2019.
- Roman Zoun, Kay Schallert, David
Broneske, Wolfram Fenske, Marcus Pinnecke, Robert Heyer, Sven Brehmer, Dirk
Benndorf, and Gunter Saake.
MSDataStream - Connecting a Bruker Mass Spectrometer to the
Internet.
In Datenbanksysteme für Business, Technologie und Web, pages
507 – 510. Gesellschaft für Informatik, March
2019.
- Marcus Pinnecke, Gabriel Campero, Roman
Zoun, David Broneske, and Gunter Saake.
Protobase: It’s About Time for Backend/Database
Co-Design.
In Holger Meyer, Norbert Ritter, Andreas Thor, Daniela Nicklas, Andreas Heuer,
and Meike Klettke, editors, BTW 2019 – Workshopband, volume
P-289 of Lecture Notes in Informatics (LNI), pages 515–518.
Gesellschaft für Informatik, March 2019.
- David Broneske, Veit Köppen, Gunter
Saake, and Martin Schäler.
Efficient evaluation
of multi-column selection predicates in main-memory.
Transactions on Knowledge and Data Engineering, 31(7):1296–1311,
July 2019.
(PDF)
- Marcus Pinnecke, Gabriel Campero, Roman
Zoun, David Broneske, and Gunter Saake.
Protobase: It's About Time for Backend/Database Co-Design.
In Datenbanksysteme für Business, Technologie und Web (BTW),
pages 515–518, 2019.
- Roman Zoun, Kay Schallert, David
Broneske, Sören Falkenberg, Robert Heyer, Sabine Wehnert, Sven Brehmer,
Dirk Benndorf, and Gunter Saake.
MStream: Proof of Concept of an Analytic Cloud Platform for
Near-Real-Time Diagnostics using Mass Spectrometry Data.
002-2019, Otto-von-Guericke-University Magdeburg, 2019.
2018
- Sabine Wehnert, David Broneske, Stefan
Langer, and Gunter Saake.
Concept Hierarchy
Extraction from Legal Literature.
In Proceedings of the CIKM 2018 Workshops, volume 2482.
CEUR-WS.org, October 2018.
(PDF)
- Iya Arefyeva, David Broneske, Gabriel
Campero, Marcus Pinnecke, and Gunter Saake.
Memory Management Strategies in CPU/GPU Database Systems:
A Survey.
In BDAS. Springer, September 2018.
- Marten Wallewein-Eising, David
Broneske, and Gunter Saake.
SIMD Acceleration for Main-Memory Index
Structures – A Survey.
In Proceedings of the International Conference Beyond Databases,
Architectures and Structures (BDAS), pages 105–119, September
2018.
- Bala Gurumurthy, David Broneske, Marcus
Pinnecke, Gabriel Campero Durand, and Gunter Saake.
SIMD Vectorized Hashing for Grouped
Aggregation.
In Advances in Databases and Information Systems, pages 113 –
126, September 2018.
- Roman Zoun, Gabriel Campero Durand, Kay
Schallert, Apoorva Patrikar, David Broneske, Wolfram Fenske, Robert Heyer,
Dirk Benndorf, and Gunter Saake.
Protein Identification as a Suitable Application for Fast Data
Architecture.
In International Workshop on Biological Knowledge Discovery and Data
Mining (BIOKDD-DEXA), pages 168 – 178. IEEE, September
2018.
- Roman Zoun, Kay Schallert, Atin Janki,
Rohith Ravindran, Gabriel Campero Durand, Wolfram Fenske, David Broneske,
Robert Heyer, Dirk Benndorf, and Gunter Saake.
Streaming FDR Calculation for Protein Identication.
In Advances in Databases and Information Systems, pages 80 – 87,
September 2018.
- Bala Gurumurthy, David Broneske, Tobias
Drewes, Thilo Pionteck, and Gunter Saake.
Cooking DBMS Operations using Granular
Primitives - An overview on a primitive-based RDBMS query
evaluation.
Datenbank-Spektrum, August 2018.
(PDF)
- Lars-Christian Schulz, David Broneske,
and Gunter Saake.
An
Eight-Dimensional Systematic Evaluation of Optimized Search Algorithms on
Modern Processors.
In Proceedings of the International Conference on Very Large Databases
(VLDB), volume 11, 1550-1562, August 2018.
- Iya Arefyeva, Gabriel Campero Durand,
Marcus Pinnecke, David Broneske, and Gunter Saake.
Low-Latency Transaction Execution
on Graphics Processors: Dream or Reality?.
Ninth International Workshop on Accelerating Analytics and Data
Management Systems Using Modern Processor and Storage Architectures
(ADMS), August 2018.
- Andreas Becher, Lekshmi B.G., David
Broneske, Tobias Drewes, Bala Gurumurthy, Klaus Meyer-Wegener, Thilo
Pionteck, Gunter Saake, Jürgen Teich, and Stefan Wildermann.
Integration of FPGAs in Database
Management Systems: Challenges and Opportunities.
Datenbank-Spektrum, August 2018.
(PDF)
- Gabriel Campero Durand, Marcus
Pinnecke, Rufat Piriyev, Mahmoud Mohsen, David Broneske, Gunter Saake, Maya
Sekeran, Fabian Rodriguez, and Laxmi Balami.
GridFormation: Towards Self-Driven
Online Data Partitioning using Reinforcement Learning.
In First International Workshop on Exploiting Artificial Intelligence
Techniques for Data Management (aiDM), June 2018.
(PDF)
- Bala Gurumurthy, Tobias Drewes, David
Broneske, Gunter Saake, and Thilo Pionteck.
Adaptive Data Processing in Heterogeneous Hardware
Systems.
In Grundlagen von Datenbanken, pages 10–15, May
2018.
- Atin Janki, Roman Zoun, Kay Schallert,
Rohith Ravindran, David Broneske, Wolfram Fenske, Robert Heyer, Dirk
Benndorf, and Gunter Saake.
Connecting X! Tandem to a Database Management
System.
In GI-Workshop Grundlagen von Datenbanken, GvDB, pages 77–82, May
2018.
- Tobias Drewes, Jan Moritz Joseph, Bala
Gurumurthy, David Broneske, Gunter Saake, and Thilo Pionteck.
Efficient Inter-Kernel
Communication for OpenCL Database Operators on FPGAs.
In International Conference on Field-Programmable Technology
(FPT), pages 266–269, December 2018.
2017
- David Broneske, Andreas Meister, and
Gunter Saake.
Hardware-Sensitive Scan Operator Variants for Compiled
Selection Pipelines.
In 17. Fachtagung Datenbanksysteme für Business, Technologie und Web
(BTW), pages 403–412, 2017.
- Gabriel Campero Durand, Marcus
Pinnecke, David Broneske, and Gunter Saake.
Backlogs and
interval timestamps: Building blocks for supporting temporal queries in graph
databases.
In Proceedings of the Workshops of the EDBT/ICDT 2017 Joint Conference
(EDBT/ICDT 2017), Venice, Italy, March 21-24, 2017., volume 1810.
CEUR-WS, 2017.
(PDF)
- David Broneske, Veit Köppen, Gunter
Saake, and Martin Schäler.
Accelerating
multi-column selection predicates in main-memory – the Elf
approach.
In IEEE International Conference on Data Engineering (ICDE), pages
647 – 658, 2017.
(PDF)
- Marcus Pinnecke, David Broneske,
Gabriel Campero Durand, and Gunter Saake.
Are Databases Fit for
Hybrid Workloads on GPUs? A Storage Engine’s Perspective..
In Proceedings of the International Workshop on Big Data Management on
Emerging Hardware, San Diego, USA, April 22, 2017, pages 1599–1606,
2017.
(PDF)
- Iya Arefyeva, David Broneske, Marcus
Pinnecke, Mudit Bhatnagar, and Gunter Saake.
Column vs. Row Stores
for Data Manipulation in Hardware Oblivious CPU/GPU Database
Systems.
In GvDB, pages 24–29. CEUR-WS, 2017.
- Roman Zoun, Kay Schallert, David
Broneske, Robert Heyer, Dirk Benndorf, and Gunter Saake.
Interactive Chord Visualization for Metaproteomics.
In International Workshop on Biological Knowledge Discovery and Data
Mining (BIOKDD-DEXA). IEEE, 2017.
www.dxdoi.org/10.1109/DEXA.2017.32.
- David Broneske and Gunter Saake.
Exploiting
Capabilities of Modern Processors in Data Intensive
Applications.
it - Information Technology, 59(3):133–140,
2017.
- David Broneske and Martin Schäler.
Single Instruction Multiple Data – Not Everything is a Nail
for this Hammer.
Failed Aspirations in Database Systems, 2017.
VLDB Workshop.
2016
- Veit Köppen, David Broneske, Martin
Schäler, and Gunter Saake.
Elf: A Main-Memory Index for Efficient Multi-Dimensional Range and Partial
Match Queries.
International Journal Of Advancement In Engineering Technology,
Management and Applied Science (IJAETMAS), 3(12):96–105, December
2016.
(PDF)
- Hagen Schink, David Broneske, Reimar
Schröter, and Wolfram Fenske.
A Tree-Based Approach to Support Refactoring in Multi-Language
Software Applications.
In International Conference on Advances and Trends in Software
Engineering (SOFTENG), pages 44–49. IARIA, February
2016.
2015
- Gunter Saake, David Broneske, Sebastian
Dorok, and Andreas Meister, editors.
Proceedings of the 27th GI-Workshop
Grundlagen von Datenbanken, volume 1366 of GvDB,
Germany, March 2015. CEUR.
- David
Broneske.
Adaptive Reprogramming for
Databases on Heterogeneous Processors.
In SIGMOD/PODS Ph.D. Symposium. ACM, 2015.
- Marcus Pinnecke, David Broneske, and
Gunter Saake.
Toward GPU
Accelerated Data Stream Processing.
In Proceedings of the 27th GI-Workshop Grundlagen von Datenbanken,
Gommern, Germany, May 26-29, 2015., pages 78–83,
2015.
- Veit Köppen, David Broneske, Gunter
Saake, and Martin Schäler.
Elf: A Main-Memory Structure for
Efficient Multi-Dimensional Range and Partial Match Queries.
Technical Report 002-2015, Otto-von-Guericke-University Magdeburg, Magdeburg,
#dec# 2015.
(PDF)
2014
- David Broneske, Sebastian Dorok, Veit
Köppen, and Andreas Meister.
Software Design
Approaches for Mastering Variability in Database Systems.
In GvD, volume 1313 of CEUR Workshop Proceedings,
pages 47–52, October 2014.
(PDF)
- David Broneske, Sebastian Breß, Max
Heimel, and Gunter Saake.
Toward
Hardware-Sensitive Database Operations.
In Proceedings of the 17th International Conference on Extending Database
Technology (EDBT), pages 229–234. OpenProceedings.org,
2014.
- David Broneske, Sebastian Breß, and
Gunter Saake.
Database Scan Variants on Modern CPUs: A Performance Study.
In Proceedings of the 2nd International Workshop on In-Memory Data
Management and Analytics (IMDM), Lecture Notes in Computer Science,
pages 97–111. Springer, 2014.
2013
- David Broneske.
On the Impact of Hardware on Relational Join
Processing.
Master thesis, University of Magdeburg, Germany, August
2013.
- David Broneske, Martin Schäler, and
Alexander Grebhahn.
Extending an Index-Benchmarking Framework with Non-Invasive
Visualization Capability.
In Workshop on Information Systems in Digital Engineering (ISDE),
BTW-Workshops, pages 151–160. Köllen-Verlag,
2013.
2012
- David Broneske.
Visuelle Analyse der Raumaufteilung und Bucketauslastung
von permutationsbasierten Indexverfahren.
Bachelor thesis, University of Magdeburg, Germany, April 2012.
In German.
- Alexander Grebhahn, David Broneske,
Martin Schäler, Reimar Schröter, Veit Köppen, and Gunter Saake.
Challenges in
finding an appropriate multi-dimensional index structure with respect to
specific use cases.
In Ingo Schmitt, Sascha Saretz, and Marcel Zierenberg, editors,
Proceedings of the 24th GI-Workshop "Grundlagen von Datenbanken
2012", pages 77–82. CEUR-WS, 2012.
urn:nbn:de:0074-850-4.
- David Broneske, Denis Dietze, Maik
Lampe, and Andreas Meier.
Vergleich von Indexverfahren
für hochdimensionale Datenräume.
In Techniken zur forensischen Datenhaltung, volume 1 of
Ausgewählte studentische Beiträge (AsB), pages 1 – 12.
Fakultät für Informatik, Otto-von-Guericke-Universität Magdeburg,
2012.
misc
- Daniel Walke, Daniel Steinbach,
Sebastian Gibb, Thorsten Kaiser, Paul Ahrens, Gunter Saake, David Broneske,
and Robert Heyer.
Edges
are all you need: Potential of Medical Time Series Analysis with Graph Neural
Networks..
Currently only a pre-print.
Betreute Arbeiten
2024
- Sunil Jaipal Ghadwal.
Pipeline for Automated Speaker-Attributed Video
Transcription.
Master's thesis, University of Magdeburg, 2024.
2023
- Sebastian Kittan.
Analyzing Software Evolution Datasets and Their Use
Cases.
Master's thesis, University of Magdeburg, March 2023.
- Prasanth Vaidya Karanam.
Occupation Coding Using a Pretrained Language
Model by Integrating Domain Knowledge.
Master's thesis, University of Magdeburg, March 2023.
- Shadrack Akhidenor.
Development of a User Friendly Web Application for Survey Questionnaire
Database.
Master's thesis, University of Magdeburg, July 2023.
- Pawan
Joshi.
A Study of Keyword and Keyphrase Extraction Techniques for Quantitative
Social Science Surveys.
Master's thesis, University of Magdeburg, January 2023.
- Vinaykumar Reddy Yadavelli.
VIZ-A Web Application for Data Visualization.
Master's thesis, University of Magdeburg, September
2023.
2022
- Nathan Kumar Chikkam.
Design and implementation of backend web architecture for DZHW data
portal visualizations.
Master's thesis, University of Magdeburg, December 2022.
- Aditya.
Query-Analysis on Git-Attributes in Relational and
Graph-DB.
Master's thesis, University of Magdeburg, March 2022.
- Paul Blockhaus.
A Framework for Adaptive Reprogramming Using a
JIT-Compiled Domain Specific Language for Query Execution.
Master's thesis, University of Magdeburg, March 2022.
- Kurian
John.
Designing a Database Schema for Survey
Questions.
Master's thesis, University of Magdeburg, March 2022.
- Baizil Mulakkampilly Devassy.
Desigining a Database Schema for Survey Data.
Master's thesis, University of Magdeburg, April 2022.
- Sajad
Karim.
Supplementing a Modern Storage Engine with Non-volatile
Memory.
Master thesis, University of Magdeburg, 2022.
2021
- Vincent Toulouse.
Slide-recommendation for improving students SQL solutions using natural
language processing.
Bachelor thesis, University of Magdeburg, September
2021.
- Christian Harnisch.
Ein tutorial für das Lehrtool SQL Validator.
Bachelor thesis, OVGU, December 2021.
- Nikhil Mandya Parashivamurthy.
Forecast of Gap Year in a Student’s Education and the Factors
Contributing to It.
Master's thesis, University of Magdeburg, July 2021.
- Felix Schmekel.
Redesign des mobilen Geoinformationssystems – SAGis Mobil
App.
Bachelor thesis, University of Magdeburg, 2021.
2020
- Saagar Gaikwad.
Predicting bond prices using regression and neural network
techniques.
Master's thesis, University of Magdeburg, May 2020.
- Kai
Wolf.
Datenparallele Selektionen auf der
multidimensionalen Indexstruktur Elf.
Master's thesis, University of Magdeburg, February 2020.
(PDF)
- Mahmoud Mohsen.
FPGA-Accelerated Compression of Integer Vectors.
Master's thesis, University of Magdeburg, March 2020.
- Jasper Orschulko.
Designing a Schema Language for Columnar Binary JSON (CARBON)
Files.
Bachelor thesis, University of Magdeburg, August 2020.
- Marcel Plumbohm.
A Comparative Benchmark for Binary JSON Formats.
Master's thesis, University of Magdeburg, October 2020.
- Huanqing Shang.
Level Order Linearization for the Elf
Approach.
Master's thesis, University of Magdeburg, November 2020.
(PDF)
- Steven Schulze.
Fast Parsing of NDJSON Files in Main Memory
Databases.
Bachelor thesis, University of Magdeburg, August 2020.
- Saidi Reddy Vummadi.
Evaluation of GPU based Segmented Scans.
Master's thesis, University of Magdeburg, January 2020.
2019
- Dominik and Patrick Schön.
Entscheidungsunterstützung im Handeln mit Anleihen.
Master's thesis, University of Magdeburg, March 2019.
- Paul Blockhaus.
Parallelizing the Elf - A Task Parallel
Approach.
Bachelor thesis, University of Magdeburg, December 2019.
(PDF)
- Prashanth kumar Pavuluri.
Usage of Machine Learning at CERT.
Master's thesis, University of Magdeburg, January 2019.
- Ulrike Sprengel.
Konzeption und Integration einer
Beauftragungsübersicht in ein bestehendes
Qualitätsmanagementsystem.
Bachelor thesis, University of Magdeburg, November 2019.
2018
- Rudi Bikschentajew.
Evaluierung der Effizienz einer semi-virtuellen
Data Warehouse Architektur im Vergleich zu einem multidimensionalen Datenwu
̈rfel im Hinblick auf Volumen.
Master's thesis, University of Magdeburg, October 2018.
- Florian Bethe.
Elf meets MonetDB: Integrating a multi-column
structure into a column store.
Master's thesis, University of Magdeburg, June 2018.
Master Thesis.
(PDF)
2017
- Bala Gurumurthy.
Analysis of Hashing Techniques for
Efficient Group-Based Aggregation.
Master's thesis, University of Magdeburg, September 2017.
(PDF)
- Jan Schumacher.
Live-Video-Streaming in mobile Netzwerken.
Master's thesis, University of Magdeburg, September
2017.
- Gabriel Campero.
Best Practices for Developing Graph Database
Applications: A Case Study Using Apache Titan.
Master thesis, University of Magdeburg, Germany, January
2017.
- Lars-Christian Schulz.
Searching in Sorted Lists on Modern
Processors.
Bachelor thesis, University of Magdeburg, 2017.
(PDF)
2016
- Mudit Bhatnagar.
Processing OLTP Workloads on Hybrid CPU/GPU
Systems.
Master thesis, University of Magdeburg, November 2016.
- Artur Sitnikov.
Optimizations for Massively Parallel Sort-Merge
Join.
Bachelor thesis, University of Magdeburg, Germany, June
2016.
2015
- Jan Düwel.
Parallelisierung in Query Compilern mit
Lightweight-Modular-Staging.
Master thesis, University of Magdeburg, Germany, December 2015.
In German.
(PDF)
- Molham Kindakli.
Design and Implementation of an Efficient Approach for
Custom-fields and Formulas with SAP HANA.
Master thesis, University of Magdeburg, Germany, August
2015.
- Christian Steusloff and Jens Wiemann.
Machbarkeitsanalyse einer
Workflow-Automatisierung am Beispiel eines spezifischen
Kundenauftrages.
Bachelor thesis, University of Magdeburg, Germany, June 2015.
In German.
- Vinod Chelladurai.
Performance Impacts of Different Code
Optimizations for the Radix Join.
Master thesis, University of Magdeburg, Germany, February 2015.
(PDF)
2014
- Marco Holzknecht.
Workload-basierte heuristische Optimierung von
Data-Warehouse-Konfigurationen.
Master thesis, University of Magdeburg, Germany, July 2014.
In German.
- Steffen Schulze.
Konzept zur effizienten Datenanalyse auf Basis
feingranularer Änderungserkennung am Beispiel von
MinD.banker.
Bachelor thesis, University of Magdeburg, Germany, April 2014.
In German.
- Modern hardware
- Hardware sensitivity for databases
- Variability in databases
- Software product lines
- Multi-dimensional index structures