WJW Analytics Plattform

Das Problem
Der Kunde muss analoge Akten und technische Zeichnungen aus Papier- und Mikrofiche-Beständen digitalisieren und strukturiert archivieren. Neben der reinen Digitalisierung ist eine automatisierte Texterkennung sowie eine durchsuchbare und auswertbare Datenablage erforderlich.
Die Lösung
Es wurde eine containerisierte Full-Stack-Plattform entwickelt, die den gesamten Prozess von der Dokumentenerfassung über OCR-basierte Textextraktion bis zur strukturierten Speicherung abbildet. Das Backend basiert auf FastAPI und übernimmt Dokumentenverarbeitung, Texterkennung, automatische Inhaltsextraktion sowie die persistente Ablage in Datenbank und Dateisystem. Ergänzend kommt eine KI-gestützte Analyse mit Vektor-Datenbank zum Einsatz, die semantische Suche und Dokumentenvergleiche ermöglicht. Das Angular-Frontend bietet eine benutzerfreundliche Oberfläche zur Projektverwaltung, zum Upload ganzer Ordnerstrukturen, zur Echtzeit-Überwachung des OCR-Status sowie zur Prüfung, Bearbeitung und zum Export der Ergebnisse.
TechStack
FastAPI
Python
SQLAlchemy
SQLite
ChromaDB
Docker

