1. Pre-Processing

Der Baustein Pre-Processing ist der Startpunkt jeder Migration. Er legt die Basis für alle weiteren Schritte, indem er die Legacy-Applikation nicht nur technisch initialisiert, sondern auch inhaltlich tiefgreifend analysiert. Die hier erzeugten Artefakte (Wissensgraph, Dokumentation, Testfälle) bilden die inhaltliche Grundlage für die KI-Agenten in der nachfolgenden Transformationsphase.

Modul 1: Initialization & Setup

Dieses Modul schafft die technische Arbeitsumgebung. Bevor eine Zeile Code analysiert wird, muss sichergestellt sein, dass die Infrastruktur stabil steht.

Kernfunktionen

Setup Prerequisites & Project Structure Erstellung der standardisierten Verzeichnisstruktur (/workspace, /target) und Konfiguration der Projektparameter. Hier werden Environment-Variablen geladen und Schreibrechte für die Container geprüft.
Initialize Agentic Coding System Der KI-Kern (OpenCode.ai) wird hochgefahren. Dies umfasst den Verbindungsaufbau zu den LLM-Endpunkten (via LiteLLM) und die Initialisierung der internen Agenten-Datenbanken.
Check Infrastructure Health Ein automatisierter Health-Check prüft vor Start alle kritischen Ressourcen:
- Ist die Vektordatenbank (Qdrant) erreichbar?
- Läuft der Graph-Datenbank-Service (Neo4j)?
- Sind die notwendigen Docker-Volumes gemountet?

Modul 2: Application Overview & Analysis

Hier findet die eigentliche "Intelligenz-Arbeit" statt. Die Legacy-Applikation wird von spezialisierten Analysten-Agenten untersucht, um deren Logik für Maschinen verständlich zu machen.

Kernfunktionen

AI-generated Documentation Erstellung einer technischen "Ist-Stand"-Dokumentation. Die Agenten scannen den Quellcode (z. B. VBA-Module, Excel-Formeln), extrahieren die Geschäftslogik und fassen diese in einer ANALYSIS.md zusammen. Dies dient als Orientierungshilfe für Entwickler und nachfolgende Agenten.
Test Use Case Generation Extraktion von validen Testszenarien aus den Bestandsdaten. Das System identifiziert typische Eingabe-Ausgabe-Muster in der Legacy-Applikation, um diese später als Akzeptanzkriterien für die modernisierte App zu nutzen (Regression Testing).
GraphRAG Generation Aufbau des kontextuellen Gedächtnisses.
- Graph: Abbildung der Aufrufstrukturen und Abhängigkeiten in Neo4j (Wer ruft wen auf?).
- RAG: Vektorisierung von Code-Schnipseln und Kommentaren in Qdrant.
- Ziel: Ermöglicht den Coder-Agenten später komplexe Fragen zu beantworten wie: "Welche Auswirkung hat die Änderung dieser Variable auf das Gesamtmodul?"

Übersicht der Pre-Processing Kernfunktionen

ℹ️ Hinweis: Die hier erzeugten Artefakte sind die direkte Eingabe für den Processing-Baustein. Ohne sauberes Pre-Processing können die Agenten im nächsten Schritt nicht kontextsensitiv arbeiten.