1. Pre-Processing
Der Baustein Pre-Processing ist der Startpunkt jeder Migration. Er legt die Basis für alle weiteren Schritte, indem er die Legacy-Applikation nicht nur technisch initialisiert, sondern auch inhaltlich tiefgreifend analysiert. Die hier erzeugten Artefakte (Wissensgraph, Dokumentation, Testfälle) bilden die inhaltliche Grundlage für die KI-Agenten in der nachfolgenden Transformationsphase.
Modul 1: Initialization & Setup
Dieses Modul schafft die technische Arbeitsumgebung. Bevor eine Zeile Code analysiert wird, muss sichergestellt sein, dass die Infrastruktur stabil steht.
Kernfunktionen
-
Setup Prerequisites & Project Structure Erstellung der standardisierten Verzeichnisstruktur (
/workspace,/target) und Konfiguration der Projektparameter. Hier werden Environment-Variablen geladen und Schreibrechte für die Container geprüft. -
Initialize Agentic Coding System Der KI-Kern (OpenCode.ai) wird hochgefahren. Dies umfasst den Verbindungsaufbau zu den LLM-Endpunkten (via LiteLLM) und die Initialisierung der internen Agenten-Datenbanken.
-
Check Infrastructure Health Ein automatisierter
Health-Checkprüft vor Start alle kritischen Ressourcen:- Ist die Vektordatenbank (Qdrant) erreichbar?
- Läuft der Graph-Datenbank-Service (Neo4j)?
- Sind die notwendigen Docker-Volumes gemountet?
Modul 2: Application Overview & Analysis
Hier findet die eigentliche "Intelligenz-Arbeit" statt. Die Legacy-Applikation wird von spezialisierten Analysten-Agenten untersucht, um deren Logik für Maschinen verständlich zu machen.
Kernfunktionen
-
AI-generated Documentation Erstellung einer technischen "Ist-Stand"-Dokumentation. Die Agenten scannen den Quellcode (z. B. VBA-Module, Excel-Formeln), extrahieren die Geschäftslogik und fassen diese in einer
ANALYSIS.mdzusammen. Dies dient als Orientierungshilfe für Entwickler und nachfolgende Agenten. -
Test Use Case Generation Extraktion von validen Testszenarien aus den Bestandsdaten. Das System identifiziert typische Eingabe-Ausgabe-Muster in der Legacy-Applikation, um diese später als Akzeptanzkriterien für die modernisierte App zu nutzen (Regression Testing).
-
GraphRAG Generation Aufbau des kontextuellen Gedächtnisses.
- Graph: Abbildung der Aufrufstrukturen und Abhängigkeiten in Neo4j (Wer ruft wen auf?).
- RAG: Vektorisierung von Code-Schnipseln und Kommentaren in Qdrant.
- Ziel: Ermöglicht den Coder-Agenten später komplexe Fragen zu beantworten wie: "Welche Auswirkung hat die Änderung dieser Variable auf das Gesamtmodul?"

ℹ️ Hinweis: Die hier erzeugten Artefakte sind die direkte Eingabe für den Processing-Baustein. Ohne sauberes Pre-Processing können die Agenten im nächsten Schritt nicht kontextsensitiv arbeiten.