Plattformvergleich
Die Referenzarchitektur orientiert sich am Open-Source-Ansatz. Die nachfolgend aufgeführten kommerziellen Plattformen wurden einbezogen, um ihre Interoperabilität zu prüfen. Perspektivisch wird die Gegenüberstellung um weitere Lösungen – wie etwa Langdock oder aiXplain – erweitert.
Ziel dieser Dokumentation ist der Vergleich zweier führender GenAI-Plattformen – Deepset AI und Aleph Alpha (PhariaAI) – hinsichtlich ihrer Fähigkeit, die detaillierten architektonischen und funktionalen Anforderungen des öffentlichen Verwaltungssektors zu erfüllen.
Die zentrale Forschungsfrage lautet: Inwieweit erfüllen die Plattformen Deepset AI und Aleph Alpha (PhariaAI) die wichtigsten architektonischen, funktionalen und Sicherheitsanforderungen (z. B. Modularität, digitale Souveränität, RAG, Halluzinationsvermeidung), die für die Implementierung horizontaler und vertikaler Anwendungsfälle in der öffentlichen Verwaltung erforderlich sind?
Methodik
Der Vergleich wurde mittels einer analytischen Methode durchgeführt, basierend auf der Bewertung der Konformität beider Plattformen mit einer definierten Anforderungsmatrix für die öffentliche Verwaltung.
Datenquellen und Bewertungsprozess:
Die Vergleichstabelle wurde auf Grundlage der Analyse von öffentlich zugänglicher Dokumentation, Online-Schulungen und Gesprächen mit den Owners der Plattformen erstellt. Die Bewertung umfasste eine breite Palette von Kriterien, von allgemeinen architektonischen Anforderungen (wie Skalierbarkeit, Flexibilität und On-Premises-Betrieb) bis hin zu spezifischen Anwendungsfunktionen (einschließlich intelligenter Dokumentenverarbeitung, virtueller Assistenten, Textgenerierung und -analyse) und den wichtigsten Sicherheitsanforderungen (OWASP).
Plattformen
Der Vergleich berücksichtigt zwei führende GenAI-Plattformen, die umfassende Lösungen für Unternehmen und regulierte Institutionen anbieten:
Deepset AI
Deepset AI ist ein deutsches Unternehmen aus Berlin, das sich auf Enterprise-NLP- und KI-Lösungen spezialisiert hat, die hohe Anforderungen an Genauigkeit, Kontrolle und Datenschutz erfüllen.
- Kernprodukt: Haystack, ein Open-Source-Framework zur Erstellung von Anwendungen wie semantischer Suche, Retrieval Augmented Generation (RAG) und Frage-Antwort-Systemen.
- Enterprise-Plattform: Die deepset AI Platform (auch deepset Cloud genannt) ist eine vollständig gemanagte Lösung zur schnellen Entwicklung, Bereitstellung und Überwachung von KI-Anwendungen.
- Architektur: Die Plattform basiert auf modularen Pipelines, Template-basierten Workflows und unterstützt verschiedene LLM-Modelle.
- Prioritäten: Deepset legt besonderen Wert auf Transparenz, flexible Deployment-Optionen (z. B. Cloud, VPC oder On-Premise) und die Einhaltung von Compliance- und Sicherheitsstandards.
Aleph Alpha (PhariaAI)
PhariaAI ist eine vollständige Generative-AI-Suite des deutschen Unternehmens Aleph Alpha, deren Ziel es ist, eine souveräne, kontrollierte und regulierungskonforme Plattform für Institutionen und Unternehmen bereitzustellen.
- Komponenten: Die Suite besteht aus Schlüsselkomponenten wie PhariaAssistant (Endbenutzerportal), PhariaStudio (Tools für KI-Ingenieure), PhariaOS (Infrastrukturmanagement) und PhariaCatch (Daten- und Feedbackschleifen, geplant - derzeit noch nicht verfügbar).
- Modelle: Es werden eigene, proprietäre Modelle „Pharia-1-LLM“ (z. B. 7B Kontroll-Modelle) verwendet, die für präzise Antworten und zusätzliche Sicherheitsvorkehrungen (control-aligned) optimiert sind.
- Souveränität: Im Fokus stehen Daten- und System-Souveränität, was durch Auditierbarkeit, Erklärbarkeit (Explainability) sowie die Unterstützung hybrider Bereitstellung (On-Premise und Cloud) umgesetzt wird.
Ergebnisse
Die Analyse der Vergleichsmatrix zeigt, dass sowohl die deepset AI Platform als auch Aleph Alpha (PhariaAI) die meisten Kernanforderungen des öffentlichen Verwaltungssektors erfüllen, insbesondere hinsichtlich der architektonischen Leitlinien und der funktionalen Anforderungen im Bereich der Textverarbeitung (Natural Language Processing – NLP).
Kernarchitektur und Modularität:
Beide Plattformen erfüllen die hohen Anforderungen an Modularität und serviceorientierte Architektur. Sie ermöglichen die Entwicklung horizontaler und vertikaler Anwendungsfälle sowie hohe Skalierbarkeit und Flexibilität durch die Kapselung technischer Implementierungen. Deepset AI erreicht dies durch das zugrundeliegende Open-Source-Framework Haystack und modulare Pipelines, während PhariaAI auf einer Kubernetes-basierten Microservices-Architektur (PhariaKernel, PhariaOS) aufbaut.
Digitale Souveränität und Open Source:
Die Anforderungen an die digitale Souveränität werden von beiden Plattformen durch die Unterstützung des On-Premises-Betriebs erfüllt. Die deepset AI Platform, obwohl ein Cloud-Angebot, ermöglicht die Speicherung sensibler Daten in der privaten VPC des Benutzers. Aleph Alpha (PhariaAI) ist explizit als souveräne Lösung für den On-Premises-Betrieb konzipiert. Hinsichtlich der Forderung, die Plattform selbst als Open Source bereitzustellen, erfüllen beide Lösungen diese Anforderung auf Produktebene nicht vollständig. Allerdings stellt Deepset mit dem Open-Source-Framework Haystack eine referenzierbare, vollständig offene Kernarchitektur bereit, während PhariaAI vor allem proprietäre, aber „source-open“ Modelle (Pharia‑1‑LLM) und ausgewählte Open-Source-Komponenten anbietet.
Kernfunktionen (RAG und Halluzinationsvermeidung):
Beide Plattformen stellen zentrale RAG-Systeme (Retrieval Augmented Generation) bereit, die für die dokumentorientierte Arbeit in der Verwaltung entscheidend sind. Strategien zur Vermeidung von Halluzinationen sind ebenfalls integriert: Deepset AI durch Groundedness Score Monitoring und Quellenreferenzen, und PhariaAI durch sicherheitsoptimierte und "control-aligned" Modelle sowie Evaluierungstools.
Spezialisierte und Multimedia-Funktionen:
Im Bereich der Textgenerierung und -analyse (Zusammenfassen, Übersetzen, Paraphrasieren, Recherche) erzielen beide Plattformen hohe Punktzahlen. Deepset AI orchestriert über Integrationen (z. B. Vertex AI) Funktionen zur Bilderzeugung und -beschreibung und erfüllt damit einen Großteil der bildbezogenen Anforderungen. Bei PhariaAI sind Bildfunktionen in der aktuell dokumentierten Standardfunktionalität nur teilweise abgedeckt; laut Anbieter stehen inzwischen multimodale Modelle zur Verfügung, die Bildverarbeitung grundsätzlich ermöglichen, weitere spezialisierte Funktionen (z. B. Anomalie-Erkennung) befinden sich jedoch noch im Ausbau. Beide Plattformen unterstützen die Spracherkennung (Audio zu Text).
Sicherheitsanforderungen (OWASP):
Die zentralen OWASP-Risiken wie Prompt Injection und die Offenlegung sensibler Informationen werden von beiden Plattformen adressiert. PhariaAI hebt die Datensouveränität hervor, indem keine Prompt-Daten oder PII (Persönlich identifizierbare Informationen) protokolliert werden, während Deepset AI auf RBAC (Role-Based Access Control) und sichere Speicherung von Secrets setzt. Aleph Alpha bietet zudem eine Funktion zur Überwachung des Token-Verbrauchs, die Deepset in seiner Enterprise-Version nicht direkt integriert hat.
Chat-Frontend und Benutzerverwaltung:
Beide bieten benutzerfreundliche Web-Frontends und unterstützen die Persistenz von Chat-Verläufen. Sowohl die deepset AI Platform als auch Aleph Alpha (PhariaAI) ermöglichen die Anbindung externer Identity Provider (z. B. SSO/Keycloak); PhariaAI integriert diese Funktionen als Teil einer durchgängigen Suite (PhariaIAM, Zitadel-Integration), während Deepset auf externe Anbieter wie Auth0 setzt und damit verschiedene IDPs unterstützt. PhariaAI hat zudem einen Vorteil in der Barrierefreiheit, da entsprechende Anforderungen bereits nachweislich erfüllt sind, während für Deepset AI in der Dokumentation derzeit keine explizite Konformität ausgewiesen ist.
Fazit und Ausblick
Schlussfolgerung
Beide untersuchten Plattformen, deepset AI und Aleph Alpha (PhariaAI), sind technisch in der Lage, die Mehrheit der kritischen architektonischen, funktionalen und Sicherheitsanforderungen für die Implementierung horizontaler und vertikaler KI-Anwendungsfälle in der öffentlichen Verwaltung zu erfüllen.
Deepset AI sticht durch seine modulare, modellagnostische Architektur hervor, die auf dem bewährten Open-Source-Framework Haystack basiert. Dies gewährleistet eine hohe Flexibilität beim Austausch von LLMs und Komponenten, was für zukünftige technologische Entwicklungen in der KI von Vorteil ist. Darüber hinaus bietet Deepset AI durch Integrationen Lösungen für spezialisierte Multimedia-Funktionen wie Bilderzeugung.
Aleph Alpha (PhariaAI) bietet eine durchgängig souveräne, regulierungskonforme Suite, die speziell auf die hohen Anforderungen regulierter Institutionen zugeschnitten ist. Die Verwendung eigener, "control-aligned" LLM-Modelle (Pharia-1-LLM) und die starke Betonung von Erklärbarkeit (Explainability) und Auditierbarkeit sind besonders relevant für Bereiche mit strikten Compliance-Anforderungen. PhariaAI bietet zudem Vorteile bei der Integration in bestehende IT-Infrastrukturen durch nativen IDP-Support und eine integrierte Überwachung des Token-Verbrauchs.
Die Entscheidung zwischen den beiden Plattformen hängt letztendlich von der Priorisierung der Verwaltung ab:
- Wenn die Priorität auf maximaler Offenheit, Modellflexibilität und der Nutzung einer breiten Open-Source-Basis liegt, bietet die deepset AI Platform aufgrund ihres Haystack-Fundaments die flexiblere Basis.
- Wenn die Priorität auf maximaler Daten- und System-Souveränität, On-Premises-Betrieb und kontrollierter Modellleistung liegt, ist die PhariaAI-Suite die dezidiertere Lösung.
Empfehlungen für weitere Analysen
- Praktische Penetrationstests für Sicherheitsfunktionen
- Detaillierte Integration mit bestehenden Verwaltungssystemen
- Bewertung der Total Cost of Ownership für beide Lösungen
- Pilotprojekte in spezifischen Verwaltungsbereichen
Vergleichstabelle
Die Tabelle listet einen umfassenden Katalog von Anforderungen für die Entwicklung und den Betrieb einer KI-Plattform für die öffentliche Verwaltung auf. Die Anforderungen sind in verschiedene Kategorien gegliedert, darunter allgemeine Vorgaben, architektonische Leitlinien, funktionale Fähigkeiten, Sicherheitsaspekte und Spezifikationen für die Benutzeroberfläche.
| ID | Kategorie | Anforderung | Beschreibung |
|---|---|---|---|
| AA1 | Allgemeine Anforderungen | Horizontale Use-Cases | Die Entwicklung, die Integration und der Betrieb von horizontalen (Gen)AI Use Cases für die öffentliche Verwaltung zu muss möglich sein. Horizontale Use Cases sind solche, die von der Mehrheit der Mitarbeitenden genutzt werden (bspw. allgemeine Verwaltungsaufgaben, wie das Bearbeiten von Bürgeranfragen, oder das Erstellen von Vermerken). |
| AA2 | Allgemeine Anforderungen | Vertikale Use-Cases | Die Entwicklung, die Integration und der Betrieb von vertikalen (Gen)AI Use Cases für die öffentliche Verwaltung zu muss möglich sein. Vertikale Use Cases hingegen betreffen spezielle fachliche Bereiche, dessen Benutzerkreis eingeschränkt ist. |
| AA3 | Allgemeine Anforderungen | Web-Frontend | Die bereitgestellten KI-Services müssen für die Mitarbeitenden über ein Web Frontend aufrufbar sein. |
| AA4 | Allgemeine Anforderungen | Office-Plugins | Die KI-Services müssen zusätzlich auch über Plugins in vorhandenen Office-Anwendungen, inklusive E-Mail-Anwendung verfügbar sein. |
| AA5 | Allgemeine Anforderungen | Zugriff über Fachverfahren | Ergänzend erfordern insbesondere vertikale Use Cases den Zugriff der erforderlichen KI-Services über das Fachverfahren selbst. |
| AA6 | Allgemeine Anforderungen | geringe Inferenzzeiten | geringe Inferenzzeiten |
| AA7 | Allgemeine Anforderungen | hohe Skalierbarkeit | hohe Skalierbarkeit |
| AA8 | Allgemeine Anforderungen | Flexibilität | Flexibilität |
| AA9 | Allgemeine Anforderungen | Lose Kopplung einzelner Komponenten | Die Architektur muss erlauben, jede Komponente unabhängig voneinander zu betreiben, was zukünftige technologische Entwicklungen und den Austausch von Modulen durch leistungsfähigere Lösungen erleichtert. |
| AA10 | Allgemeine Anforderungen | Open-Source-Technologien (Plattform) | Im Sinne der digitalen Souveränität wird ein weiterer Fokus auf die Nutzung von Open-Source-Technologien sowie auf die Plattform selbst als Open-Source gelegt. |
| AA11 | Allgemeine Anforderungen | Modularität und Wiederverwendbarkeit | Modularität und Wiederverwendbarkeit bilden das Grundprinzip bei der Implementierung horizontaler und vertikaler Use Cases. Die Plattform soll es ermöglichen, dass diese aus bereits bestehenden oder neuen Komponenten zusammengebaut werden können. Ist ein Use Case einmal implementiert, kann er von anderen Benutzern der Plattform über einen "Use Case Shop" im Rahmen von Open Source angepasst und wiederverwendet werden. |
| LL1 | Leitlinien der KI-Architektur | Modularisierung und Service-orientierte | Ein wesentliches Merkmal der KI-Plattform für die öffentliche Verwaltung ist die Austauschfähigkeit einzelner Komponenten mit dem Ziel, technische Weiterentwicklungen im Bereich der Künstlichen Intelligenz zeitnah und mit vertretbarem Aufwand zu berücksichtigen und integrieren zu können. Die damit einhergehende Modularisierung trägt dazu bei, dass Komponenten autark voneinander entwickelt werden können. Dies setzt verbindliche Vorgaben auf der Ebene der Makro-Architektur voraus. |
| LL2 | Leitlinien der KI-Architektur | Erweiterbarkeit | Durch standardisierte Schnittstellen, einer konsequenten Microservices-Architektur und verbindlichen Architekturvorgaben soll die Erweiterbarkeit der KI-Plattform nicht nur durch die Implementierung zusätzlicher Use Cases garantiert werden, sondern auch neue, diesen Use Cases zugrunde liegende Funktionen, erfolgen können. |
| LL3 | Leitlinien der KI-Architektur | Nutzung von Open Source-Komponenten | Die KI-Plattform für die öffentliche Verwaltung setzt vorrangig auf Open Source-Komponenten und profitiert damit von den stetigen Weiterentwicklungen im KI-Umfeld. Gleichzeitig stellt sie sicher, dass Ressourcen für den Aufbau der KI-Plattform effizient eingesetzt werden und redundante Entwicklungen ohne maßgeblichen qualitativen Vorteil vermieden werden. |
| LL4 | Leitlinien der KI-Architektur | Bereitstellung als Open Source-Software | Nach dem "Einer-für-Alle"-Prinzip (EfA-Prinzip) zielen sowohl die Konzeption der KI-Architektur für die öffentliche Verwaltung als auch die zugehörige Referenzimplementierung darauf ab, eine transparente Diskussionsgrundlage und technische Grundlage für KI-Kernfunktionen allgemein zur Verfügung zu stellen. Erweiterungen und Verbesserungen an der Architektur und Implementierung sollen in die Weiterentwicklung einfließen. |
| LL5 | Leitlinien der KI-Architektur | Zentrales RAG-System | Aufgrund der starken dokumentorientierten Arbeitsweise in der öffentlichen Verwaltung ist ein grundlegendes Element der KI-Plattform ein zentrales RAG-System. Hierzu sollen vorrangig Open Source-Komponenten zum Einsatz kommen, die einen vertrauenswürdigen Umgang mit Dokumenten der öffentlichen Verwaltung ermöglichen. |
| LL6 | Leitlinien der KI-Architektur | Kapselung | Zusätzliche Abstraktionsebenen sorgen für eine Kapselung technischer Implementierungen und ermöglichen den parallelen Einsatz unterschiedlicher Lösungen. Dies gewährleistet die technische Unabhängigkeit der KI-Plattform von einzelnen Implementierungen. |
| LL7 | Leitlinien der KI-Architektur | Verwendung von Open Source KI-Modellen | Ein wesentliches Merkmal der KI-Plattform für die öffentliche Verwaltung ist die Unabhängigkeit von externen Cloud-Angeboten. In diesem Sinne setzt sie auf die Verwendung qualitativ hochwertiger Modelle auf Basis eines Open-Source-Lizenzmodells. |
| LL8 | Leitlinien der KI-Architektur | On-Premises-Betrieb | Die KI-Plattform der öffentlichen Verwaltung ist darauf ausgerichtet, On-Premises auf eigenen Servern betrieben zu werden. Dies erlaubt die eigenständige Verarbeitung sensibler Daten innerhalb der eigenen Rechenzentrums und wahrt die digitale Souveränität beim Einsatz von KI. |
| LL9 | Leitlinien der KI-Architektur | Mandantenfähigkeit | Eine Trennung nach unterschiedlichen Organisationen bzw. Organisationseinheiten stellt sicher, dass Zugriffe ausschließlich im vorgegebenen Rahmen erfolgen können. |
| LL10 | Leitlinien der KI-Architektur | Nutzerverwaltung, Rollen und Berechtigungen | Durch die Berücksichtigung von Rollen und Berechtigungen auf Nutzerebene sind individuelle Funktionen und Anpassungen möglich (Benutzerprofil). Darüber hinaus lässt sich eine Abgrenzung der Zugriffsberechtigungen vornehmen. Bei der Anbindung von Systemen bzw. der Überführung von Daten bleiben an dieser Stelle bereits definierte Berechtigungen erhalten. |
| LL11 | Leitlinien der KI-Architektur | Usage | Bei der Verwendung von LLM-Aufrufen muss der Token-Verbrauch überwacht werden können, um einen unbeabsichtigt oder beabsichtigt hohen Verbrauch einschränken zu können. Der Token-Verbrauch kann auch als Abrechnungs- bzw. Verrechnungsmodell genutzt werden. |
| LL12 | Leitlinien der KI-Architektur | Vermeidung/Reduzierung von Halluzination | Zusammengesetzte KI-Anwendung, welche auf LLMs als zentrale Bestandteile setzen unterliegen der Statistik der zugrundeliegenden LLMs. Diese sind "next-word-predictor" und damit ist Halluzination ein wesentliches Merkmal, das man durch geeignete Mechanismen kontrollieren kann. Halluzination tritt auf verschiedene Weisen in Kraft: Der Prompt liegt "out-of-distribution", er beinhaltet im Training nicht gesehene Tokens und das LLM kann auf Basis seines Fakten-basierten Wissen keine sinnvolle (gültige) Prognose für ein nächstes Wort treffen und driftet in eine Pfad-Abhängigkeit ab, die wir dann als Halluzination wahrnehmen. Ziel der Plattform ist es Vermeidungsstrategien gegen Halluzination bereitzustellen. |
| FA1 | Automatisierung und Prozessoptimierung | Intelligente Verwaltungs- und Sachbearbeitung | Bei der KI-gestützten Bearbeitung von standardisierten und wiederkehrenden Vorgängen wie beispielsweise Antragsverfahren, Genehmigungen und Bescheiden werden automatisch relevante Daten aus eingehenden Formularen und Dokumenten extrahiert und auf Vollständigkeit, Richtigkeit und Konsistenz geprüft. Technologien: Optical Character Recognition (OCR), Natural Language Processing (NLP), Machine Learning (ML) |
| FA2 | Automatisierung und Prozessoptimierung | Automatisierte Formularverarbeitung | Es erfolgt eine KI-basierte Klassifizierung der eingehenden Formulare und Anträge (z. B. Baugenehmigung, Wohngeldantrag) sowie ein automatisiertes Routing an die zu bearbeitende Stelle bzw. Person. Technologien: Modelle für Named Entity Recognition (NER), ML-basierte Textklassifizierung, Regelbasierte Systeme (in Kombination mit KI) |
| FA3 | Bürgerservice und Gesprächsassistenten | Virtuelle Assistenten (Chatbots) | Eingehende Fragen von Bürgern in natürlicher Sprache, beispielsweise zu Öffnungszeiten, Anträgen oder notwendigen Dokumenten, werden interpretiert, um darauf passende Antworten aus vorhandenen Wissensdatenbanken zu liefern. Durch den Einsatz von KI werden einfache bzw. repetitive Anfragen identifiziert und gefiltert, so dass vorrangig komplexere Fälle der Sachbearbeitung zugewiesen werden. Technologien: Natural Language Understanding (NLU) |
| FA4 | Bürgerservice und Gesprächsassistenten | Intelligente Terminplanung | Die KI-gestützte Terminplanung basiert auf der Analyse historischer Daten in Bezug auf Terminarten, Tageszeiten, Wochentage, saisonale Schwankungen, Vorlaufzeiten) mit dem Ziel, den zukünftigen Bedarf an Terminen für verschiedene Dienstleistungen vorherzusagen und somit eine bessere Auslastung von Bürgerbüro-Terminen und eine Vermeidung von Wartezeiten zu erreichen. Technologien: Machine Learning (ML) und Predictive Analytics |
| FA5 | Informations- und Wissensmanagement | Intelligente Texterkennung und -analyse | Die KI-basierte Klassifikation und Inhaltsanalyse umfangreicher Dokumentensammlungen erfolgt auf Basis definierter Dokumentenbeständen und Wissensbasen, um relevante Informationen zusammenzufassen und für die weitere Verarbeitung zu extrahieren. Technologien: Optical Character Recognition (OCR), Natural Language Processing (NLP), ML-basierte Textklassifizierung |
| FA6 | Informations- und Wissensmanagement | Wissensmanagementsysteme mit semantischer Suche | Die KI-basierte Suchmaschinen erschließen Inhalte und Verwaltungswissen effizient, sodass diese Inhalte gezielt für weitere Aufgaben verwendet werden oder der Entscheidungsunterstützung dienen. Technologien: Optical Character Recognition (OCR), Natural Language Processing (NLP), Machine Learning (ML) |
| FA7 | Prädiktive Planung und Analysen | Vorhersagen des Personal- und Ressourceneinsatzes | Die KI-basierte Vorhersage und Optimierung von Personaleinsatz basiert auf Daten, die Aussagen über Anwesenheit-/ Urlaubs- und bereits gebuchte Auslastungszeiten ermöglichen. Eine Vorhersage und Optimierung des Ressourceneinsatzes zieht insbesondere Informationen zu saisonalen Spitzen wie Wahlen, Steuerstichtagen oder Ferienzeiten hinzu. Technologien: Machine Learning (ML), Predictive Analytics |
| FA8 | Prädiktive Planung und Analysen | Risikoeinschätzung und Betrugserkennung | Die KI-basierte Systeme dienen der frühzeitigen Erkennung von Ausreißern in der Datenbasis (Auffälligkeiten), Risiken oder Manipulationen, etwa bei Steuererklärungen, Förderanträgen oder Sozialleistungen. Technologien: Data- und Predictive Analytics, Machine Learning (ML), Regelbasierte Systeme |
| FA9 | Allgemeine Verwaltungsarbeiten | Unterstützung bei Verwaltungsaufgaben | Die KI-Services dienen der Unterstützung bei allgemeinen alltäglichen Aufgaben von Verwaltungsmitarbeitenden. Darunter sind u. a. Formulierungshilfen, Zusammenfassungen, Übersetzungen, Texte in leichte Sprache zu übersetzen und Präsentationserstellung zu subsummieren. Der Zugang dieser KI-Services muss direkt über den Arbeitsplatz ermöglicht werden. Das bedeutet ein Zugang über ein persönliches Web-Frontend sowie die Integration der KI-Services in bestehende Office-Anwendungen und E-Mailanwendungen via Plugins muss gegeben sein. Technologien: Optical Character Recognition (OCR), Natural Language Processing (NLP) |
| FA10 | Texterzeugung | Texte übersetzen | Ermöglicht die präzise automatische Übertragung von Inhalten zwischen verschiedenen Sprachen. |
| FA11 | Texterzeugung | Texte zusammenfassen | Reduktion von längeren Texten auf ihre wesentlichen Kernaussagen, um die Hauptpunkte und wichtigsten Informationen prägnant darzustellen. |
| FA12 | Texterzeugung | Texte umformulieren | Bestehende Texte durch Umstrukturierung und Wortwahländerungen neu formulieren, um den Inhalt klarer, ansprechender oder zielgruppenspezifischer zu gestalten, ohne die ursprüngliche Bedeutung zu verlieren. |
| FA13 | Texterzeugung | Texte in einfache Sprache umformulieren | Erleichtert das Verständnis komplexer Inhalte, indem schwierige Begriffe und Satzstrukturen vereinfacht werden. |
| FA14 | Texterzeugung | Texte generieren | Texte erstellen, basierend auf vorgegebenen Themen oder Eingaben. Dabei Unterscheidung mit Vorlage (bspw. Vermerk) oder ohne Vorlage (bspw. Freitext). |
| FA15 | Texterzeugung | Texte bewerten (Plausibilität, etc.) | Analyse und Bewertung von Texten auf Plausibilität, Relevanz und Kohärenz, um die Qualität und Genauigkeit sicherzustellen. |
| FA16 | Texterzeugung | Texte befragen | Informationen aus umfangreichen Texten extrahieren, indem spezifische Fragen gestellt und relevante Antworten identifiziert werden. |
| FA17 | Texterzeugung | Texte erläutern | Analysieren und Erklären von Textinhalten, um die Bedeutung und Zusammenhänge klar und verständlich darzustellen. |
| FA18 | Texterzeugung | Texte vergleichen | Bewertung unterschiedlicher Perspektiven (Texte) zu einem Thema, z. B. Benennung von Vor- und Nachteilen |
| FA19 | Texterzeugung | Ratschläge erhalten | Perspektiven beleuchten, um fundierte Entscheidungen zu treffen und Probleme effektiver zu lösen. |
| FA20 | Textsuche | In Texten suchen | Auffinden spezifischer Informationen in großen Textmengen. |
| FA21 | Textsuche | Texte recherchieren | Suchen, Analysieren und Auswerten von schriftlichen Quellen zur Gewinnung relevanter Informationen und Erkenntnisse. |
| FA22 | Textsuche | Texte vergleichen (Ähnlichkeiten) | Zueinander ähnliche Texte identifizieren, z. B. mit dem Ziel der Kategorisierung |
| FA23 | Bilderzeugung | Bilder erstellen | Auf Basis von Texten |
| FA24 | Bilderzeugung | Bilder erstellen | Auf Basis von Audio |
| FA25 | Bilderzeugung | Bilder in Dokumente integrieren | Integration in Office-Dokumente wie Schreiben oder auch Foliensätze. |
| FA26 | Bilderkennung | Bilder beschreiben | Als Text |
| FA27 | Bilderkennung | Bilder beschreiben | Als Audio |
| FA28 | Bilderkennung | Bilder vergleichen | Bspw. Vorher / Nachher Vergleich |
| FA29 | Bilderkennung | Bilder vergleichen | Fehlersuche |
| FA30 | Bilderkennung | Bilder vergleichen | Erkennung von Anomalien |
| FA31 | Spracherkennung | Sprache erkennen | Audio oder Texteingabe wird erkannt |
| FA32 | Spracherkennung | Sprache als Text | Spracheingabe (in Audio) kann als Text wiedergegeben werden |
| FA33 | Spracherkennung | Sprache als Audio | Spracheingabe (in Text) kann als Audio wiedergegeben werden |
| FA35 | Videoerzeugung | Video generieren | Generierung von Videomaterial basierend auf Eingaben. |
| FA36 | Videoerkennung | Video analysieren | Analyse und Interpretation von Videomaterial zur weiteren Verarbeitung oder Erkennung von Anomalien. |
| FA37 | Fachspezifische Funktionen | Datenmuster erkennen | Identifizieren von Trends und Zusammenhängen in großen Datensätzen zur Unterstützung fundierter Entscheidungen und Vorhersagen. |
| FA38 | Fachspezifische Funktionen | Vorhersagemodelle | Zukünftige Ereignisse oder Trends in verschiedenen Bereichen präzise vorhersagen und optimieren. |
| FA39 | Personal Assistants | Intelligente persönliche Assistenten | Unterstützen Benutzer durch automatisierte Prozesse oder Eingaben und Sprachbefehle bei anfallenden Aufgaben. |
| FA40 | Personal Assistants | Automatisierte Terminplanung und E-Mail | Optimiert Zeitmanagement, indem sie Aufgaben effizient organisiert und zeitnahe, relevante Kommunikation gewährleistet. |
| FA41 | Simulationssysteme | Virtuelle Umgebungen für Trainingszwecke | Realistische Simulationen, die das Erlernen komplexer Fähigkeiten sicher und effizient ermöglichen. |
| FA42 | Robotik | Steuerung und Navigation von Robotern | Präzise Bewegungsmeldung, Hindernisvermeidung und autonome Entscheidungen in dynamischen Umgebungen für verschiedene Anwendungen. |
| FA43 | KI-Modelle auf Edge-Geräten (z.B. Smartphones) | Offline KI | Implementation lokaler Sprachmodelle auf Edge-Geräten, um auch Offline-Anwendung zu ermöglichen (z.B. im Flugzeug). |
| FA44 | Allgemeine Funktionen | Generierung stoppen | |
| FA45 | Allgemeine Funktionen | Text eingeben | |
| FA46 | Allgemeine Funktionen | Dokumente hochladen | |
| FA47 | Allgemeine Funktionen | Kontexte bilden | |
| SH1 | Sicherheits-Anforderungen: OWASP | Prompt Injection | Direkte Prompt Injection tritt auf, wenn die Prompt-Eingabe des Benutzers das Verhalten der GenAI Anwendung (oder des dahinterliegenden Modells) auf unbeabsichtigte oder unerwartete Weise direkt verändert. Dabei kann die Eingabe entweder beabsichtigt oder unbeabsichtigt erfolgt sein. Dem gegenüber steht die indirekte Prompt Injection. Diese tritt auf, wenn die Eingabe über externe Quellen (Services, Tools) beeinflusst werden. |
| SH2 | Sicherheits-Anforderungen: OWASP | Sensitive Information Disclosure | Risiko, dass vertrauliche Informationen (z. B. Nutzerdaten, interne Dokumente, Systemkonfigurationen) unbeabsichtigt preisgegeben werden. |
| SH3 | Sicherheits-Anforderungen: OWASP | Supply Chain | Gefährdungen durch unsichere Abhängigkeiten in der Lieferkette, etwa durch manipulierte Bibliotheken, Modelle oder externe Dienste. |
| SH4 | Sicherheits-Anforderungen: OWASP | Data and Model Poisoning | Angriffe, bei denen Trainingsdaten oder Modelle manipuliert werden, um falsche oder schädliche Ergebnisse zu erzeugen. |
| SH5 | Sicherheits-Anforderungen: OWASP | Improper Output Handling | Fehlende Kontrolle der generierten Ausgaben, was zu Sicherheitsproblemen, falschen Informationen oder Missbrauch führen kann. |
| SH6 | Sicherheits-Anforderungen: OWASP | Excessive Agency | Übermäßige Handlungsautonomie des Systems, die zu unerwünschten oder unkontrollierten Aktionen führen kann. |
| SH7 | Sicherheits-Anforderungen: OWASP | System Prompt Leakage | Preisgabe interner System-Prompts oder Konfigurationsdetails, die Angreifern helfen, das Modell zu manipulieren. |
| SH8 | Sicherheits-Anforderungen: OWASP | Vector and Embedding Weaknesses | Schwachstellen in Vektor- und Embedding-Repräsentationen, die Angriffe wie semantische Manipulation oder Injection ermöglichen. |
| SH9 | Sicherheits-Anforderungen: OWASP | Misinformation | Risiko, dass das System falsche, irreführende oder manipulative Informationen generiert und verbreitet. |
| SH10 | Sicherheits-Anforderungen: OWASP | Unbound Consumption | Gefahr unkontrollierten Ressourcenverbrauchs (z. B. Rechenleistung, Speicher), was zu DoS-Angriffen oder Systemausfällen führen kann. |
| BB1 | Chat-Frontend | Benutzerfreundlichkeit des Chat-Frontends | Das Chat-Frontend ist eine benutzerfreundliche Web-Anwendung die es ermöglicht mit großen Sprachmodellen (LLMs) zu interagieren. |
| BB2 | Chat-Frontend | SSL-Fähigkeit | |
| BB3 | Chat-Frontend | IDP | Authentifizierung über einen Identity-Provider (z.B. Keycloak) |
| BB4 | Chat-Frontend | The Twelve-Factor App-Prinzipien | Die Anwendung sollte The Twelve-Factor App-Prinzipien genügen. Insbesondere die Nebenläufigkeit und die Zustandslosigkeit sind für einen Betrieb der Anwendung in einer cloud-nativen Umgebung essentiell. |
| BB5 | Chat-Frontend | Mandantenfähigkeit | |
| BB6 | Chat-Frontend | Look&Feel | Das Look&Feel sollte auf das Look&Feel einer Behörde angepasst werden können |
| BB7 | Chat-Frontend | Barrierefreiheit | Die Anwendung genügt den wesentlichen Anforderungen an Barrierefreiheit |
| BB8 | Chat-Frontend | Persistenz der Chat-Verläufe | Die Anwendung ermöglicht Persistenz des Chat-Verlaufs je Benutzer |
| BB9 | Chat-Frontend | Pipes & Filter-Muster | Über Pipelines, die das Pipes & Filter-Muster implementieren kann der Prompt vor und nach-bearbeitet werden. Zur Vor- und Nachbearbeitung können die Service-Komponenten RAG, Tools, Tasks oder Agents benutzt werden. |
| BB10 | Chat-Frontend | Plug-In-Konzept | Die Anwendung ermöglicht über ein Plug-In Konzept das Einbinden einer Vielzahl spezifischer Frontends in Abhängigkeit der Benutzer-Präferenzen. Auf diese Weise kann der Nutzer mehrere spezifische (vertikale) Chat-Bot-Lösungen aus einer Benutzeroberfläche ansteuern. Dazu müssen Erweiterungspunkte (extension points) definiert sein und gleichzeitig die Erweiterungsmöglichkeit über Konfiguration (im weitesten Sinne siehe auch Fowler) |
Quellen
Deepset: Website - Cloud Doku - Haystack Doku
Aleph Alpha: Dokumentation - GitHub - Learning Plattform