🤖 KI-Anwendungen

KI im Produktivbetrieb

Ich setze KI als Ingenieur ein — Integration, Evaluierung, Kosten-/Latenz-Abwägungen und der Aufbau von Systemen, auf die Organisationen wirklich angewiesen sind. Keine Demos.

Wie ich über KI denke

Das Schwierigste an produktiver KI ist nicht die Modellauswahl — es ist zu erkennen, wann die Antwort falsch ist. Mein Ansatz beginnt mit der Evaluierung vor der Architektur: erst die Fehlermodi definieren, dann das System so gestalten, dass es sie erkennt.

Ich besitze IBMs Zertifizierungen für RAG & Agentic AI sowie Generative AI und habe diese Methoden auf echten industriellen Daten bei der WEISS GmbH angewendet — nicht auf Benchmark-Datensätzen.

RAG vor Fine-tuning

Für die meisten Retrieval-Aufgaben übertrifft RAG über einen gut strukturierten Index das Fine-tuning und ist erheblich günstiger zu aktualisieren, wenn sich Daten ändern. Fine-tuning nur, wenn Latenz oder Domänenvokabular es erfordern.

Evaluierung vor Architektur

Fehlermodi, Ground-Truth-Beispiele und Abnahmekriterien definieren, bevor der Pipeline-Code entsteht. Nachträgliche Evaluierungen bedeuten dreifachen Aufwand.

Kosten und Latenz sind Features

Ein System mit €4.000/Monat Inferenzkosten oder 8 Sekunden pro Anfrage ist nicht produktionsreif. Ich modelliere die Gesamtbetriebskosten von Beginn an.

Leitplanken und Sicherheit

Jede LLM-Integration, die ich ausliefere, verfügt über Output-Validierung, Fallback-Pfade und Logging. Halluzinationen in industriellen Kontexten sind kein akzeptabler UX-Fehler.

Wann KI NICHT einsetzen

Eine deterministische Regel oder eine SQL-Abfrage ist für strukturierte Lookups besser als ein LLM-Aufruf. Ich empfehle KI, wo sie die einfachere Option klar übertrifft — nicht als Standard.

Den gesamten Stack besitzen

Embedding, Retrieval, Prompt, Inferenz, Output-Parsing, API-Bereitstellung — ich entwickle und verantworte die vollständige Pipeline, nicht nur den „KI-Teil".


Projekte

KI-Fallstudien

Jedes Projekt folgt der Struktur: Problem → Rolle → Ansatz → Stack → Ergebnis.

Fallstudie · RAG-Pipeline
Retrieval-Augmented Generation für industrielle Dokumenten-Q&A
Problem: Ingenieure verbrachten Stunden mit der Suche in unstrukturierten internen Handbüchern und Datenblättern nach Antworten, die Sekunden dauern sollten.

Rolle: Alleiniger Ingenieur — Architektur, Implementierung, Evaluierung, Deployment.

Ansatz: Dokumentenkorpus gesplittet und eingebettet, Retrieval-Schicht mit hybridem semantischem und Keyword-Search aufgebaut, mit LLM-Inferenz-Endpoint verknüpft, Zitatverfolgung ergänzt.

Ergebnis: Anfragebearbeitungszeit erheblich reduziert; Ingenieure können selbstständig Antworten finden, ohne Experten zu unterbrechen.
PythonLangChainRAGFastAPIPostgreSQLOpenAI
Fallstudie · LLM Fine-tuning
Domänenangepasstes Modell für Produktklassifikation und Beschreibungsgenerierung
Problem: Ein regelbasiertes System zur Klassifikation industrieller Bauteile und Generierung von Produktbeschreibungen war fragil, erforderte ständige manuelle Pflege und lieferte inkonsistente Ergebnisse.

Rolle: Leitender Ingenieur — Datensatz-Kuration, Fine-tuning-Pipeline, Evaluierungsframework, Integration.

Ansatz: Trainingsdatensatz aus vorhandenen Produktdaten zusammengestellt, multimodales Modell für Text- und Bildeingaben fine-getuned, Evaluierungs-Suite erstellt.

Ergebnis: Regelbasiertes System abgelöst; manuelle Prüfaufwände erheblich reduziert; Beschreibungsqualität von Produktmanagern höher bewertet.
PythonLLM Fine-tuningMultimodalLangChainIBM watsonx
Fallstudie · Agentische KI
LLM-Agent für automatisierte Datenextraktion und Workflow-Routing
Problem: Eingehende Kundenanfragen kamen im Freitext an und erforderten manuelles Lesen, Klassifikation und Weiterleitung an das zuständige interne Team — zeitaufwändig und fehleranfällig.

Rolle: Architekt und Implementierer — Agent-Design, Tool-Definitionen, Leitplanken-Schicht.

Ansatz: Agentische Pipeline in LangChain aufgebaut, die eingehende Anfragen liest, strukturierte Felder extrahiert, Absicht klassifiziert und an nachgelagerte Systeme weiterleitet — mit Human-in-the-Loop-Eskalationspfad.

Ergebnis: Großteil des Routings automatisiert; Eskalationsrate und Fehlweiterleitungen gesunken.
PythonLangChainAgentsFastAPIAWS

Qualifikationen

KI-Zertifizierungen

🏅
IBM RAG & Agentic AI Specialisation
Retrieval-Augmented Generation, agentische Architekturen, Tool-Nutzung, Evaluierungsmethodik — angewendet mit IBM watsonx.
🏅
IBM Generative AI Specialisation
Foundation-Modelle, Prompt Engineering, Fine-tuning, verantwortungsvolle KI und Produktions-Deployment-Muster.