KI-Erfahrung seit 2022 - cutting edge

Ich entwickle mit KI - nicht nur neben ihr.

Von den ersten KI-Betas 2021 bis zu selbstlernenden Agenten 2026 - praktische Erfahrung durch das gesamte LLM-Ökosystem.

ChatGPT Waitlist 2022GitHub Copilot Beta 2021Lokale LLMs Self-HostedMCP-ÖkosystemPrompt EngineeringAgentic Coding

Die Reise

Von der Beta zur Cutting-Edge

2021

GitHub Copilot Technical Preview

Beta-Zugang als einer der ersten Nutzer - KI-gestützte Codeergänzung direkt im Editor, lange vor dem öffentlichen Launch.

2022

ChatGPT Early Access (Waitlist)

Teil der Waitlist vor dem öffentlichen Launch am 30. November 2022 - früher Einblick in die Fähigkeiten großer Sprachmodelle.

2025

MCP-Ökosystem & Agentic Coding

Konfiguration und Integration zahlreicher MCP-Server (GitHub, Discord, n8n, Google Drive, Playwright, Blender u.v.m.) sowie eigene MCP-Backend-Schnittstellen für interne Workflows.

2025/26

Lokale LLM-Infrastruktur aufgebaut

Vollständige Self-Hosted-KI-Umgebung: Ollama, MLX, Open WebUI - MoE-Modelle wie Qwen3.5 122B laufen lokal auf 128 GB Unified Memory, dense Modelle wie Qwen3:32B via MLX 2-3x schneller als Standard-Inferenz.

2026

Cutting-Edge Tools - OpenClaw & Hermes Agent

OpenClaw: viraler KI-Assistent mit WhatsApp/Discord-Steuerung, persistentem Gedächtnis und Browser-Kontrolle. Hermes Agent (Nous Research): selbstlernender Skill-Loop mit sitzungsübergreifendem Wissensaufbau.

Das Tooling

KI-Ecosystem im Überblick

Praktisch eingesetzt - nicht nur bekannt.

CLI-Tools & Agentensysteme

Claude Code CLI

Anthropics agentenbasiertes Terminal-Tool für komplexe Codeaufgaben

Gemini CLI

Googles Terminal-Integration für Code-Assistenz & Research

OpenClaw

KI-Assistent steuerbar via WhatsApp, Telegram, Discord - mit Systemzugriff

Hermes Agent (Nous Research)

Selbstlernender Agent mit eingebautem Skill-Loop und sitzungsübergreifendem Wissen

Aider

KI-gestütztes Pair-Programming direkt im Terminal

Lokale LLM-Infrastruktur

Ollama

Model-Serving für Qwen3:32B, Qwen3.5 122B (MoE), Gemma 4:27B, DeepSeek-R1, Hermes u.a.

MLX (Apple Silicon)

2-3x schneller als Ollama auf M-Series - läuft komplett auf dem Neural Engine / GPU

LM Studio

Lokales Chat-Interface und API-Wrapper für LLMs

Open WebUI

Self-Hosted ChatGPT-ähnliche Oberfläche für lokale Modelle

ComfyUI

Node-basierte Image-Generation-Workflows (Stable Diffusion)

MCP-Ökosystem

n8n MCP

KI-gesteuerte Workflow-Automatisierung via MCP-Server

GitHub, Discord, Google Drive

Voller MCP-Zugriff auf externe Dienste direkt aus dem KI-Workflow

Playwright MCP

Browser-Automatisierung via MCP - Headless Chromium in Docker

Eigene MCP-Schnittstellen

Eigenentwicklung eigener MCP-Backends für interne Automatisierungen

IDEs & Entwicklungsumgebungen

Visual Studio Code

Bevorzugter Editor - täglich im Einsatz mit zahlreichen Extensions und eigenen Workspace-Konfigurationen

GitHub Copilot

Seit der Technical Preview 2021/2022 im Einsatz

Cursor

KI-nativer VS Code-Fork mit integriertem Agentenmodus

OpenAI Codex (IDE)

KI-gestützte Codeergänzung und -generierung direkt in der IDE

Prompt Engineering

KI gezielt steuern - nicht nur nutzen

Prompt Engineering bedeutet, KI-Modelle durch präzise Anweisungen gezielt zu steuern - ähnlich wie Programmieren, nur in natürlicher Sprache. Wer ein Modell wirklich kennt, holt 10x bessere Ergebnisse heraus als jemand, der es nur "fragt".

Durch jahrelangen praktischen Umgang mit verschiedenen Modellen - lokal und über APIs - habe ich ein tiefes Verständnis für die Eigenheiten, Stärken und Schwächen von Claude, GPT, Qwen, Gemma und DeepSeek entwickelt. Jedes Modell verhält sich anders und braucht eine andere Ansprache.

System Prompts

Gezielte Rollendefinition und Verhaltenssteuerung für LLMs

Few-Shot Prompting

Aufgaben durch Beispiele statt Regeln definieren

Chain-of-Thought

Modell Schritt für Schritt durch komplexe Aufgaben führen

Kontextgesteuerung

Präzise Kontext-Fenster-Nutzung für konsistente Ausgaben

Modellspezifisches Prompting

Claude, GPT, Qwen und Gemma reagieren unterschiedlich - dieses Wissen gezielt einsetzen

Agentic Workflows

Multi-Step Tasks mit Tool-Use, Reflexionsloops und autonomen Agenten steuern

Eingesetzte Modelle

Lokal & API-basiert

128 GB Unified Memory auf Apple M5 Max - genug für die Größten.

Self-Hosted / Lokal

Qwen3:32B

Dense · Coding

Qwen 3.6 27B (MLX)

Coding · Fast

Qwen3.5 122B-A10B

MoE · Reasoning · Agents

Gemma 4:27B

Instruction · Technical

Qwen2.5-Coder:32B

Code-Spezialist

DeepSeek-R1

Reasoning · Mathematik

Hermes (Nous Research)

Agents · Tool-Use

Llama (Meta)

Allrounder

Cloud-APIs

AnthropicOpenAIGoogle Gemini

KI-Integration in dein Projekt?

Von der Automatisierung über lokale LLM-Deployments bis zu KI-gestützten Anwendungen - lass uns reden.

Kontakt aufnehmen →