This commit is contained in:
fzzinchemical
2026-02-27 16:21:32 +01:00
parent a9c9eda675
commit b59d3d77b1
16 changed files with 349 additions and 41 deletions

View File

@@ -1,12 +1,35 @@
Als 2022 OpenAI ihr #Chatbot ChatGPT der Öffentlichkeit freistellte wurden neue Automatisierungsprozesse ermöglicht. Redundante Arbeit konnte von nun an durch ein Chat-Bot teilweise durchgeführt werden.
Mit der ankunft von breit verwendeten LLMs wie ChatGPT, Gemini oder auch Llama bot sich eine neue Form der Arbeit im Bereich der Informatik, spezifisch dem schreiben von Code.
Diese Chat-bots jedoch können Fehler und Falschaussagen in generierte Texte hinzufügen, die schwerwiegende Probleme für Endnutzer:innen erzeugen können, die wir vorher so nicht gesehen hatten.
Das sogenannte Vibe-Coding ist ein bereits weit vertretener Begriff für Personen, die zur Erstellung von Code und Code-Architekturen auf KI-Modelle zugreifen um Personal und Arbeit zu reduzieren.
Bei der Verfassung und Generierung von Lernmaterial ist ein korrektes lernen von Fachvokabular und Kontext von besonderer Wichtigkeit, diese Thesis versucht eine Lösung für dieses Teilproblem zu lösen.
Problematisch sind jedoch Synthetic Error Injections bei generiertem Code, der zu unerwünschten Problemen führen kann. Beispiele hierfür sind undefinierte Variablen, fehlende Imports, Typenfehler, Off-By-One-Fehler und logic contradicitons.
Ziel soll es sein eine Applikation zu entwickeln, welche sich zwischen einen Chat-Bot und den Endnutzer:innen schalten kann oder per Copy-Paste einen Text auf folgende Kriterien prüfen soll:
- Korrektheit von Kontext bei verwendeten Schlüsselwörtern
- Verwendete Grammatik
- Kohärenz von Informationen
Diese Thesis behandelt diese Problematik, indem
Um dies zu erfüllen soll "natural language processing ( #NLP)" verwendet werden. Eine weitere KI würde nur neue Probleme bzw. bereits existierende Probleme nicht immer erfassen können.
```mermaid
gantt
title Zeitplan (9 Wochen)
dateFormat YYYY-MM-DD
section Pakete
1. Baseline :2026-04-01, 3d
2. Datensatz-Plan :2026-04-04, 7d
3. Datensatz-Erst.:2026-04-11, 14d
4. BERT-Setup :2026-04-25, 4d
5. MCP-Infrastr. :2026-04-29, 7d
6. Frontend :2026-05-6, 3d
7. Fine-Tuning :2026-05-9, 7d
8. Analyse :2026-05-16, 7d
Puffer :crit, 2026-05-023, 14d
```