Zur Evaluierung grosser Sprachmodelle für Anwendungen im deutschsprachigen Rechtswesen
Bettina Mielke
Christian Wolff
Rechtsgebiete:
LegalTech
Sammlung:
Tagungsband IRIS 2025
Zitiervorschlag: Bettina Mielke / Christian Wolff, „KI, lös‘ mir den Fall!“, in: Jusletter IT 20. Februar 2025
Wir diskutieren den möglichen Einsatz großer Sprachmodelle und generativer KI im Rechtswesen und erörtern, wie sich dieser evaluieren lässt. Dazu gehen wir auf bisherige Ansätze zur Evaluierung von großen Sprachmodellen, insbesondere am Beispiel des HELM-Projektes (holistic evaluation of large language models) ein und stellen erste explorative Versuche aus dem deutschsprachigen Raum, die Leistungsfähigkeit großer Sprachmodelle zu bewerten, vor. Auf dieser Basis entwickeln wir Anforderungen an eine systematische Methodik für künftige Evaluierungsstudien.
Inhaltsverzeichnis
1. Einführung
2. Große Sprachmodelle im Rechtswesen – internationale Perspektive
3. Große Sprachmodelle im Rechtswesen – deutschsprachige Perspektive
4. Typisierung von Arbeitsaufgaben
5. Große Sprachmodelle und ihre Evaluierung
5.1. Holistic Evaluation of Language Models (HELM)
5.2. Überblicksstudien zur Evaluierung großer Sprachmodelle
5.3. Einzelstudien zur Evaluierung im Rechtswesen
6. Evaluation großer Sprachmodelle im deutschsprachigen Rechtswesen
7. Anforderungen an die systematische Evaluierung
Literatur
Loggen Sie sich bitte ein, um den ganzen Text zu lesen.
Hier können Sie Meinung zu diesem Thema hinterlassen. Wir behalten uns vor, Kommentare zu entfernen, die gegen unsere Richtlinien verstossen.
Es gibt noch keine Kommentare zu diesem Thema.
Jurius ist dein persönlicher Assistent für alle Fragen rund um Weblaw. Egal ob du Informationen zu Abos, Produkten oder Dienstleistungen benötigst, Jurius ist hier, um dir zu helfen. Stelle einfach deine Frage und erhalte sofortige Antworten.