Jusletter IT

LEXIA: A Data Science Environment for Semantic Analysis of German Legal Texts (Podcast)

  • Autor/Autorin: Bernhard Waltl
  • Kategorie: Podcasts
  • Region: Deutschland
  • Rechtsgebiete: Rechtsinformatik
  • Zitiervorschlag: Bernhard Waltl, LEXIA: A Data Science Environment for Semantic Analysis of German Legal Texts (Podcast), in: Jusletter IT Flash 7. Dezember 2016
Für die Rechtsinformatik ist die Analyse von Rechtsdaten mithilfe von Informationstechnologien, insbesondere Text- und Datamining-Algorithmen, sehr attraktiv geworden. Zudem bestehen sowohl Rechtswissenschaft als auch -praxis aus daten-, wissens- und zeitintensiven Aufgaben, welche schon immer Fokus der Rechtsinformatik waren. Der Vortrag stellt eine Rechtsdatenumgebung vor, die speziell auf rechtliche Texte, z.B. Rechtsvorschriften, Rechtsprechungstexte aber auch Verträge und Patente, abgestimmt ist. Diese Umgebung enthält eine Referenzarchitektur und ein spezifisches Datenmodell. Zusätzlich integriert sie eine einfach zu bedienende und erweiterbare Textmining-Maschine, welche die Wiederbenutzung einzelner Komponenten erlaubt. Die grundlegende Architectur dieser Mining-Maschine ist Apache UIMA. Die Umgebung ermöglicht es, linguistische sowie semantische Strukturen gemeinschaftlich zu bestimmen. Hierbei nutzt sie eine bereits existierende, regelbasierte Script-Sprache namens Apache Ruta. Der Vortrag zeigt auf, wie das System zur Enthüllung rechtlicher Definitionen im Deutschen BGB genutzt werden kann, wobei diese nicht nur gefunden werden, sondern auch festgelegt wird, welcher Rechtsbegriff wie definiert wird. Dies gibt Datenwissenschaftlern und Rechtsexperten die Möglichkeit, unstrukturierte Informationen, z.B. Texte, zu strukturieren und Rechtstexte semantisch zu untersuchen und zu erforschen. (ah)

0 Kommentare

Es gibt noch keine Kommentare

Ihr Kommentar zu diesem Beitrag

AbonnentInnen dieser Zeitschrift können sich an der Diskussion beteiligen. Bitte loggen Sie sich ein, um Kommentare verfassen zu können.