Jusletter IT

Towards an Integrated Database of International Economic Law (IDIEL) Disputes for Text-as-data Analysis

  • Autoren/Autorinnen: Wolfgang Alschner / Aleksander Umov
  • Kategorie: Beiträge
  • Region: Deutschland
  • Rechtsgebiete: Big Data, Open Data & Open Government
  • Zitiervorschlag: Wolfgang Alschner / Aleksander Umov, Towards an Integrated Database of International Economic Law (IDIEL) Disputes for Text-as-data Analysis, in: Jusletter IT Flash 17. August 2017
Der Beitrag stellt eine Infrastruktur für die Analyse von rechtlichen Meta- sowie Textdaten über internationales Investitionsschutz- und Handelsstreitigkeiten vor. Die entwickelte Architektur der Datenbank enthält drei Hauptkomponenten: (1) einen WebCrawler, der Daten und Texte aus zwei über internationale wirtschaftsrechtliche Streitigkeiten informierende Webseite extrahiert; (2) eine Dokumentenanalyse zur Umwandlung von PDF-Dokumenten in Textdateien, zur Identifizierung von Struktur und Fussnoten innerhalb eines Dokumentes, zur Suche von Referenzen zu anderen Rechtsfälle sowie zur Speicherung des Texts als XML; und (3) diverse Benutzeroberflächen, die es den verschiedenen Benutzergruppen erlauben, auf Daten zuzugreifen. Die Architektur ermöglicht es, Metadatenanfragen zu stellen und/oder Textkörper zu untersuchen. Damit ermöglicht sie eine vielfältige und neuartige Analyse des internationalen Wirtschaftsrechts aus unterschiedlichen Blickwinkeln und Fachrichtungen. (ah)

Inhaltsverzeichnis

  • 1. Introduction
  • 2. Background
  • 3. Architecture
  • 3.1. Data Storage
  • 3.2. Document and Metadata Retrieval
  • 3.3. Document Analysis
  • 3.4. User Interface
  • 4. Data Model
  • 5. Methodology
  • 5.1. PDF to XML Conversion
  • 5.2. XML Conversion and Handling
  • 5.3. Multi-Part Document Handling
  • 5.4. Cleaning Up
  • 5.5. Structure Analysis
  • 5.6. Reference Recognition
  • 5.6.1. Trade Law Disputes
  • 5.6.2. Investment Law Disputes
  • 6. Examples
  • 7. Issues
  • 8. Evaluation
  • 9. Conclusion and Future Work
  • 10. Appendix

0 Kommentare

Es gibt noch keine Kommentare

Ihr Kommentar zu diesem Beitrag

AbonnentInnen dieser Zeitschrift können sich an der Diskussion beteiligen. Bitte loggen Sie sich ein, um Kommentare verfassen zu können.