Towards an Integrated Database of International Economic Law (IDIEL) Disputes for Text-as-data Analysis
Der Beitrag stellt eine Infrastruktur für die Analyse von rechtlichen Meta- sowie Textdaten über internationales Investitionsschutz- und Handelsstreitigkeiten vor. Die entwickelte Architektur der Datenbank enthält drei Hauptkomponenten: (1) einen WebCrawler, der Daten und Texte aus zwei über internationale wirtschaftsrechtliche Streitigkeiten informierende Webseite extrahiert; (2) eine Dokumentenanalyse zur Umwandlung von PDF-Dokumenten in Textdateien, zur Identifizierung von Struktur und Fussnoten innerhalb eines Dokumentes, zur Suche von Referenzen zu anderen Rechtsfälle sowie zur Speicherung des Texts als XML; und (3) diverse Benutzeroberflächen, die es den verschiedenen Benutzergruppen erlauben, auf Daten zuzugreifen. Die Architektur ermöglicht es, Metadatenanfragen zu stellen und/oder Textkörper zu untersuchen. Damit ermöglicht sie eine vielfältige und neuartige Analyse des internationalen Wirtschaftsrechts aus unterschiedlichen Blickwinkeln und Fachrichtungen. (ah)
Inhaltsverzeichnis
- 1. Introduction
- 2. Background
- 3. Architecture
- 3.1. Data Storage
- 3.2. Document and Metadata Retrieval
- 3.3. Document Analysis
- 3.4. User Interface
- 4. Data Model
- 5. Methodology
- 5.1. PDF to XML Conversion
- 5.2. XML Conversion and Handling
- 5.3. Multi-Part Document Handling
- 5.4. Cleaning Up
- 5.5. Structure Analysis
- 5.6. Reference Recognition
- 5.6.1. Trade Law Disputes
- 5.6.2. Investment Law Disputes
- 6. Examples
- 7. Issues
- 8. Evaluation
- 9. Conclusion and Future Work
- 10. Appendix
Loggen Sie sich bitte ein, um den ganzen Text zu lesen.
Es gibt noch keine Kommentare
Ihr Kommentar zu diesem Beitrag
AbonnentInnen dieser Zeitschrift können sich an der Diskussion beteiligen. Bitte loggen Sie sich ein, um Kommentare verfassen zu können.
0 Kommentare