Jusletter IT

KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik

  • Autor/Autorin: Diogo Campos Sasdelli
  • Beitragsart: Sicherheit und Recht
  • Region: Tschechien, EU
  • Rechtsgebiete: Sicherheit und Recht
  • Sammlung: Tagungsband IRIS 2022
  • DOI: 10.38023/76692828-9da1-469a-8310-10fd68db582e
  • Zitiervorschlag: Diogo Campos Sasdelli, KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik, in: Jusletter IT 30. Juni 2022
Reinforcement Learning zählt aktuell zu den beliebtesten Ansätzen im Bereich des Machine Learning. Hierbei geht es um den Ansatz, eine Art Belohnungsfunktion zu bestimmen, die der Maschine je nach ihrem Verhalten einen bestimmten Belohnungswert zuordnet. Die Maschine strebt an, diesen Wert zu maximieren. Der normative Charakter dieses Ansatzes springt in die Augen. In diesem Aufsatz wird gezeigt, dass einige Probleme, die im Zusammenhang mit Reinforcement Learning auftauchen (Reward Hacking) sehr enge strukturelle Verwandtschaften mit den sog. Paradoxa der Normenlogik aufweisen.

Table of contents

  • 1. Prolegomena
  • 1.1. Die Normenlogik und ihre Paradoxa
  • 1.2. Neuronale Netze, maschinelles Lernen, Reinforcement Learning
  • 2. KI-Sicherheit, Reward Hacking und die Paradoxa der Normenlogik
  • 3. Schluss
  • 4. Literatur

0 Kommentare

Es gibt noch keine Kommentare

Ihr Kommentar zu diesem Beitrag

AbonnentInnen dieser Zeitschrift können sich an der Diskussion beteiligen. Bitte loggen Sie sich ein, um Kommentare verfassen zu können.