GermEval Fragebogen

Der folgende Fragebogen hat zwei Hauptziele:

  1. Der Fragebogen soll den Organisierenden der Task Hilfestellung geben, ethisch problematische Aspekte frühzeitig zu erkennen und so angemessen diskutieren oder beheben zu können.
  2. Der Fragebogen dient dazu, strukturierte Informationen über die geplante Task zusammenzustellen, auf deren Grundlage die GSCL entscheidet, ob sie die Task als GermEval bewirbt.

Task

Daten

Erzeugung

Zusammenstellung

Wie sind die Daten aufgebaut?
Wie viele Instanzen beinhaltet der Datensatz?
Sind die Daten repräsentativ für die Population, zu der geforscht wird?
Welche Bias könnten die Daten enthalten und welchen Einfluss haben diese auf die Ergebnisse?

Annotation

*Wie wurden die Daten annotiert? (Was wird vom Annotationsschema erfasst? Wer hat die Daten annotiert? Angaben zum Annotationsprozess, Einwilligung der Annotatoren zur Veröffentlichung, etc.)

Verfügbarkeit

Werden die Daten frei verfügbar sein?
Wie werden sie verteilt?
*Welche Lizenz erhalten die Daten?

Darüber hinaus empfehlen wir Organisator*innen auch zusätzlich ein vollständiges Datasheet [Gebru et al., 2020] zu veröffentlichen, um die Daten noch besser zu kontextualisieren.

Evaluation

Die Organisierenden der Shared Task sollten sicherstellen, dass die Evaluation der Shared Task transparent, nachvollziehbar und fair ist, und dass die gewählten Evaluationsmaße bestmöglich das erfassen, was in der Beschreibung der Task als Untersuchungsgegenstand definiert wurde.
Um Teams, deren Systeme nur niedrige bzw. negative Ergebnissen erzielten, zu motivieren, diese zu publizieren, könnten z.B. zusätzlich zu den besten Systemen auch Teams ausgezeichnet werden, die eine besonders gründliche und systematische Fehleranalyse präsentieren.
Organisierende der Shared Task sollten nicht selbst an der Task teilnehmen, da sie über internes Wissen über die in der Task verwendeten Daten und mögliche Bias verfügen, das ihnen einen Vorteil im Wettbewerb verschaffen könnte.