Lesson
    1

    0%
    Lesson
    2

    0%
    Lesson
    3
    Lesson
    4

    0%
    • 4.3 Datenannotation

      Eine wichtige Rolle bei der Entwicklung von KI spielt die Qualität der Daten bzw. deren Annotation. Um ein System mit Daten zu trainieren, ist es nicht nur von hoher Relevanz, dass Herstellern möglichst viele Daten zur Verfügung stehen, sondern ebenfalls, wie diese Daten aufbereitet sind. Dabei ist eine Voraussetzung, dass die Daten in einer einheitlichen Form bereitgestellt werden und nicht voneinander abweichen.

      Anhand des Beispiels der KI-basierten Bilderkennung. Bei der Annotation von Daten im Rahmen der Entwicklung von intelligenter Bilderkennung bedeutet Annotation u.a., dass die Objekte, die von Künstlicher Intelligenz in Bildern identifizieren werden soll, von einem Fachspezialisten markiert und ggf. klassifiziert werden. Um den Datensatz zu homogenisieren, bieten bereits diverse Hersteller Software-Lösungen zur standardisierten Datenannotation an.

      Die Datenannotation kann besonders kostengünstig durch auf Annotation spezialisierte Firmen international erledigt werden. Häufig ist es jedoch empfehlenswert, die Annotation von fachspezifischen Experten durchführen zu lassen, die sich speziell mit dem betreffenden Datenmaterial auskennen. Es ist naheliegend, dass Experten aus einem spezifischen Bereich mit jahrelanger Erfahrung die besten und verlässlichsten Annotationen durchführen können. Die Qualität der Annotation bestimmt die Qualität des finalen Softwareprodukts: Das neuronale Netz kann bspw. ein Objekt in der Software-Anwendung nur so gut annotieren, wie der Experte die Trainingsdaten des Netzes zuvor annotiert hat. Das neuronale Netz wird dementsprechend ausschließlich mit Daten trainiert, die vorher exakt von einem Experten markiert wurden.

      Je mehr Daten dem Entwickler zur Verfügung stehen, mit denen er das Deep Learning System trainieren kann, desto präziser und verlässlicher werden die Ergebnisse. Unter der Voraussetzung, dass die eingepflegten Daten einer hohen Qualität entsprechen. Nur durch qualitativ hochwertige Daten kann eine hohe Effizienz des Deep Learning Projekts erwartet werden.