Lesson
    1
    • 3.1 Arten von Daten & Best Practice

      Die Anwendungsfelder künstlicher neuronaler Netze sind so vielseitig wie die Arten von Daten, mit denen solche Netzwerke trainiert werden können. Die Anwendung künstlicher Intelligenz richtet sich also nach der Art von Information, die aus Trainingsdaten extrahiert werden kann. So gibt es z.B. viele Anwendungen, die gesprochene Sprache analysieren und in Text übersetzen oder Aufgaben aus Sprache extrahieren können. Andere Anwendungen können den Gefühlszustand aus der Sprache herauslesen. Ebenfalls im Bereich der Audioverarbeitung anzusiedeln ist die Analyse von Geräuschen, z.B. bei Hörgeräten, Smartphones oder Freisprechanlagen, da hier das Verstehen des akustischen Umfeldes essentiell ist.


      Bild- und Videodaten

      Bild- und Videodaten werden heutzutage für eine große Anzahl verschiedener Anwendungen von Künstlicher Intelligenz ausgewertet. Im diagnostischen Bereich der Onkologie (vor allem der Radiologie und Pathologie), werden (Bewegt-)Bilddaten in Echtzeit ausgewertet, um Ärzte in ihrer Diagnose zu unterstützen. Eine der ersten Firmen, die mit intelligenter Bilderkennung im diagnostischen Bereich Erfolg erzielen konnte, war die Firma Enlitics des ehemaligen CEO von Kaggle Jeremy Howard. Heute ist das Feld von vielen der wichtigsten Global Playern hart umkämpft. Firmen, die KI-gestützte System im diagnostischen Bereich anbieten, sind IBM Watson, Siemens Healthineers, Zebra, Phillips, Artyres und AIDoc. Aus Deutschland gibt ebenfalls Startups, die früh das Potential dieser Technologie für die Diagnostik erkannt haben. Dazu gehören FUSE-AI, Mindpeak, Merantix, Digital Helix oder CellMatiQ.


      Gesundheitsdaten

      Neben dem Bereich der Wirkstoffentdeckung (Drug Discovery) ist der Bereich der Smartphone-Anwendungen für den ersten und zweiten Gesundheitsmarkt eine vielversprechende Möglichkeit, Deep Learning in der Gesundheitsbranche anzuwenden. Ada, Babylon Health, YourMD, DocYet oder medicus.ai entwickeln Apps, die Nutzern direkt entweder Diagnosen liefern, ihnen grundsätzlich auf dem Weg zur Gesundheit helfen, Arzttermin in der App zu planen und durchzuführen oder im Rahmen einer Chat-Funktion helfen, ihre Symptome zu analysieren.


      Gesichtserkennung

      Gesichtserkennung in Bilddaten spielt in vielen Anwendungen eine zentrale Rolle, so z.B. bei der Sicherheitsüberwachung oder in Smartphone-Anwendungen.


      Texte

      Aus Texten können Informationen, wie z.B. Größen, Orte, Zeiten oder Fakten, extrahiert werden. Diese Funktion begegnet einem fast täglich, denn Google versteht zumeist nicht allein den eingegebenen Text, sondern das, was Suchende eigentlich gemeint haben könnten. "DeepL" ist ein Programm, das maschinell Texte übersetzt, hierbei wird ein Convolutional Neural Network verwendet, um die Übersetzung zu erstellen. "DeepL" erreichte in Blindstudien nach eigenen Angaben bessere Ergebnisse als Konkurrenzprodukte von Google, Microsoft und Facebook.

      Auch im Bereich Legaltech entstehen immer mehr Anwendungen, die auf KI bzw. Text Extraction basieren. So z.B. die SaaS-Plattform Leverton. Diese ermöglicht es Nutzern, Dokumente, die gesellschaftsrechtlicher oder rechtlicher Natur sind, per Drag & Drop zu importieren und Informationen entweder automatisch oder halbautomatisch extrahieren zu lassen. Es ist beispielsweise möglich, einen Immobilienmietvertrag mit Hilfe einer KI-Engine zusammen mit einer menschlichen Validierung abzuschließen.

      Kira Systems entwickelt Software, welche die Arbeit eines M&A (Mergers & Acquisitions) Anwälten übernimmt: Informationen können von Anwälten aus Verträgen in 20-60 % weniger Zeit filtern und dabei präzisere Ergebnisse erzielen. Außerdem bietet Kira Systems Software zur Unterstützung von Due Dilligence Prüfungen, Tracking und Analyse von Vertragsklauseln, Analyse von Mietverträgen sowie Meta-Data Extraction aus CRM-Systemen an.

      Die Firma Ross kann Rechtsfragen zu einer Vielzahl von Tätigkeitsbereichen beantworten, wobei es sich auf eine umfassende Datenbank der amerikanischen Rechtsprechung von Bundes- und Landesgerichten stützt, einschließlich veröffentlichter und unveröffentlichter Rechtsprechung. Der kostenlose Mandatsanalysator kann automatisch alle Mandate durchlesen, Hyperlinks zu jedem im Mandat genannten Fall erstellen und auf Fälle hinweisen, die in irgendeiner Weise negativ behandelt wurden.

      Die deutsche Firma iubel.de plant eine ganz ähnliche Anwendung zur Analyse von rechtlichen Fällen, die Nutzer bei ihnen einreichen. Was ihr Geschäftsmodell absetzt, ist die Tatsache, dass iubel.de die Kosten für einen Mandanten übernimmt, sollte ein Mandant seinen Fall nicht gewinnen. Somit konkurriert die Firma auch mit Rechtsschutzversicherungen.


      Sprache

      Gesprochene Sprache kann im Rahmen des Natural Language Processing erkannt werden. Natural Language Processing wird teilweise in Kombination mit Bewegtbilderkennung in Echtzeit genutzt, um einen Gefühlszustand analysieren (z.B. für Suizid-Prävention). Auch in Smartphones arbeitet Natural Language Processing, z.B. um gesprochene Sprache in Text zu übersetzen. Die Software "Dragon NaturallySpeaking" zur Erkennung von gesprochener Sprache von Nuance Communications war eine der ersten erfolgreichen Firmen in diesem Feld. Diese Software ordnet akustischen Signalen im Rahmen eines akustischen Modells bestimmte Charakteristika zu, die es möglich machen, Laute zu erkennen. Mit Hilfe von stochastischen Modellen und Deep Learning wird also das Gesprochene in einen digitalen Text umgesetzt. Mit der Benutzung wird gleichzeitig das neuronale Netz trainiert, damit eine Korrektur von Erkennungsfehlern stattfinden kann und das System an den Benutzer angepasst wird. Wird ein Wort nicht richtig erkannt, wird eine Statistik zu dem am wahrscheinlichsten gesagten Wort erstellt und anhand der Mehrwortfolge entschieden, welches Wort am wahrscheinlichsten gesagt wurde. Heutzutage wird Natural Language Processing in Smartphones angewendet ("OK, Google", "Siri", "Bixby") aber auch bei vielen Autoherstellern ("Hey Mercedes").


      Andere Audiosignale

      Aber nicht nur Sprache wird als Audiosignal verarbeitet. So kann die Smartphone App "Shazam" in Echtzeit erkennen, um welchen Song es sich handelt, wenn dieser in Mikrofonreichweite eines Smartphones abgespielt wird. "Shazam" wurde von Shazam Entertainment Limited (welches 2018 von Apple aufgekauft wurde) entwickelt. Die App analysiert Audiosequenzen und deren Spektogram bzw. deren "akustischen Fingerabdruck", um Titel, Interpret und weitere Informationen aus der Datenbank von "Shazam" dem akustischen Fingerabdruck zuzuordnen.


      Sensoren

      Sensordaten werden z.B. kraftfahrtechnisch eingesetzt, um Abstände zu Objekten zu berechnen und Reaktionen darauf einzuleiten (Spurhalte- oder Geschwindigkeitsassistenten, Notbremsungssysteme etc.). "Nauto" entwickelt eine Fahrsicherheitsapp in Kombination mit aufgabenspezifischer Hardware. Die App wird in erster Linie an Taxi- und Logistikunternehmen vertrieben und erlaubt die Aufzeichnung von GPS- und Videodaten. Diese Daten können in Zukunft genutzt werden, um Infratruktur und Mobilität auf der Makro-Ebene planen zu können. Die Firma wirbt nicht nur mit großen Partnern u.a. in den USA und Japan, sondern auch mit dem hohen Potential an Effizienzsteigerung, wenn Verkehr in Städten mithilfe von Daten und Künstlicher Intelligenz organisiert wird.