Seite auswählen

BILD

Das Ziel von Computer Vision (Bildverstehen) besteht nicht nur darin, Maschinen dazu zu befähigen, die visuelle Welt wie ein Mensch wahrzunehmen und zu interpretieren, sondern dank UV- und IR-Kameras darüber hinaus blicken zu können. Durch die Kombination aus Big Data, verteilten GPUs und modernen Techniken des maschinellen Lernens werden bei boot.AI BILD passgenaue Lösungen für ein breites Spektrum an Anwendungen von Automation bis hin zu autonomen Systemen kreiert. Durch eine reduzierte Entwicklungszeit und erweiterte Betriebsfähigkeit ergibt sich ein direkter Mehrwert für den Kunden.

Gesichtserkennung

Bei der Gesichtserkennung können Personen identifiziert oder verifiziert werden, indem auf Gesichtsmerkmalen basierende und aus anderen Bildern extrahierte Muster verglichen und analysiert werden. Sie wird häufig in Sicherheitsanwendungen – wie das einfachere Verfolgen krimineller Personen oder der Schutz von Daten anhand des eigenen Gesichts anstatt eines Benutzernamens und Passworts – eingesetzt. Das Interesse nimmt auch in anderen Bereichen wie beispielsweise der Augmented Reality zu.

Objekterkennung

Bei der Objekterkennung werden alle Objekte in einem Bild lokalisiert und mit einer Bounding-Box annotiert. Sie ist eine der am häufigsten verwendeten Techniken in einem breiten Anwendungsspektrum wie Überwachungs-, Sicherheits- und Fahrerassistenzsysteme.

Symbolerkennung

Bei der Symbolerkennung werden Bilder von getipptem, handgeschriebenem oder gedrucktem Text in bearbeitbare und durchsuchbare Daten umgewandelt. Dies erspart dem Nutzer viel Zeit und Mühe, da beispielsweise textbezogene Inhalte in Bildern genutzt oder Informationen in Dokumenten gescannt und extrahiert werden können.

Bildklassifikation

Bei der Bildklassifikation wird einem Eingabebild in Abhängigkeit von seinem Inhalt ein Label zugewiesen. Diese Funktion stellt eines der grundlegendsten Probleme im Bildverstehen (Computer Vision) dar und wird in vielen praktischen Anwendungen verwendet.

Objektverfolgung

Bei der Objektverfolgung wird ein sich bewegendes Objekt oder werden mehrere sich bewegende Objekte lokalisiert. Dabei wird eine gesonderte ID für jedes Objekt vergeben, über die Zeit erhalten und bei Bedarf die Kamera darüber gesteuert. Die Objektverfolgung wird häufig mit der Objekterkennung kombiniert und findet beispielsweise Anwendung in der Mensch-Computer-Interaktion, Überwachung, Sicherheit sowie in Zählsystemen.

Semantische Segmentierung

Bei der semantischen Segmentierung werden einem Bild auf Pixelebene Labels zugewiesen, um Bildbereiche mit gleichen Eigenschaften zu identifizieren (z.B. „Straße“, „Person“). Anwendung findet die semantische Segmentierung in der medizinischen Bildgebung sowie in autonomen Fahr- und Verkehrssteuerungssystemen.

Unterschiederkennung (Instance Segmentation)

Die Unterschiederkennung geht über die semantische Segmentierung hinaus, da hier jedem Pixel in einem Bild zusätzlich zum Label eine Entitäts-ID zugewiesen wird, um Bildbereiche derselben Instanz zu identifizieren (z.B. „Person 1“, „Person 2“). Die Unterschiederkennung kann in vielen Anwendungen eingesetzt werden, bei denen jede Instanz im Bild wie bei der Objekterkennung lokalisiert werden, aber – wie bei der semantischen Segmentierung – auch auf Pixelebene genau sein muss.

Aktionserkennung

Bei der Aktionserkennung werden Handlungen oder Ziele einer Person oder mehrerer Personen auf der Grundlage einer Beobachtungsserie oder Videoclips identifiziert und vorhergesagt. Aufgrund ihrer Vielfältigkeit kann sie in sehr unterschiedlichen Bereichen wie der häuslichen Rehabilitation, sicherheitsrelevanten Anwendungen, dem Gesundheitswesen und der Logistikunterstützung genutzt werden.

WORT

Die modernen Technologien der Computerlinguistik – Natural Language Processing – werden genutzt, um textbezogene Daten zu verstehen. Durch das Verständnis und die anschließende Automatisierung von Geschäftsprozessen trägt boot.AI WORT mit enormen Zeitersparnissen aufgrund der entfallenden manuellen Textdatenverarbeitung zu Unternehmenseffizienz bei.

Maschinenübersetzung

Maschinenübersetzung meint die softwaregestützte Übersetzung einer Sprache A in eine Sprache B und umgekehrt. Sie besteht sowohl aus Sprachanalyse als auch Sprachgenerierung. Maschinenübersetzung ermöglicht die Zusammenarbeit von Menschen, die nicht die gleiche Sprache sprechen und erleichtert das Lernen von Fremdsprachen.

Informationsextraktion

Bei der Informationsextraktion werden strukturierte Information aus unstrukturierten, von Maschinen lesbaren Dokumenten gefunden. Auf einer Grundstufe werden bei der Informationsextraktion erwähnte Einheiten wie Produkte, Organisationen, Orte und Zeitausdrücke identifiziert. Auf einer höheren Stufe kann die Informationsextraktion Events, Beziehungen und Koreferenzen finden, die sich tiefer im geschriebenen Text verbergen.

Sentimentanalyse

Unter Sentimentanalyse (“Stimmungserkennung”), auch bekannt als Opinion Mining oder Emotion AI, werden automatische Prozesse zur Identifikation von Meinungen innerhalb geschriebener oder gesprochener Sprache verstanden. Unternehmen können die Sentimentanalyse beispielsweise nutzen, um zu verstehen, was Kunden über ihre Produkte und Dienstleistungen denken. Neben der Bestimmung einfacher Polarität (positiv, neutral, negativ) kann die Sentimentanalyse ein tieferes Verständnis des Kontexts wie die verschiedenen Aspekte und Emotionen der Meinungen extrahieren.

Frage-Antwort-System

Ein Frage-Antwort-System meint Computersysteme, die mit der Fähigkeit gebaut werden, auf von Menschen gestellte Fragen in natürlicher Sprache zu antworten. Diese Systeme übersetzen zunächst die Sätze in eine Maschinenrepräsentation, dann suchen sie nach passenden Daten in Datenbanken, um valide Antworten zu generieren. Dank Siri und Google Home, sogenannten virtuellen Assistenten, werden Frage-Antwort-Systeme immer beliebter.

Textzusammenfassung

Bei der Textzusammenfassung werden die Grundideen oder Fakten aus einzelnen oder mehreren Dokumenten in kompakten Aussagen zusammengestellt. In Anbetracht der heutigen Informationsflut kann dies Unternehmen in der Datenanalyse und schnellen Entscheidungsfindung unterstützen.

Aufmerksamkeitsmechanismus (im Natural Language Processing)

Der Aufmerksamkeitsmechanismus bezieht sich auf die Idee, dem Decoder zu erlauben, sich bei jedem Schritt der Ausgabegenerierung um verschiedene Teile eines Quellsatzes zu kümmern, anstatt den gesamten Satz in einen Vektor fester Länge zu kodieren. Das Modell lernt, worauf es zu achten hat – basierend auf dem Eingabesatz und dem, was es bisher produziert hat.

Eines der Probleme, mit denen die Forscher zu kämpfen hatten, ist die Frage, wie man Personalpronomen mit zugehörigen Substantiven verknüpft, was zu diesem alten Witz führte, der den Ruf und die Reaktion eines Protestmarsches nachahmt:
Was wollen wir? – Natural Language Processing!
Wann wollen wir es? – Entschuldigung, wann wollen wir WAS?

Ein neuronales Netzwerk, das mit einem Aufmerksamkeitsmechanismus ausgestattet ist, kann tatsächlich verstehen, worauf sich „es“ bezieht. Das heißt, es weiß, wie man den Lärm ignoriert und sich auf das Wesentliche konzentriert.

ZEIT

Im Industriebetrieb können Daten mittels einer großen Anzahl an Sensoren und digitalen Geräten über das IoT (Internet of things) aus einer realen Umgebung erfasst werden und weisen damit hoch dynamische Eigenschaften auf. boot.AI ZEIT konzentriert sich auf die nächste Generation des maschinellen Lernens, das sich auf solch umfassende, dynamische und hoch komplexe Daten stützt, wodurch hilfreiche Einblicke gewonnen werden können, die wiederum als Interpretations- und Entscheidungsgrundlage, für Empfehlungssysteme sowie zur Erkennung verschiedener Ereignisse genutzt werden können.

Angriffserkennung

Die Angriffserkennung beruht auf einem System, das den Netzwerkverkehr auf verdächtige Aktivitäten überwacht und Warnmeldungen ausgibt, wenn eine solche Aktivität entdeckt wird. Die Grundlage eines jeden Angriffserkennungssystems ist ein robuster Datensatz, der Beispiele liefert, aus denen der Computer lernen kann.

Betrugserkennung

Betrugserkennung meint die Aufdeckung krimineller Aktivitäten, wie sie beispielsweise in kommerziellen Organisationen wie Banken, Kreditkartenunternehmen, Versicherungsagenturen, Mobilfunkunternehmen oder Börsen vorkommen. Die kriminellen Benutzer können dabei eigentliche Kunden sein oder sich als solche ausgeben (Identitätsdiebstahl).

Empfehlungssysteme

Empfehlungssysteme stellen einen Ansatz zur Entwicklung personalisierter Informationssysteme dar, mit dem Ziel, Menschen und Organisationen die richtigen Informationen zur richtigen Zeit zur Verfügung zu stellen. Empfehlungssysteme – wie beispielsweise Musikempfehlungen bei Spotify, Filmempfehlungen bei Netflix oder Angebotserstellung im Vertrieb von Unternehmen – haben deutlich an Bedeutung gewonnen.

Anomalienerkennung

Die Anomalien- oder Ausreißererkennung identifiziert seltene Objekte, Ereignisse oder Beobachtungen, die Verdacht erregen, weil sie sich signifikant von der Mehrheit der Daten unterscheiden. Sie ist in einer Vielzahl von Bereichen anwendbar, wie z.B. Einbruchssicherung (siehe oben), Betrugserkennung (siehe oben), Erkennung von IoT-Spam (siehe unten), Fehlererkennung, Systemzustandsüberwachung, Ereigniserkennung in Sensornetzwerken und Erkennung von Störungen in Ökosystemen.

IoT-Spam

Basierend auf maschinellem Lernen kann automatisch Schadsoftware von normalen Programmen unterschieden werden, was heutzutage immer mehr an Bedeutung gewinnt.