Willkommen auf unserem Karriere-Blog
Es ist ein Ort, um darüber zu sprechen, was die Leute hierher bringt, was sie lernen und warum sie glauben, dass es anderen hier auch gefallen könnte.
Infrrd hat eine starke Kultur der Transparenz, des Mentorings und der Fähigkeit, Einzelpersonen Entscheidungen zu treffen. Technologieexperten aus der ganzen Welt entwickeln gemeinsam mit Infrrd Algorithmen, die das Unmögliche möglich machen, wenn es darum geht, den verborgenen Wert von Daten zu erschließen. Sie mögen die Plattform, die Herausforderung und die Kultur der Neugier. Außerdem sind die Leute ziemlich gut.
Lernen Sie Akshay Uppal kennen, einen der brillanten Ingenieure für maschinelles Lernen von Infrrd. Ihm wurde gerade sein allererstes Patent für die Entwicklung eines Systems zur Extraktion von Daten aus unkonventionellen Bildern erteilt. Und das nicht aus irgendwelchen Bildern, sondern aus Stempeln und anderen komplexen Bildern auf den Dokumenten.
Seine Erfindung hat neue Wege eröffnet für Intelligente Dokumentenverarbeitung und wir hatten die Gelegenheit, ihn zu interviewen und so lief es.
Interviewer: Erzählen Sie uns von Ihrem Weg zum Patent.
Akshay: Dies war eines der allerersten Projekte, die ich in Angriff genommen habe, als ich vor 3 Jahren zu Infrrd kam. Zu der Zeit arbeitete das Team an der Anforderung, Informationen aus Rechnungen und Belegen wie Dokumenten zu extrahieren. Als Teil dieses Anwendungsfalls mussten wir wichtige Informationen aus den Stempeln auf diesen Dokumenten extrahieren. Ich erhielt diese Teilmenge der Probleme, die bald zur Lösung der Engpässe führten, die OCR selbst bei der Erfassung von Daten aus Bildern hatte.
Interviewer: Was waren die Engpässe?
Akshay: Folgendes passiert also, wenn Daten aus Bildern mit Stempeln extrahiert werden.
Alle vorhandenen OCR-Lösungen sind nicht in der Lage, Text aus Bildern, die drei Engpässe aufweisen, robust zu extrahieren:
- Zufällige Ausrichtung der Bilder: Bei Logos, Stempeln und sogar gescannten Dokumenten ist es nicht möglich, immer eine feste Ausrichtung zu haben, und da jedes Bild eine zufällige Ausrichtung haben kann, kann die OCR diese Zufälligkeit nicht berücksichtigen und kann keine genauen Ergebnisse liefern. Zwar kann die Ausrichtung in einigen Fällen durch herkömmliche Bildverarbeitungstechniken bis zu einem gewissen Grad korrigiert werden, bei einigen High-End-Techniken ist dies auch der Fall OCR-Lösungen, es ist keine robuste Methode, da es zwischen den Dokumenten viele Variationen geben kann, insbesondere bei Logos, Stempeln usw.
- Okklusion im Text: OCR-Lösungen sind noch nicht in der Lage, den Hintergrund vollständig vom Vordergrund zu isolieren. Das bedeutet, dass die OCR nicht in der Lage ist, korrekte Ergebnisse zu erzielen, wenn Hintergrundtext den Zieltext überlappt.
- Unkonventioneller Text: OCR-Lösungen erwarten meistens fast horizontale Texte oder einheitlich ausgerichtete Texte. In Anwendungsfällen von Stempeln, Logos und Bannern ist diese Bedingung nicht immer der Fall und die vorhandenen OCR-Lösungen können solche Probleme nicht lösen.
Ziemlich schnell wurde uns klar, dass es derzeit keine Lösungen für diese OCR-Engpässe gibt und dass wir eine entwickeln mussten.
Interviewer: Und wie ist das gelaufen?
Akshay: Wir haben Deep-Learning-Modelle verwendet, um den Stempel zu trennen und die Ausrichtung des Stempels vorherzusagen. Auf dieser Grundlage extrahiert es Zahlen und Buchstaben daraus.
Dies half uns nicht nur dabei, die Stempel und den darunter liegenden Originaltext zu trennen, sondern auch erfolgreich Daten aus Stempeln zu extrahieren, einschließlich Standorte, Pincodes usw.
Wir haben die Lösung weiter erweitert, um Daten aus anderen unkonventionellen Bildern wie Logos und mehr extrahieren zu können.
Heute hat diese Erfindung eine komplette Lösungssuite für die proprietäre Plattform von Infrrd geschaffen.
Interviewer: Warum ausgerechnet Infrrd?
Akshay: Die Arbeit, die ich bei Infrrd mache, ist ziemlich herausfordernd. Es gibt eine Menge Forschung, die sich mit Deep Learning befasst und maschinelles Lernen. Es besteht eine erhebliche Lücke zwischen der Branche und dieser Forschung. Bei Infrrd versuchen wir, diese Lücke zu schließen. Die Arbeit, die ich hier mache, ist intellektuell anregend und hält mich auf Trab.
Eine weitere Sache bei Infrrd ist, dass wir eine enge Gemeinschaft sind. Wir aktualisieren unsere Plattform kontinuierlich. Wir haben alle das gleiche große Ganze vor Augen, auf das wir gemeinsam hinarbeiten. Dieses Gefühl der Inklusion und die Tatsache, dass Ihre Arbeit Wirkung zeigt, ist ermutigend. Das ist es, was mich bei Infrrd hält.
Am Ende:
Das war Akshay Uppal in seinen eigenen Worten. Akshay, der vor 3 Jahren zu uns kam, ist jetzt ein fester Bestandteil des Teams. Seine Leidenschaft für Innovationen und sein Enthusiasmus für die Umsetzung sind ansteckend. Ein großes Lob. Akshay! Du hast deine Infrarot-Familie stolz gemacht.
Häufig gestellte Fragen
Durch den Einsatz von maschinellem Lernen und KI stellt IDP sicher, dass die extrahierten Daten korrekt und frei von häufigen manuellen Fehlern sind, was die Qualität der Forschung verbessert.
Durch die Optimierung der Dokumentenverarbeitung und die Reduzierung manueller Eingriffe senkt maschinelles Lernen in IDP die Betriebskosten und verbessert die Gesamteffizienz.
IDP aktualisiert seine Modelle für maschinelles Lernen kontinuierlich, indem es Benutzerinteraktionen und Ergebnisse der Dokumentenverarbeitung analysiert, was zu kontinuierlichen Verbesserungen der Genauigkeit und Effizienz führt.
IDP automatisiert die Extraktion von Daten aus Forschungsarbeiten, Umfragen und Fallstudien und organisiert die Informationen für weitere Analysen.
IDP verwendet Algorithmen für maschinelles Lernen, um Extraktionsmethoden auf der Grundlage historischer Daten und Benutzerfeedback anzupassen und zu verbessern und so die Leistung im Laufe der Zeit zu verbessern.
Ja, IDP kann Forschungsdokumente in verschiedenen Formaten verarbeiten, darunter PDFs, Bilder, gescannte Dokumente und strukturierte Formulare.