ML
Recherche
GenA I

Akshay und sein dreijähriger Weg zum Patent

Autor
Anusha Venkatesh
Aktualisiert am
October 29, 2025
Veröffentlicht am
July 30, 2021
JUST RELEASED!
Gartner names Infrrd a Leader in the 2025 Magic Quadrant™ for IDP.
18 vendors reviewed. Few named Leaders. Find out who.
Access The Report

Welcome to our Careers Blog

It’s a place to talk about what brings people here, what they’re learning, and why they think others might like it here, too.

Infrrd has a strong culture of transparency, mentorship, and giving individuals the power to make decisions. Tech wizards from around the world join Infrrd to develop algorithms that make the impossible possible when it comes to unlocking the hidden value in data. They like the platform, the challenge, and the culture of curiosity. Plus the people are pretty great.

Meet Akshay Uppal, one of Infrrd’s brilliant machine learning engineers. He just got granted his very first patent for developing a system to extract data from unconventional images. And not just any images but from stamps and other complex images on the documents.

His invention has unlocked new pathways for Intelligent Document Processing and we had a chance to interview him and here’s how it went.

Willkommen auf unserem Karriere-Blog

Es ist ein Ort, um darüber zu sprechen, was die Leute hierher bringt, was sie lernen und warum sie glauben, dass es anderen hier auch gefallen könnte.

Infrrd hat eine starke Kultur der Transparenz, des Mentorings und der Fähigkeit, Einzelpersonen Entscheidungen zu treffen. Technologieexperten aus der ganzen Welt entwickeln gemeinsam mit Infrrd Algorithmen, die das Unmögliche möglich machen, wenn es darum geht, den verborgenen Wert von Daten zu erschließen. Sie mögen die Plattform, die Herausforderung und die Kultur der Neugier. Außerdem sind die Leute ziemlich gut.

Lernen Sie Akshay Uppal kennen, einen der brillanten Ingenieure für maschinelles Lernen von Infrrd. Ihm wurde gerade sein allererstes Patent für die Entwicklung eines Systems zur Extraktion von Daten aus unkonventionellen Bildern erteilt. Und das nicht aus irgendwelchen Bildern, sondern aus Stempeln und anderen komplexen Bildern auf den Dokumenten.

Seine Erfindung hat neue Wege eröffnet für Intelligente Dokumentenverarbeitung und wir hatten die Gelegenheit, ihn zu interviewen und so lief es.

Interviewer: Erzählen Sie uns von Ihrem Weg zum Patent.

Akshay: Dies war eines der allerersten Projekte, die ich in Angriff genommen habe, als ich vor 3 Jahren zu Infrrd kam. Zu der Zeit arbeitete das Team an der Anforderung, Informationen aus Rechnungen und Belegen wie Dokumenten zu extrahieren. Als Teil dieses Anwendungsfalls mussten wir wichtige Informationen aus den Stempeln auf diesen Dokumenten extrahieren. Ich erhielt diese Teilmenge der Probleme, die bald zur Lösung der Engpässe führten, die OCR selbst bei der Erfassung von Daten aus Bildern hatte.

Interviewer: Was waren die Engpässe?

Akshay: Folgendes passiert also, wenn Daten aus Bildern mit Stempeln extrahiert werden.

Alle vorhandenen OCR-Lösungen sind nicht in der Lage, Text aus Bildern, die drei Engpässe aufweisen, robust zu extrahieren:

  • Zufällige Ausrichtung der Bilder: Bei Logos, Stempeln und sogar gescannten Dokumenten ist es nicht möglich, immer eine feste Ausrichtung zu haben, und da jedes Bild eine zufällige Ausrichtung haben kann, kann die OCR diese Zufälligkeit nicht berücksichtigen und kann keine genauen Ergebnisse liefern. Zwar kann die Ausrichtung in einigen Fällen durch herkömmliche Bildverarbeitungstechniken bis zu einem gewissen Grad korrigiert werden, bei einigen High-End-Techniken ist dies auch der Fall OCR-Lösungen, es ist keine robuste Methode, da es zwischen den Dokumenten viele Variationen geben kann, insbesondere bei Logos, Stempeln usw.
  • Okklusion im Text: OCR-Lösungen sind noch nicht in der Lage, den Hintergrund vollständig vom Vordergrund zu isolieren. Das bedeutet, dass die OCR nicht in der Lage ist, korrekte Ergebnisse zu erzielen, wenn Hintergrundtext den Zieltext überlappt.
  • Unkonventioneller Text: OCR-Lösungen erwarten meistens fast horizontale Texte oder einheitlich ausgerichtete Texte. In Anwendungsfällen von Stempeln, Logos und Bannern ist diese Bedingung nicht immer der Fall und die vorhandenen OCR-Lösungen können solche Probleme nicht lösen.

Ziemlich schnell wurde uns klar, dass es derzeit keine Lösungen für diese OCR-Engpässe gibt und dass wir eine entwickeln mussten.

Interviewer: Und wie ist das gelaufen?

Akshay: Wir haben Deep-Learning-Modelle verwendet, um den Stempel zu trennen und die Ausrichtung des Stempels vorherzusagen. Auf dieser Grundlage extrahiert es Zahlen und Buchstaben daraus.

Dies half uns nicht nur dabei, die Stempel und den darunter liegenden Originaltext zu trennen, sondern auch erfolgreich Daten aus Stempeln zu extrahieren, einschließlich Standorte, Pincodes usw.

Wir haben die Lösung weiter erweitert, um Daten aus anderen unkonventionellen Bildern wie Logos und mehr extrahieren zu können.

Heute hat diese Erfindung eine komplette Lösungssuite für die proprietäre Plattform von Infrrd geschaffen.

Interviewer: Warum ausgerechnet Infrrd?

Akshay: Die Arbeit, die ich bei Infrrd mache, ist ziemlich herausfordernd. Es gibt eine Menge Forschung, die sich mit Deep Learning befasst und maschinelles Lernen. Es besteht eine erhebliche Lücke zwischen der Branche und dieser Forschung. Bei Infrrd versuchen wir, diese Lücke zu schließen. Die Arbeit, die ich hier mache, ist intellektuell anregend und hält mich auf Trab.

Eine weitere Sache bei Infrrd ist, dass wir eine enge Gemeinschaft sind. Wir aktualisieren unsere Plattform kontinuierlich. Wir haben alle das gleiche große Ganze vor Augen, auf das wir gemeinsam hinarbeiten. Dieses Gefühl der Inklusion und die Tatsache, dass Ihre Arbeit Wirkung zeigt, ist ermutigend. Das ist es, was mich bei Infrrd hält.

Am Ende:

Das war Akshay Uppal in seinen eigenen Worten. Akshay, der vor 3 Jahren zu uns kam, ist jetzt ein fester Bestandteil des Teams. Seine Leidenschaft für Innovationen und sein Enthusiasmus für die Umsetzung sind ansteckend. Ein großes Lob. Akshay! Du hast deine Infrarot-Familie stolz gemacht.

Anusha Venkatesh

NEWSLETTER
Get the latest news, product updates, resources and insights delivered straight to your inbox.
Abonnieren
Ready to Automate? Claim Your Zero-Touch Workflow Automation Guide.
Download

Häufig gestellte Fragen

Wie verbessert IDP die Genauigkeit von Forschungsdaten?

Durch den Einsatz von maschinellem Lernen und KI stellt IDP sicher, dass die extrahierten Daten korrekt und frei von häufigen manuellen Fehlern sind, was die Qualität der Forschung verbessert.

Auf welche Weise können die maschinellen Lernfunktionen von IDP die Betriebskosten senken?

Durch die Optimierung der Dokumentenverarbeitung und die Reduzierung manueller Eingriffe senkt maschinelles Lernen in IDP die Betriebskosten und verbessert die Gesamteffizienz.

Wie stellt IDP eine kontinuierliche Verbesserung seiner ML-Algorithmen sicher?

IDP aktualisiert seine Modelle für maschinelles Lernen kontinuierlich, indem es Benutzerinteraktionen und Ergebnisse der Dokumentenverarbeitung analysiert, was zu kontinuierlichen Verbesserungen der Genauigkeit und Effizienz führt.

Wie unterstützt IDP die Extraktion von Forschungsdaten?

IDP automatisiert die Extraktion von Daten aus Forschungsarbeiten, Umfragen und Fallstudien und organisiert die Informationen für weitere Analysen.

Wie nutzt IDP maschinelles Lernen, um die Datenextraktion zu verbessern?

IDP verwendet Algorithmen für maschinelles Lernen, um Extraktionsmethoden auf der Grundlage historischer Daten und Benutzerfeedback anzupassen und zu verbessern und so die Leistung im Laufe der Zeit zu verbessern.

Kann IDP mit verschiedenen Formaten von Forschungsdokumenten umgehen?

Ja, IDP kann Forschungsdokumente in verschiedenen Formaten verarbeiten, darunter PDFs, Bilder, gescannte Dokumente und strukturierte Formulare.

Hast du Fragen?

Sprechen Sie mit einem KI-Experten!

Holen Sie sich ein kostenloses 15-minütige Beratung mit unseren Spezialisten. Egal, ob Sie die Preisgestaltung erkunden oder unsere Plattform mit Ihren eigenen Dokumenten testen möchten, wir helfen Ihnen gerne weiter!

4.2
4.4