Die Patentämter verfügen in ihren elektronischen Datenbanken über riesige Datenmengen in Form von Millionen digitalisierter Schriftstücke. Allein die Datenbank des EPA – Espacenet - enthält über 150 Millionen digitalisierte Patentdokumente.
Während formatorientierte Datenbanken nur zum Teil mit den vorgegebenen Datentypen umgehen können,66 ermöglichen Sprachmodelle durch ihre Fähigkeit, Bedeutungen aus dem Kontext abzuleiten, eine deutlich umfassendere Analyse.
Da Sprachmodelle in der Lage sind, die Semantik und Syntax eines Textes zu analysieren, werden sie zunehmend für die automatische Patentanalyse eingesetzt, zum Beispiel in Bild- und Textklassifizierungsaufgaben. In diesem Zusammenhang können die Fähigkeiten von Sprachmodellen zur Schlüsselwort-Extraktion und zur Erkennung der Beziehungen der einzelnen Wissensobjekte untereinander69 bei dem Vergleich von Patentansprüchen und damit bei der Identifizierung des neuheitsschädlichen Standes der Technik eingesetzt werden.
Die Tatsache, dass Patentdokumente aus den vertraulichen Quellen der Patentämter stammen, garantiert die Richtigkeit der Inhalte, mit welchen theoretisch das Sprachmodell trainiert wird. Dies erhöht die Wahrscheinlichkeit, zutreffende Ergebnisse zu generieren, da die Wahl der Datenquelle entscheidet, wie gut die KI ihre Aufgaben erfüllt.
Erstelle deine eigene Website mit Webador