Wie Google Abfragen basierend auf Entitätsinformationen interpretieren kann

Ein neues Patent von Google vom 28. Dezember 2021 konzentriert sich darauf, wie Abfragen interpretiert und auf der Grundlage von Entitätsinformationen gelöst werden.

Ich verlinke in Artikeln oft auf Google-Patente, weil ich viel Zeit damit verbringe, daraus zu lernen.

Patente werden angemeldet, um neue Erfindungen zu beschreiben und Innovationen von potenziellen Wettbewerbern anzuregen. Sie liefern genügend Informationen, um andere im gleichen Geschäft davon auszuschließen, das geistige Eigentum der Patentanmelder zu kopieren.

Oft finden wir interessante Informationen über Annahmen, die die Schöpfer von Patenten über die Suche, Sucher und das Web machen, die die Patente auch zu einer interessanten Lektüre machen können.

Wie immer, wenn ich die Highlights in einem Artikel wie diesem teile, werden Sie ermutigt, einen Blick auf das Patent selbst zu werfen.

Ich versuche zu erklären, was das Patent möglicherweise abdeckt, aber ich möchte es nicht so detailliert behandeln, dass mein Beitrag wie eine Kopie des Patents für Indexierungsprogramme erscheinen könnte.

Sie erinnern sich vielleicht, als der Google-Suchingenieur Paul Haahr auf der SMX 2016 eine Präsentation zum Thema „How Google Works“ hielt.

Einer der wichtigsten Erkenntnisse war, dass Google versucht zu erkennen, wann Entitäten in Suchanfragen von Suchenden zu sehen sind.

Diese Aussage führt zu der Frage, wie Google feststellen kann, auf welche Entität in einer Abfrage verwiesen wird.

Google hat ein Patent angemeldet, in dem sie dieses Thema untersuchen, und darum geht es in diesem Beitrag.

So interpretieren Sie Abfragen besser

Die Suche hat sich so entwickelt, dass sie solche Suchanfragen empfängt und Ergebnisse zurückgibt, die auf die Anfrage antworten.

Einige Suchmaschinen liefern jedoch Suchergebnisse, ohne die Suchanfrage zu verstehen.

Zum Beispiel als Antwort auf [action movie with Tom Cruise]irrelevante Suchergebnisse wie [Last Action Hero] und [Tom and Jerry] kann zurückgegeben werden, da ein Teil der Suchanfrage in den Titel der Inhalte aufgenommen wird.

Das Verständnis der Suchanfrage kann der Suchmaschine helfen, aussagekräftigere Ergebnisse zu erzielen.

Wie könnte eine Suchmaschine Suchanfragen interpretieren?

Das Patent weist auf diese Methoden hin:

  1. Empfangen einer Abfrage in einer Suchdomäne.
  2. Entscheidung über Suchbegriffe basierend auf der Suchanfrage.
  3. Ob ein Suchbegriff einem Entitätsnamen entspricht.
  4. Prüfen, ob der Entitätsname aus Metadaten stammt, die der Suchdomäne zugeordnet sind.
  5. Zu sehen, dass viele Entitätsnamen mindestens einem Teil der Anzahl der Suchbegriffe entsprechen.
  6. Auswählen eines Entitätstyps und einer Entitätspunktzahl, die jeder der Nummern der entsprechenden Entitätsnamen zugeordnet sind.
  7. Suchen einer Reihe von Entitätsnamen durch Entfernen einiger übereinstimmender Entitätsnamen basierend auf der Entitätsbewertung und Kontextinformationen in der empfangenen Suchanfrage.
  8. Durchführen einer Suche in der Suchdomäne mit dem verbleibenden Teil der Anzahl von Entitätsnamen.
  9. Wobei jede Entität, die im verbleibenden Teil der Anzahl von Entitätsnamen genannt wird, entsprechend dem zugeordneten Entitätstyp gesucht wird.

Diese Methode zum Interpretieren von Abfragen kann auch Folgendes umfassen:

  • Empfangen einer Sprachabfrage in einer Suchdomäne.
  • Auswählen vieler Spracherkennungsbegriffe basierend auf der empfangenen Sprachabfrage.
  • Entscheiden für jede der Anzahlen von Spracherkennungsbegriffen.
  • Ob zumindest ein Teil eines Spracherkennungsbegriffs einem Entitätsnamen entspricht.
  • Wobei der Entitätsname aus Metadaten abgeleitet wird, die der Suchdomäne zugeordnet sind, und wobei dem Entitätsnamen eine Entitätsbewertung zugeordnet wird.
  • Bestimmen einer Durchführbarkeitsbewertung für jeden der Anzahl von Spracherkennungsbegriffen basierend auf der Entitätsbewertung.
  • Rangfolge der Anzahl der Spracherkennungsbegriffe basierend auf der ermittelten Machbarkeitsbewertung.
  • Auswählen einer der Anzahlen von gereihten Spracherkennungsbegriffen zum Ausführen der Sprachabfrage in der Suchdomäne.

Dieses Patent für die Abfrageinterpretation befindet sich unter:

Methoden, Systeme und Medien zur Interpretation von Anfragen
Erfinder: Yongsung Kim
Zessionar: Google LLC
US-Patent: 11.210.289
Gewährt: 28. Dezember 2021
Eingereicht: 5. Mai 2017

Abstrakt:

Mechanismen zum Interpretieren von Abfragen werden bereitgestellt.

In einigen Implementierungen wird ein Verfahren zum Analysieren von Abfragen bereitgestellt, umfassend:

Empfangen einer Suchanfrage in einer Suchdomäne

Ermittlung von Suchbegriffen auf Basis der Suchanfrage

Bestimmen für jeden der Suchbegriffe, ob ein Suchbegriff einem Entitätsnamen entspricht,

Wobei der Entitätsname von Metadaten abgeleitet wird, die der Suchdomäne zugeordnet sind.

Als Reaktion auf die Feststellung, dass Entitätsnamen einem Teil der Suchbegriffe entsprechen

Bestimmen eines Entitätstyps und einer Entitätsbewertung, die jedem der entsprechenden Entitätsnamen zugeordnet ist

Bestimmen eines verbleibenden Teils der Entitätsnamen durch Entfernen mindestens eines der übereinstimmenden Entitätsnamen basierend auf der Entitätspunktzahl und Kontextinformationen in der Suchanfrage

Durchführen einer Suche in der Suchdomäne mit dem verbleibenden Teil der Entitätsnamen,

Jede Entität, die im verbleibenden Teil der Entitätsnamen genannt wird, wird entsprechend dem zugeordneten Entitätstyp gesucht.

Die Interpret Queries Patent-Schlussfolgerung

Wenn eine Suchmaschine feststellt, dass sich eine Entität in einem Artikel befindet, versucht sie, genau zu ermitteln, wer die Entität sein könnte.

Ein Google-Patent, über das ich in der Vergangenheit geschrieben habe, erklärte, dass ein Entitätsname wie „Michael Jackson“ scheinbar nur eine Person identifiziert, die die meisten Menschen kennen würden. Schließlich war er ein sehr bekannter Musiker und Entertainer.

Aber es gab einen anderen bekannten Michael Jackson, der zunächst gar nicht so war; er war als Direktor der Heimatschutzbehörde bekannt.

Google berechnet Konfidenzwerte, um festzustellen, auf welche Entität verwiesen werden könnte, wenn sie in einer Abfrage angezeigt wird.

Dieses Patent sagt uns, wie Google bestimmen könnte, nach welcher Entität gesucht wird, bevor Ergebnisse zu dieser Entität zurückgegeben werden.

Denken Sie daran, dass jemand, der nach „Lincoln“ (ein Beispiel aus einem anderen Google-Patent) sucht, ein Stadtauto von Lincoln, den ehemaligen Präsidenten Abraham Lincoln oder die Stadt Lincoln, Nebraska (auch viele andere Bundesstaaten) meinen könnte.

Wenn die Suchmaschine die Abfrage richtig interpretieren und einem Suchenden relevante Antworten anzeigen kann, können sie das Informations- oder Situationsbedürfnis des Suchenden befriedigen.

Es gibt viel mehr Analysen darüber, wie dieses Patent in der Beschreibung des Patents funktioniert, aber ich wollte darauf hinweisen, warum es gebraucht und notwendig war.

Es besteht ein zu großes Risiko einer potenziellen Verwirrung, wenn die Suchmaschine nicht versucht hat, eine Suchanfrage richtig zu interpretieren.

Mehr Ressourcen:


Beitragsbild: Prabowo96/Shutterstock


source site

Leave a Reply