Es gibt drei Hauptmethoden der Mehrdeutigkeit: Erstens, der regelbasierte Ansatz für die Mehrdeutigkeit von Wörtern, die Verwendung dieser Methode erfordert eine vollständige, konsistente und Anpassung an das offene Feld des Korpus, die Methode hat viele Engpässe. Zweitens, basierend auf statistischen Disaggregationsmethode, mit statistischen Methoden, um automatisch Linguistik-Kenntnisse zu erhalten, die erforderlich sind, um in Trainingssprachen zu derepresent, entsprechend den Unterschieden in der Ausbildung Datenauswahl ist in drei Methoden der überwachten maschinellen Lernen, unbeaufsichtigte maschinelle Lernen und semi-supervised machine learning, unbeaufsichtigte Deambiguation Methode ist die Verwendung von Clustering-Algorithmen, um cluster ähnliche semantische Umgebungssilben oder Beispielbeispiele, die typischste ist der Lesk-Algorithmus; Extrahieren semantischer Beziehungen im Zusammenhang mit mehrdeutigen Wörtern als Merkmale, die Diese Methode hat eine bessere Disambiguationswirkung, aber die Schwierigkeit liegt in der Notwendigkeit einer großen Anzahl von manuell gekennzeichneten korporatisierten korporatisierten korporatisierten Materialien, kombiniert mit den Vorteilen der beiden Methoden der Überwachung und Nichtüberwachung, die halbüberwachte Disambiguation-Methode basiert auf einer kleinen Anzahl von gekennzeichneten körperkorporierten körperkorporierten Materialien, kombiniert mit den Vorteilen der beiden Methoden der Überwachung und Nichtüberwachung, die halbüberwachte Disambiguation-Methode basiert auf einer kleinen Anzahl von gekennzeichneten trainingsmaterialien, kombiniert mit unbeschrifteten Korporatisierten Ressourcen, um einen Disassoziationsklass zu bilden; Wählen Sie die Klassifizierung mit der höchsten Co-Present-Rate als Semantik von mehrdeutigen Wörtern in der aktuellen semantischen Umgebung aus, aber da die Abdeckung des vorhandenen Wörterbuchs relativ eng ist und nicht erweitert werden kann, wird die Methode schrittweise brüskiert.
正在翻译中..