DOI QR코드

DOI QR Code

Automatische Sentimentanalyse der deutschen Texte anhand eines Sentiment-Lexikons

독일어 감정사전을 활용한 감성분석

  • Published : 20140000

Abstract

Die vorliegende Arbeit stellt eine neue Methode für die Sentimentanalyse deutscher Texte vor. Die meisten bisherigen Ansätze für die Sentimentanalyse oder Stimmungsanalyse sind von Pang et al. (2002) stark beeinflusst. In dieser Arbeit wurde ein statistisches Verfahren vorgeschlagen, das auf annotierten Lernkorpora angelernt wurde. Ein Problem dieser Methode liegt darin, dass eine große Menge der Lernkorpora für jede Domäne benötigt wird, um einen Klassifizierer für verschiedene Domänen zu implementieren. Generell wird angenommen, dass ein Klassifizierer, der auf Lernkorpora bestimmter Domäne angelernt wurde, eine schlechte Performanz für eine andere Domäne aufweisen würde. Die neue Methode zieht ein Sentiment-Lexikon statt der Lernkorpora für das maschinelle Lernen heran. Einträge im Sentiment-Lexikon haben Informationen über die Positivität oder Negativität in ihren konnotativen Bedeutungen. Z.B. ist ‘schön’ ein Wort mit einer positiven konnotativen Bedeutung. Dagegen weist z.B. ‘Debakel’ eine negative konnotative Bedeutung auf. In dieser Arbeit wurden ‘German Polarity Clues (GPC)’ von Waltinger (2010) und ‘Senti Wortschatz (SentiWS)’ von Remus et al. (2010) benutzt. Das Experiment zeigte, dass die Einträge eines Sentimentlexikons gute Merkmale für das maschinelle Lernen unabhängig von verschiedenen Domänen aufweisen können. Jedoch gab es Unterschiede in der Performanz zwischen ‘GPC’ und ‘SentiWS’. ‘SentiWS’ unterliegt ‘GPC’ für fast 5 bis 10 % in der Accuracy der Sentimentklassifizierung. Unsere Analyse zeigt, dass der Unterschied in der Behandlungsweise der negativen Wörter liegen könnte.

Keywords