Event Correlation
Social Networks wie Facebook, Twitter und aktuell auch Google Plus spielen sowohl im privaten als auch im geschäftlichen Bereich immer mehr Rolle. Obwohl auf Twitter auch sehr viele belanglose Meldungen publiziert werden, so finden sich dort auch sehr viele Daten die für unterschiedlichste Projekte verwendet werden.Vor allem Twitter ist in den letzten Jahren bekannt dafür geworden, dass Breaking News Ereignisse dort schneller veröffentlicht und verbreitet werden als über herkömmliche Medien (REF). In diversen wissentschaftlichen Projekten wird Twitter für die automatische Erkennung von Erdbebenepizentren, zum Festsellen von Meinungen der Bevölkerung zu Politikern, und für das Extrahieren von vielen anderen Informationen verwendet. A-SIT hat sich dabei auch in zwei Projekten das Thema Twitter zum Fokus gemacht. Das Ziel dieser beiden Projekte dabei war festzustellen ob Daten von Twitter im IT-Security Bereich verwendet werden können.
Projekt 1 - Twitter Security Monitoring
Bei der ersten Analyse stellte sich heraus, dass Text Analyse
Projekt 2 - Botnets
Die Ergebnisse von Projekt 2 wurden hier angewendet um eine konkrete Analyse von Twitter Daten im Bereich Botnetze durchzuführen. Das Projekt geht davon aus dass automatisierte Analysen dazu verwendet werden um Twitterdaten aufzubereiten und einen Überblick über die Zusammenhänge dieser Daten geben.
Daten
Um die Datenmenge einzuschränken wurde die Suche auf 8 Botnet relevante Suchabfragen aufgeteilt, die zusätzliche Stichwörter enthalten die für die Thematik von Relevanz sind.
- botnet security
- botnet spam
- botnet command
- botnet news
- botnet web
- botnet infect
- botnet cloud
- botnet irc
Dabei wurden 6311 Tweets im Zeitraum vom Jänner bis Juni 2011 anhand dieser Suchabfragen extrahiert. Für die zeitlichen Analysen wird ein Intervall von einer Woche verwendet. Dies bedeuted dass Tweets die innerhalb von 7 Tagen zusammenauftreten mit dem gleichen Zeitpunkt repräsentiert werden.
Analysen
Überblick
Suche
Relationen
Eine wichtige Rolle spielt die Analyse der semantischen Relationen zwischen einzelnen Wörtern die in den Tweets verwendet werden. Dabei beeinflusst die Häufigkeit des gemeinsamen Auftretens von unterschiedlichen Wörtern in Tweets die Stärke der semantischen Relation. Als Beispiel werden hier die semantischen Relationen des Terms "Botnet" genauer analysiert:
Zeitlich
