27. Januar 2014

Was sind eigentlich Metadaten?

Halli, hallo, hallöchen! Nachdem ich nun geschafft habe innerhalb von einigen Wochen alle meine Rechner zu zerstören, "musste" ich mir am Wochenende einen neuen Computer kaufen. Die Woche davor habe ich schon versucht ohne aus-zukommen - aber das ging einfach nicht. Boaah... schlimm.

Doch bevor es hier mit dem Thema Fitness, Ernährung, Schokolade, den nicht vorhandenen Kochkünsten und so weiter fortschritet, möchte ich über eine Thema schreiben, welches überhaupt nicht dazu passt: Metadaten.

In letzter Zeit höre in den Nachrichten ganz oft, dass die NSA Metadaten hätte und dazu noch ganz viele andere Daten. Ich weiß ja nicht, wie fit der eine oder die andere Leser/in dieses Blogs ist, aber da ich "zufällig" in der IT arbeite, habe ich mich mal in das Thema eingearbeitet.

Das wichtigste zu den Metadaten: Metadaten sind keine Daten an sich, sondern Extraktionen daraus. Ein Name, Beispielsweise, ist eine Information. Mit dieser kann man nicht alzu viel anfangen; aber wenn dann diese Information ausgewertet wird, dann kann man schon viel über eine Person herausfinden. (Und am Ende wirkt das dann ein bisschen wie bei Sherlock Holmes, wenn er Leute analysiert)

Beispiel gefällig? Nehmen wir den zufälligen Namen "Wilfried Schubert". Welche Information können wir nur anhand seines Namens kennen? Mit hoher Wahrscheinlichkeit ist er Deutscher, in Deutschland geboren, 40 bis 60 Jahre alt, Großvater, Männlich. Nimmt man dann noch weitere Statistiken hinzu könnte man noch sagen ob Westdeutscher oder Ostdeutscher, durschnittliche Schulnoten etc

Auf der anderen Seite könnte man auch nach einer Telefonnummer suchen. Nehmen wir mal die fiktive  Nummer 0176 6499123 von ihm. Was können wir daraus erkennen? Es ist ein Mobiltelefon. Also wird unsere Zielperson eher jünger sein. Dazu ist es eine Nummer von 1und1, daher könnte man in deren Zielgruppe gucken und statistisch das Alter manifestieren. Bei einer Festnetznummer gilt ähnliches, nur dann wir folgendes schwieriger:

Wir sind nun die NSA oder BND und kommen an die Telefonrechnung von Herrn Schubert. Darauf können wir sehen, wie viel er Telefoniert - und wohin. Mit dieser Information können wir durchaus viel anfangen. Telefoniert er mit dem Handy zum Beispiel immer an die selbe Nummer, dürfte angenommen werden, dass er verheiratet ist. Oder eine Affäre hat.

Aber kommen wir mal zu was viel erstaunlicherem und einem echten Fallbeispiel. Lexa ist aufgefallen, dass Facebook ihre passende Personen vorschlägt. Der Trick ist einfacher, wenn man weiß wie das Internet und Facebook funktioniert. Bei jeder Anfrage an das Internet (und jede neu aufgerufene Seite ist eine Anfrage!) Wird die eigene IP-Adresse an den Server mitgesendet. Dieser kann anhand der Adresse erkennen, wo sich eine Person im groben aufhält. Bisschen wie bei einer Telefonnummer die Ortsvorwahl. Zusätzlich könnte Lexa Leute kennen, welche wiederum Leute kennen, welche die vorschlagende Person kennt. Statistisch gesehen reicht das aus, um etwas sinnvolles vorzuschlagen.

In Kombination werden dann auch noch die Likes ausgewertet. Ähnliche Likes, passender Standort? Könnte passen. Unterm Strich ist es also nur Mathe. Je mehr Informationen vorliegen, desto besser kann ein Profil erstellt werden;- und glaubt ja nicht ihr seid so einzigartig, dass dies nicht möglich ist.

Sobald du Fan von "Die toten Hosen" bist, hast du statistisch gesehen ein bestimmtes Alter, ein bestimmtes Bewegungsprofil, eine bestimmte Telefonierweise und so weiter. Dies sind die Metadaten.

Kommentare:

  1. Soweit nichts neues, aber trotzdem interessant ;)
    Diese Vorschläge haben mich ja auch nur überrascht, weil mir auf den ersten Blick nicht klar war/ist, wie die Daten ausgewertet wurden, dass diese Vorschläge zustande kamen. Denn mit der einen Person habe ich immerhin die Uni gemeinsam, da ist die Wahrscheinlichkeit sehr hoch, dass sie vorgeschlagen wird.

    Aber bei der anderen Person gibt es im "realen" Leben keine Überschneidungspunkte, auch keine Likes bei Facebook ;)... da muss wirklich einfach die Mail-Adresse gereicht haben, mit der wir bei Blogger und bei Facebook angemeldet sind, um sie mir vorzuschlagen... und deswegen finde ich das so erstaunlich in diesem Fall.
    Das ich mit jedem Klick viele Daten überall hinterlasse ist mir klar und das sollte jedem klar sein, der sich frei im Internet bewegt.

    AntwortenLöschen
  2. Wie läuft's bei dir so? Immer noch computerlos?

    AntwortenLöschen
    Antworten
    1. Nein, ich habe wieder einen Computer; aber das real life hat so seine tücken... in dem fall eher positiv - alles gut.

      Löschen