Blog
April 4, 2024

Die Welt der Daten - Für Einsteiger:innen und Fortgeschrittene

Der Einstieg in die Datenwelt und der Ausbau der eigenen Datenkompetenz ist eine Herausforderung. Unsere neue Serie bietet Einsteiger:innen einen praxisorientierten Zugang zur Datenwelt und fortgeschrittenen Datenanalyst:innen die Möglichkeit, ihr Wissen zu vertiefen.

Die Welt der Daten - Für Einsteiger:innen und Fortgeschrittene

Wir bei Polyteia wissen um die Komplexität des Themas Daten und wie herausfordernd der Einstieg in die Datenwelt sowie der stetige Ausbau der eigenen Datenkompetenz sein kann. Mit unserer neuen Serie bieten wir deshalb zu unterschiedlichen Themenbereichen zwei Perspektiven: Für Einsteiger:innen und für Fortgeschrittene. Für Einsteiger:innen soll der Zugang in die Welt der Daten praxisorientiert möglich werden. Fortgeschrittene Datenanalyst:innen erhalten die Möglichkeit zum Wissensausbau.

Der erste Abschnitt erklärt den Begriff Daten und wie diese im Arbeitsalltag im öffentlichen Sektor auftauchen können. Hierfür benötigen Sie kein Wissen zur Thematik und können ganz einfach einen ersten Schritt in die Datenwelt wagen. Wer bereits etwas Erfahrungen im Umgang mit Daten hat, kann direkt zum zweiten Abschnitt springen und erhält dort detaillierte Informationen zum Thema Datentypen und Datenbanken.

Für Einsteiger:innen: Basiswissen Daten

Was sind Daten? Die Frage kommt Ihnen vielleicht erst einmal sehr einfach vor. Aber nur auf Basis der gleichen Definitionen von Daten kann erfolgreich Wissen aufgebaut werden.

Daten können auf viele verschiedene Arten in Ihrem Arbeitsalltag auftauchen: Zahlen, Texte, Bilder, Audiodateien und vieles mehr. Alle Formen haben allerdings eines gemein: Sie stellen eine Information dar. So kann eine Zahl die Anzahl der Schulen, Kindergärten oder sogar die Rentner:innen, Schüler:innen und Arbeitskräfte Ihrer Gemeinde verdeutlichen. Ein Text kann dagegen den Wohnort oder die Staatsangehörigkeit von Bürger:innen definieren.

So ist nahezu jeder schon mal mit einem Datensatz in Berührung gekommen. Datensätze können zum Beispiel Excel-Tabellen, Tabellen in Datenbanken oder - nicht-elektronisch - eine Karteikarte in einer Kartei sein. Ein Datensatz besteht aus einer Auflistung einer Gruppe von inhaltlich zusammenhängenden Datenfeldern. Sie haben wahrscheinlich schon einen Datensatz erstellt, als Sie Angaben wie Name, Adresse und Geburtsdatum zu Bürger:innen in einer Tabelle notiert haben. Somit arbeiten Sie bereits jeden Tag mit Daten, zum Beispiel als Sie die Coronafälle Ihrer Stadt erfasst haben oder die Ausgaben Ihrer Abteilung in einer Excel-Datei festhalten. Denn: Daten haben nicht per se etwas mit komplexer Software auf Ihrem Computer zu tun. Diese können Ihnen aber helfen, Daten besser zu verstehen und effektiver zu nutzen.

Für Fortgeschrittene: Datentypen und Datenbanken

Der Wert von Daten - das wissen Sie sicher bereits - liegt nicht in ihrer bloßen Existenz, sondern vielmehr in der Möglichkeit, Entscheidungsfindungen zu unterstützen und Wissen zu generieren. Daten sind eine wertvolle Ressource, die sorgfältig verwaltet, analysiert und geschützt werden muss, um aus ihnen nachhaltig Nutzen zu ziehen.

Im öffentlichen Sektor befassen wir uns hauptsächlich mit strukturierten Daten, also numerische Werte und Texte. Es sind symbolische Repräsentationen von Informationen in einer formalisierten oder strukturierten Form, die in klar definierten Feldern oder Kategorien organisiert werden. Ein typisches Beispiel für strukturierte Daten sind Datenbanken, in denen Informationen in Tabellen mit Spalten und Zeilen organisiert sind. Im Gegensatz dazu stehen unstrukturierte Daten, die keine klare Organisationsstruktur haben, wie beispielsweise Textdokumente, E-Mails oder Multimedia-Inhalte. Die Strukturierung von Daten ist wichtig, da sie die Effizienz der Datenverarbeitung, -analyse und -nutzung erheblich verbessern kann, insbesondere in Bereichen wie Datenbankmanagement, Data Mining oder maschinelles Lernen.

Mit der strukturierten Sammlung von Rohdaten in einer Excel-Tabelle oder in einer Cloud-basierten Software entsteht ein Datensatz, der innerhalb einer Datenbank zu finden ist. Dieser kann aus einer oder mehreren Variablen bestehen, die Informationen über eine bestimmte Entität oder ein bestimmtes Ereignis enthalten. Jede Zeile in einem Datensatz repräsentiert im Normalfall eine einzelne Beobachtung oder Instanz, während jede Spalte eine bestimmte Merkmals- oder Attributinformation darstellt. Allerdings gibt es keine festgelegte Form des Datensatzes und dieser kann einfach transponiert werden. Die Daten innerhalb der Datenbank werden in verschiedene Datentypen kategorisiert. Für zeitliche Angaben gibt es unterschiedliche Datum-Datentypen: Uhrzeit, Datum oder beides zusammen als Zeitstempel. Boolean ist dagegen der Datentyp für Wahrheitswerte und kann entweder den Wert wahr oder falsch annehmen. Um Genauigkeit und Präzision bei Berechnungen sicherzustellen, werden vorwiegend Decimal-Datentypen bei finanziellen und wissenschaftlichen Anwendungen verwendet. Denn diese bieten die größte Anzahl von signifikanten Stellen für eine Zahl.

Auch Datenbanken treten in unterschiedlichen Formen auf. So gibt es Graphdatenbanken, die auf die Speicherung und Abfrage von Daten in Form von Graphen spezialisiert sind und häufig in Anwendungen wie sozialen Netzwerken, Empfehlungssystemen und Netzwerkanalysen eingesetzt werden. Hierbei werden Knoten und Kanten verwendet, um komplexe Beziehungen zwischen den Daten zu modellieren. Unter anderem gibt es auch die Zeitreihendatenbanken, die auf die Speicherung und effiziente Abfrage von Zeitreihendaten spezialisiert sind und in regelmäßigen Zeitintervallen erfasst werden. Sie werden häufig in Anwendungen wie IoT (Internet of Things), Finanzanalysen und Überwachungssystemen eingesetzt. Relationale, NoSQL- und objektorientierte Datenbanken sind weitere Formen, in denen Datenbanken auftreten können.

Die eigene Datenkompetenz weiter ausbauen

Schauen Sie bei unserer kostenlosen Lernplattform Data Academy vorbei. Sie unterstützt Verwaltungsmitarbeitende jedes Wissensstandes beim Auf- und Ausbau ihrer Datenkompetenz. Die interaktiven Online-Kurse der Data Academy behandeln eine Vielzahl von Themen, darunter Datenvisualisierung, Datentransformation, Datenplattformen, Data Governance, Künstliche Intelligenz und vieles mehr. Über diesen Link können Sie sich einfach und schnell für die kostenlose Lernplattform Data Academy von Polyteia registrieren.

Jetzt Newsletter abonnieren.

Abonnieren Sie unseren Newsletter, um immer am Puls der Zeit zu sein, wenn es um das Thema Daten und Polyteia geht.