Kaum ein Thema weckt in der IT-Branche derzeit so hohe Erwartungen wie Big Data. Wikipedia liefert dazufolgende Definition:
Als Big Data werden besonders große Datenmengen bezeichnet, die mit Hilfe von Standard-Datenbanken und Daten-Management-Tools nicht oder nur unzureichend verarbeitet werden können. Problematisch sind hierbei vor allem die Erfassung, die Speicherung, die Suche, Verteilung, Analyse und Visualisierung von großen Datenmengen. Das Volumen dieser Datenmengen geht in die Terabytes, Petabytes, Exabytes und Zettabytes.
Weiter heisst es dort, dass die Menge neu anfallender Informationen durch RFID-Chips oder während der Maschine-Maschine-Kommunikation ein Ausmass erreicht hat, das mit den herkömmlichen Methoden der Informationsaufbereitung nicht zu beherrschen ist.
Hinzu kommen Unmengen unstrukturierter Informationen, die z.T. papierbasiert oder bereits in elektronischer Form vorliegen und in die Geschäftsprozesse integriert werden sollen, um daraus weiteren geschäftlichen Nutzen ziehen oder gesetzliche Anforderungen effizienter erfüllen zu können.
Vor allem die unstrukturierten Informationen sind es, die nach Ansicht der Analysten und der führenden Beratungshäuser das größte Potenzial aufweisen. Die technischen Mittel stehen längst bereit, die Datenbanktechnologie hat sich in den letzten Jahren – man denke nur an die In-Memory-Technologie – so weit entwickelt, dass es eigentlich nur noch eine Kaufentscheidung ist.
Ganz so einfach ist es dann doch nicht.
So sehr den Analysten und Beratungshäusern in der Diagnose zuzustimmen ist, so sehr schießen sie bei der Therapie über das Ziel hinaus. Steigende Quantität hat nicht zwangsläufig eine höhere Qualität der Informationen zur Folge. Ein Punkt, auf den Stephen Few immer wieder hinweist.
Die eigentliche Frage muss daher lauten: Wie lässt sich aus der wachsenden Quantität der Informationen bei einem vertretbaren Aufwand ein proportional dazu verlaufender Anstieg der Qualität erreichen?
Ohne ein entsprechendes Informationsmanagement wird das nicht gelingen.
Hierzu liefern die Autoren Paul Königer und Walter Reithmayer in ihrem Buch Management unstrukturierter Informationen einige wichtige Hinweise.
Unstrukturierte Informationen
Wie der Titel des Buches schon andeutet, sehen die Autoren in den unstrukturierten Informationen ebenso wie die Analysten und Beratungshäuser das größte Potenzial. So schreiben sie in dem Kapitel Die Fokussierung auf unstrukturierte Informationen:
Dieses Buch behandelt im Schwerpunkt den Umgang mit Informationen, die nicht in betriebswirtschaftlichen informationstechnischen Verfahren geführt werden, als nicht zum Beispiel in Auftragsbearbeitung, Finanzbuchhaltung oder Materialwesen. Alle Informationen außerhalb solcher Verfahren nennen wir vereinfacht >unstrukturierte Informationen<. .. Darüber hinaus gibt es Informationsflüsse, die keinen mehr oder weniger festgelegten Regeln unterliegen; wir nennen diese >Informationen im situativen Kontext<. In Verfahren wird mit stark strukturierten Informationen gearbeitet, im situativen Kontext in der Regel mit unstrukturierten Informationen. .. Für die verstärkte Beschäftigung mit unstrukturierten Informationen gibt es gute Gründe: Im Umgang mit stark strukturierten Informationen konnten in der Vergangenheit bereist große Fortschritte erzielt werden. Die Rationalisierungspotenziale dafür sind weitgehend ausgeschöpft. Dagegen liegen im Umgang mit unstrukturierten Informationen noch große Rationalisierungs- und Innovationspotenziale brach, zu deren Erschließen wir beitragen wollen.
Informationen, die sich aus einem situativen Kontext ergeben, sind demnach Zielobjekt von Big Data. Königer und Reithmayer führen daher auch den Begriff Informationsobjekt ein, um die unstrukturierten Informationen unter einen gemeinsamen Nenner zu bringen.
Informations- und Geschäftsobjekte
In der (Wirtschafts-) Informatik existiert als äquivalenter Begriff der des Geschäftsobjektes, das als Bindeglied zwischen Fachbereich und IT fungieren kann.
Um sich einen Überblick über die Geschäfts- bzw. Informationsobjekte hinsichtlich der Möglichkeiten ihrer Bearbeitung verschaffen zu können, bietet sich der Einsatz einer sog. CRUD-Matrix an.
Informationsqualität
Entscheidendes Kriterium für das Management unstrukturierter wie auch strukturierter Informationen ist die Informationsqualität. Die Autoren schlagen für deren Beurteilung fünf Kategorien vor:
Im Zeitalter des Internets und der zunehmenden Digitalisierung der Wirtschaft ist die Informationsvernetzung ebenfalls ein “Erfolgsfaktor”. Nicht ausgeklammert werden darf dabei die Frage der zu verwendenden Formate:
Es ist nichts Neues, dass Medienbrüche Unternehmen viel Geld kosten können. Ein Detail daraus sind die technischen Formate von Informationstypen. Aus dem Blickwinkel der Vernetzung gesehen, müssen sie aufeinander abgestimmt sein. Sicherlich kommt man in der Praxis nicht mit nur einem Format aus, das wäre völlig unrealistisch. Aber es ist nicht einzusehen, warum nicht eine Konzentration auf wenige Formate erreicht werden kann. Ausnahmen wird es immer geben; es kommt darauf an, >in der Breite gemeinsame Formate zu nutzen<.
Klassifizierung
Die Klassifizierung der Informationen, z.B. durch Indizes und Labels ist ebenfalls von nicht zu unterschätzender Bedeutung, wenngleich man sich der Grenzen auch des besten Klassifikationssystems bewusst sein sollte. Dennoch kann die Klassifizierung von Informationen einen signifikanten Beitrag zur Wertschöpfung leisten:
Klassifikation stellt inhaltliche Beziehungen zwischen Informationen her und ist damit Wertschöpfung. Dies mag zunächst einmal ein Wort des Trostes sein für alle Menschen, die die mühsame Arbeit etwa des Erstellens von Indizes oder Katalogen auf sich nehmen; es ist aber auch und vor allem ein Blick in die Zukunft. Je besser es gelingt, für die heutigen Informationsmassen Klassifikationen zu verbreiten, um so leichter wird uns der Umgang damit fallen.
Metainformationen
Eng mit der Klassifikation verbunden sind die Informationen über Informationen, die sog. Metainformationen .
Die Digitalisierung erfordert ein anderes Verständnis von Metainformationen als im Papierzeitalter:
Beim Übergang vom Papiermedium in die elektronische Welt geht also einerseits Metainformation verloren, insbesondere solche, die an das Trägermaterial gekoppelt ist. Andererseits treten an ihre Stelle elektronisch generierte Metainformationen, die ebenfalls Aussagen über die betreffende Information zulassen, die aber nach anderen Gesetzen zu lesen sind.
Ein besonders geeignetes Mittel zur Darstellung und Verwaltung von Metainformationen ist für die Autoren das Header File.
Informationskultur
Der Umgang mit Informationen in der Wirtschaft kann nicht von der Unternehmenskultur getrennt werden. Für die Autoren wird dieser Zusammenhang von der Informationskultur repräsentiert.
Information Literacy
Auch das beste Informationsmanagement und die beste Informationskultur vermögen wenig, wenn die Fähigkeiten der Mitarbeiter im Umgang mit Informationen nur unzureichend ausgebildet sind. In der Fachsprache hat sich hierfür der Begriff der Information Literacy herausgebildet.
Schlussbetrachtung
Auch im Zeitalter von Big Data haben die Methoden des Informationsmanagements nicht ausgedient – im Gegenteil. IBM prägte vor einigen Jahren dafür den Begriff der Information Agenda . Ohne ein Mindestmaß an Ordnung, Struktur und Konsistenz wird die Beschaffung und Aufbereitung von Big Data einen Aufwand verursachen, der in keinem gesunden Verhältnis zum Ertrag steht. Datenbanktechnologien und Tools bleiben auch weiterhin nur Mittel – richtig angewandt allerdings ein sehr mächtiges.