Enterprise Search: Vorbei ist auch daneben
Die Situation ist altbekannt: die meisten Informationen in Unternehmen liegen in unstrukturierter Form – als Texte - vor. Heute kommen Dokumente nahezu ausschließlich elektronisch zur Welt („digitally born“) und jedes Dokument existiert im Durchschnitt 5,3 Mal. Da ist es nicht erstaunlich, dass mit steigender Dokumentzahl die Suche nach dem relevanten Dokument zunehmend mehr Zeit beansprucht. Um dem entgegen zu wirken, wurde versucht, mit einer Reihe von neuen Software-Produkten diese Herausforderung zu lösen: Der ECM-Markt entwickelte sich. Der „Missing Link“ war jedoch das Thema „Suche“, denn sie entscheidet darüber, ob der ECM-Ansatz trägt oder nicht. Am Ende des Tages muss man sich nämlich fragen, wozu man den ganzen Aufwand treibt. Die Antwort ist banal: Um das richtige Dokument zu finden!
Lese weiter…
Resource Oriented Architecture - Das WWW fürs Unternehmen
Das World Wide Web hat ja einige ganz erstaunliche Eigenschaften. Zum Beispiel seine Fähigkeit, zu skalieren. Nur um eine Zahl zu nennen: im Sommer 2008 hatte Google insgesamt über eine Billion (das ist eine 1 mit 12 Nullen) unterschiedlicher URLs indexiert. Ich will hier aber nicht mit Trivia langweilen, sondern würde gerne die Eigenschaft des Skalierens jener der Stabilität gegenübersetzen. Wie kann ein so großes System, dass sich zudem permanent in seiner Struktur ändert, so stabil und zuverlässig funktionieren? Wer die Informatik seines Unternehmens kennt, weiss, wie aufwändig und teuer Releasewechsel grösserer Systeme sind, und wie trotz ausgiebigen Testens immer ein Unsicherheitsfaktor bleibt, “ob es denn wohl klappt nächstes Wochenende.”
Was macht das WWW anders als die Unternehmensinformatik? Ein wichtiger Grund liegt unter anderem in der losen Kopplung der Systeme. Das Web, genauer sein Protokoll HTTP arbeiten zustandslos. Das heisst, nach der Abarbeiterung einer Anfrage durch den Client ist diese für den Server endgültig abgeschlossen. Er behält nichts (ausser Log-Einträgen über die Anfrage), und die Kommunikationsverbindungen sind “gekappt”. Somit liegt es am Client, Status zwischen zwei Anfragen zwischenzuspeichern, und diese falls nötig bei der nächsten Anfrage als Kontext mitzuliefern. Das Prinzip der Zustandslosigkeit (engl statelessness) erlaubt die beste Lastverteilung, Failover bei Serverausfällen, vor allem aber den Austausch von Server-Resourcen, ohne damit den Client zu beeinträchtigen.
Lese weiter…