Digital Humanities – Wissenschaft in Arbeit

Hier die Einleitung eines Artikels, den ich zusammen mit Ulla Tschida geschrieben habe.

(Sonja Palfner, Ulla Tschida: Digitale Humanities – Wissenschaft in Arbeit, in: Martin Kintzinger und Sita Steckel (Hrsg.): Akademische Wissenskulturen. Praktiken des Lehrens und Forschens vom Mittelalter bis zur Moderne, Ostfildern: Schwabe Verlag, im Erscheinen)

„Geistes- und Sozialwissenschaften forcieren ihr Engagement für Forschungsinfrastrukturen“[1] – diese Pressemitteilung des Wissenschaftsrats vom 12. Dezember 2011 wie auch die Anfang 2011 erschienenen Empfehlungen vom Wissenschaftsrat zu Forschungsinfrastrukturen in den Geistes- und Sozialwissenschaften[2] machen auf eine aktuelle digitale Konjunktur aufmerksam, die zunehmend – selbstredend nicht in allen Disziplinen gleichermaßen – gespürt und praktiziert wird.

Im Folgenden wird die Entwicklung von elektronischen Hilfsmitteln in der sprach- und literaturwissenschaftlichen Forschung am Beispiel von TUSTEP und TextGrid rekonstruiert und die spezifischen Charakteristika der Entwicklung und Nutzung von neuen digitalen Werkzeugen sowie der Institutionalisierungsprozesse, die durch und rund um die Technik entstehen, herausgearbeitet.

Das Tübinger System von Textverarbeitungsprogrammen (TUSTEP) ist ein Set an Programmen zur computergestützten Textproduktion und -nutzung und wird seit 1978 am Zentrum für Datenverarbeitung (ZDV) der Universität Tübingen entwickelt: „TUSTEP ist ein Werkzeug zur wissenschaftlichen Bearbeitung von Textdaten (auch solchen in nicht-lateinischen Schriften), wie es vor allem in den Geisteswissenschaften benötigt wird. Es enthält Bausteine für alle Arbeitsgänge beim computer-gestützten wissenschaftlichen Umgang mit Textdaten, von der Erfassung über Abfrage, Analyse, Sortierung, Speicherung und andere Arten der Verarbeitung von Textdaten bis zur Ausgabe in gedruckter oder elektronischer Form“[3]. Im Februar 2012 standen erstmals die Installationspakete (noch kein Quellcode) unter der Revised BSD License[4] frei zur Verfügung. Die Entwicklung von TUSTEP wurde in den Anfängen von der Universität Tübingen und dem Land Baden-Württemberg gefördert[5].

In TextGrid wird eine grid-basierte virtuelle Forschungsumgebung für die Geistes- und Kulturwissenschaften seit Februar 2006 unter der Koordination der Abteilung Forschung und Entwicklung der Niedersächsischen Staats- und Universitätsbibliothek Göttingen (SUB) entwickelt und in den Betrieb überführt: „TextGrid ist ein Forschungsverbund, dessen Ziel es ist, den Zugang und den Austausch von Informationen in den Geistes- und Kulturwissenschaften mit Hilfe moderner Informationstechnologie (Grid) zu unterstützen. Seit 2006 wird eine internetbasierte Plattform aufgebaut, die Wissenschaftlern Werkzeuge und Dienste für die Auswertung von textbasierten Daten in unterschiedlichen digitalen Archiven bietet – unabhängig von Datenform, Softwareausstattung oder Standort“[6]. TextGrid war im Rahmen der D-Grid Initiative, die in diesem Jahr 2012 ausgelaufen ist[7], das einzige geisteswissenschaftliche Community-Projekt. Allerdings war TextGrid erstens nicht von Anfang an dabei (die ersten Projekte waren ausschließlich aus den Natur- und Technikwissenschaften) und zweitens wurde TextGrid nicht aus demselben Referat gefördert wie die anderen Grid-Projekte.

Sowohl TUSTEP als auch TextGrid sind auf den ersten Blick technische Systeme, die zur Produktion und Nutzung von Textdaten im wissenschaftlichen Kontext entwickelt werden. Der Einsatz bis dato unbekannter Computertechnologien eröffnet unbestritten neue Möglichkeiten für den Forschungsprozess und die Forschungspraktiken. Damit einhergehend ist auch eine Veränderung der Anforderungsprofile von Forschenden zu erwarten: „Wenn es weniger Mühe macht, Bücher oder Informationen zu finden, kann man damit auch nicht mehr brillieren“[8].

IT-Systeme wirken nicht selten als eine ‚Black Box‘ im Forschungsprozess selber und schaffen Abhängigkeiten und spezifische Voraussetzungen für das wissenschaftliche Arbeiten, die dem Forschenden häufig (und aufgrund fehlender IT-Kenntnisse) nicht unmittelbar zugänglich sind.

Nun scheint Technik darüber hinaus noch eine weitere Funktion zu besitzen: Auf den zweiten Blick, der sich auf Institutionalisierungsprozesse richtet, entfalten sich eben diese technischen Systeme zu sozialen Interaktionsfeldern, in denen die Frage nach der Wissenschaftsordnung gestellt und ausgehandelt wird. Die Entwicklung einer spezifischen Technologie bzw. die Nutzung der mittels neuer Technologien erzeugten Forschungsdaten ist somit nicht zu trennen von Prozessen, in denen Fragen von Arbeitsteilung und Rollenmustern, von Qualitätsstandards, Organisations- und Arbeitsabläufen und Verfahren aufgeworfen werden. Neue Technologien scheinen also ein Stimulus für die Auseinandersetzung wissenschaftlicher Disziplinen mit ihren epistemischen Praktiken und Lehrpraktiken und deren Möglichkeitsbedingungen darzustellen. Insofern könnte man formulieren, dass Technik die Rolle eines mehrdeutigen Hilfsmittels zukommt. Oder anders formuliert: Technische Systeme scheinen ein Potenzial zu besitzen, die Frage nach dem ‚Wie‘ von Forschung zu evozieren.

Nun ist dieser Beitrag keine systematische Aufarbeitung der Entwicklung der beiden Systeme. Wir möchten vielmehr an einzelnen Aspekten zeigen, dass das historische Moment dessen, was als ‚Digital Humanities‘ bezeichnet wird, nicht so sehr in der Unmittelbarkeit neuer wissenschaftlicher Ergebnisse zu finden ist, sondern in dem Versuch eines Wandels von Wissenschaftsformen. Form meint hierbei „ein spezifisches Muster der Organisation gesellig-gesellschaftlicher Beziehungen oder – anders ausgedrückt – wiederkehrende Verknüpfungsregeln gesellig-gesellschaftlichen Umgangs“[9]. Es geht uns also nicht darum, alle Disziplinen der Geisteswissenschaften, die vom Computer Gebrauch machen, unter einem neuen Begriff zu versammeln, nur weil mit der IT-Entwicklung häufig das Versprechen auf eine neue (bessere) epistemische Praxis einhergeht. Vielmehr interessiert uns der Begriff ‚Digital Humanities‘ als Prozess und als Praktiken, die in die soziale Konstruktion der Wissenschaft eingreifen.


[1]    Zur Pressemitteilung des Wissenschaftsrats s. den folgenden Link:

[www.wissenschaftsrat.de/index.php?id=404&=], 30.04.2012.

[2]    Wissenschaftsrat, Empfehlungen zu Forschungsinfrastrukturen in den Geistes- und

Sozialwissenschaften 2011. Vgl. im Internet http://www.wissenschaftsrat.de/download/archiv/10465-11.pdf.

[3]           Zu TUSTEP s. den folgenden Link: [www.tustep.uni-tuebingen.de], 10.04.2012.

[4]           Zu den Lizenzbedingungen von TUSTEP s. den folgenden Link: [www.tustep.uni-tuebingen.de/lizenz.php], 10.04.2012.

[5]           Wilhelm Ott, 25 Jahre Literarische und Dokumentarische Datenverarbeitung an der Universität Tübingen – ein kurzer Rückblick, in: Protokoll des 65. Kolloquiums über die Anwendung der Elektronischen Datenverarbeitung in den Geisteswissenschaften an der Universität Tübingen vom 18. November 1995. S. den folgenden Link: [www.tustep.uni-tuebingen.de/prot/prot651-ott.html], 10.04.2012.

[6]           Zu TextGrid s. den folgenden Link: [www.textgrid.de/startseite.html], 10.04.2012.

[7]           Zu D-Grid s. den folgenden Link: [www.d-grid.de], 10.04.2012.

[8]           Hanno Birken-Bertsch, Die Digitalisierung des Verstehens, in: Digitale Wissenschaft. Stand und Entwicklung digital vernetzter Forschung in Deutschland, hg. von Silke Schomburg, Claus Leggewie, Henning Lobin und Cornelius Puschmann, Köln 2011, S. 13-19, hier: S. 15. Vgl. im Internet http://www.hbz-nrw.de/dokumentencenter/veroeffentlichungen/Tagung_Digitale_Wissenschaft.pdf.

[9]           Wolf-Dieter Narr, Zum Politikum der Form, in: Leviathan 8 (1980), Nr. 2, S. 143-163, hier: S. 148.

Advertisements

TextGrid in Darmstadt

Am 14. und 15. Mai richtete die TU Darmstadt den „TextGrid Summit“ aus. Damit ist der Abschluss der zweiten Förderphase von TextGrid vollbracht.

Auch wenn die zweite Phase zu Ende gegangen ist, TextGrid wird jetzt den Institutionalisierungsprozess weiter betreiben. Hiefür wurde die Form eines Vereins gewählt, der am 16.5.12 gegründet wurde: Presseinformation: TextGrid: Virtuelle Forschungsumgebung für die Geisteswissenschaften.

***

Unser Projekt hatte in Darmstadt die Möglichkeit, dem Projektträger und den Kolleginnen und Kollegen aus TextGrid vom Verlauf des E-Science Interfaces Projektes zu berichten. Das Projekt läuft drei Jahre und wir feiern in diesem Monat tatsächlich schon Bergfest! Die Präsentationsfolien finden Sie hier.

Mit dem Ende der zweiten Förderphase von TextGrid endet auch unsere teilnehmende Beobachtung des Projektes. Wir sagen an dieser Stelle „VIELEN DANK TEXTGRID!!!“.

Artikel schreiben…

In der letzten Zeit war ich damit beschäftigt einen Artikel zu schreiben. Im September hatte ich ja auf der Tagung “Research technologies – Forschungstechnologie” der Deutschen Gesellschaft für Geschichte der Medizin, Naturwissenschaft und Technik e.V. ( 23.09.2011-25.09.2011) an der  Universität Stuttgart in der Sektion “Rechnen als Forschungstechnologie” zum Thema  „Das Klimarechenzentrum – Ein generischer Ort der Forschungstechnologie des Rechnens“ gesprochen.

Nach der Tagung wurde ich angefragt einen Artikel für einen Sammelband zu schreiben. Hier also der Anfang – der Sammelband soll noch in diesem Jahr erscheinen…

Das Deutsche Klimarechenzentrum – Kartographie eines Rechenraumes

This article explores the situatedness of High-Performance-Computing using the example of the German Climate Computing Center (DKRZ).  There are many good reasons for investigating the space of computing, which includes both the practices that enfold in a certain space creating this space through these practices at the same time and the institutions together with their buildings. In Hamburg a research technology space has been created quasi traversal to the institutional infrastructures. But did they also succeed in building up a research technology institution as well? Ideas in this regard were not lacking and the daily routine of the DKRZ seemed to stand the test offering a respective potential for such an innovation. However, something different has happened: The power of form as practice struck hard. The research technology ‘intermediate’ should not receive an own institutional location.

Das Geomatikum ist ein grauer Klotz, der sich in den Hamburger Himmel streckt. Das 18-stöckige Hochhaus wurde in den 1970er Jahren gebaut und beherbergt Teile der Fakultät für Mathematik, Informatik und Naturwissenschaften (MIN) der Universität Hamburg.
1988 nahm das Deutsche Klimarechenzentrum GmbH (DKRZ) im 12. und 15. Stock (und später im 17. Stock) seine Arbeit auf. Doch bevor es soweit kommen konnte, musste der Computer, eine CRAY 2S, zunächst einmal in die Höhe befördert werden. Über den herkömmlichen Weg konnte das knapp 2,5 Tonnen schwere Ding allerdings nicht nach oben kommen, es war für die Fahrstuhltechnik schlicht zu schwer. Also beförderte ein Kran den Rechner 55 Meter hoch in den 15. Stock. Dieser Höhenflug könnte als eines der ersten Zeichen für den phantastischen Aufstieg gelesen werden, den das Höchstleistungsrechnen in den Wissenschaften seit den 1980er Jahren genommen hat. Doch einmal abgesehen von der assoziativen Kraft des Bildes eines in die Höhe schwebenden Computers scheint sich hier die Frage nach der Situiertheit des Höchstleistungsrechnens zu stellen. Dieser Frage werde ich  anhand der Geschichte des Deutschen Klimarechenzentrums nachgehen…


TEI – Lost in translation? Einblicke in Infrastrukturarbeit

Am 16. August kam über Twitter (#teiputsch) die Meldung, dass der Vorsitzende des TEI-C Board, Martin Mueller, zurückgetreten war. (Danke an Markus B. Schnoepf für den Hinweis auf der FB-Gruppe Digital Humanities Berlin)

In Folge spekulierte die Community u.a., in wieweit ein offener Brief (1) von Martin Mueller an die TEI-Gemeinde eine Rolle in den Geschehnissen spielt. Das hat mich neugierig gemacht – eine Wertung seiner Gedanken zum aktuellen Stand der TEI liegt mir fern, aber in jedem Fall gab mir die Lektüre des offenen Briefes Anregungen, um über unterschiedliche Aspekte der Infrastrukturarbeit im wissenschaftlichen Bereich nachzudenken.
(In der Zwischenzeit gab es auch eine Reaktion des Technical Council von TEI zum Rücktritt.)

Die Schwierigkeiten der TEI-Community, die Mueller in seinem Brief kritisch anspricht, geben einen möglichen Blick auf Infrastrukturarbeit: Es geht um Kompromisse zwischen unterschiedlichen Erwartungshaltungen, um mögliche „Gewinner und Verlierer“(2), die im Zuge der Infrastrukturarbeit zwangsläufig entstehen.
Mueller sieht eine Herausforderung in der aktuellen Rolle der TEI als Hybrid zwischen Standardisierungsgremium, wissenschaftlicher Gemeinschaft und Institution, die Mitgliedsgebühren erheben muss.Er erzählt von den Schwierigkeiten, über den Wert einer wissenschaftlichen Technologie mit den Vertretern der lokalen Serviceeinrichtungen zu verhandeln. Der „wissenschaftliche Mehrwert“ einer Forschungsinfrastrukturleistung muss schließlich auch in lokalen Budget-Entscheidungen vertreten werden. Er spricht über die Schwierigkeiten der Ausweitung des Nutzerkreises für eine wissenschaftliche Technologie, die zwar hochspezialisierte Auszeichnungen ermöglicht, aber seines Erachtens nur von einem geringen Teil der Forscher „decoded“ werden kann.
Eine seiner Kernaussagen ist die aus seiner Sicht mangelnde Berücksichtigung von Interoperabilität. „Unnecessary divergence and inconsistency (…) are only one reason for the fact that much of TEI encoding is „lost in translation“ “ (1, S.9): Die verstärkte Nutzung eines „basic set of tags“ sollte eine erste, grundlegende Verknüpfung unterschiedlicher Daten ermöglichen. Die Kernkodierung, wie sie in TextGrid genutzt wird, sieht er als positives Beispiel für die Idee einer „TEI-API for query tools“. Gleichzeitig sieht er einen Bedarf an der Fokussierung auf Such- und Indexierungstechnologien,  um das mögliche Query Potential reich ausgezeichneter XML-Dokumente auch effizient zu nutzen.

Infrastrukturarbeit bedeutet vorrangig Übersetzungs- und Vermittlungsarbeit zwischen Mensch und Maschine. Diese Vermittlung läuft mittels Technologie (wie Programmier- und Auszeichnungssprachen, Schnittstellen oder Protokolle), aber natürlich auch mittels sozialer Interaktion in der Entwicklung einzelner Bausteine von Forschungsinfrastrukturen. In dieser Vermittlung wird übersetzt, und damit wird auch ein- und ausgeschlossen. Durch die dynamische Interaktion der menschlichen als auch der nicht-menschlichen Akteure einer Infrastruktur unterliegen auch die notwendigen Übersetzungspraktiken einer ständigen Revision und Weiterentwicklung.
Auch die Entwicklung von TEI als wissenschaftliche Auszeichnungssprache für (historische) Texte ist „work in progress“, die notwendigerweise von Spannungen begleitet wird: Die Entscheidung über „notwendige“ und „optionale“ Elemente für sinnhafte Auszeichnung von wissenschaftlich relevanten Entitäten der Texte kann inter- und intradisziplinär stark variieren.
(Ein anderes Beispiel für die Notwendigkeit der ständigen Weiterentwicklung der Übersetzungstechnologie  ist das mit 1,69 Millionen Euro geförderte BMBF-Projekt ECOUSS, in dem u.a. Automatismen zur Anpassung von Compilern an die dynamische Entwicklung der parallelen Rechnerarchitekturen entwickelt werden soll. Mehr dazu hier oder hier )

Unabhängig, auf welcher „Ebene“ (oder „Layer“) der Infrastruktur übersetzt wird, es geht im Endeffekt immer um die Interaktion in einem sozio-technischen System: Mensch und Maschine agieren miteinander und stellen dabei ihre eigenen Bedingungen an die Kommunikation. Diese Bedingungen werden in der Entwicklung von Forschungsinfrastrukturen verhandelt. Dabei treffen unterschiedlichen Sprachen, Wissensbestände, Wertigkeiten und Praktiken aufeinander.  Peter Galison, in seiner Rekonstruktion der Entwicklung der Mikrophysik, prägte dafür den Begriff trading zone „as a social, material, and intellectual mortar binding together the disunified traditions of experimenting, theorizing, and instrument building.“(3)

Eine – wie auch immer wissenschaftlich definierte – „gelungene“ Kommunikation innerhalb von Forschungsinfrastruktren ist auch das Ergebnis der Verhandlungen über „generische“ und „spezifische“ Funktionalitäten sowie über die notwendige Weiterentwicklung von Technologien, Communities und tragenden Einrichtungen von Forschungsinfrastrukturen. Die „trading zone“ ist somit auch ein Ort der Verhandlungen über das noch Unbekannte. Und diese Verhandlungen sind geprägt von den unterschiedlichen Vorstellungen zum Umgang mit dem „Werdenden“, das nicht zuletzt beschrieben, geplant, entwickelt und finanziert werden soll. Die unterschiedlichen Vorstellungen zu „Innovation“ und „Nachhaltigkeit“ sind relevante Werte, mit denen dabei gehandelt wird.

(1) Letter to members of the TEI-C Board and Council. From Martin Mueller, chair, TEI-C Board. August 4, 2011.
(2) vgl.Edwards, Paul N.; Jackson, Steven J., Bowker, Geoffrey C. and Cory P. Knobel: Understanding Infrastructure: Dynamics, Tensions, and Design. Ann Arbor: DeepBlue 2007. S.24.
(3) Galison, Peter:Image and Logic. A Material Culture of Microphysics. UCP 1997. S.803

KII Bericht zur Informationsinfrastruktur in Deutschland erschienen

Die Kommission Zukunft der Informationsinfrastruktur (KII)  hat ihren Abschlussbericht  der Gemeinsamen Wissenschaftskonferenz des Bundes und der Länder (GWK) vorgelegt.

Die KII war 2009 gegründet worden, mit dem Ziel, ein nationales Gesamtkonzept der Informationsinfrastruktur in Deutschland zu erarbeiten.

Der Abschlussbericht ist auf der Informationsseite der KII online verfügbar.

BMBF – Bekanntmachung eHumanities

Anfang des Jahres veröffentlichte der Wissenschaftsrat seine Empfehlungen „Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaften stärken„.

Bereits seit einigen Jahren wird TextGrid vom BMBF gefördert. Und auch international finden Bewegungen in Sachen „Digital Humanities“ statt.

Nun hat das BMBF eine neue Bekanntmachung „eHumanities“ veröffentlicht. Hier finden Sie/findet Ihr die Bekanntmachung.