natural language processing

Events

images/02_events/digital%20humanitis.jpg#joomlaImage://local-images/02_events/digital humanitis.jpg?width=1200&height=450
Monday, August 7th, 2023 | 9:45 - 17:00 p.m

Named Entity Recognition für Geisteswissenschaftler:innen mit Stanford CoreNLP

Staats- und Universitätsbibliothek, Raum BT17a

Wie können wiederkehrende Einheiten, wie Personennamen oder Titel literarischer Werke in großen Textkorpora automatisch ausfindig und annotiert werden? Wie kann eine erste inhaltliche Erschließung literarischer Texte digital umgesetzt werden und auf welche Art und Weise lassen sich Verfahren des maschinellen Lernens für geisteswissenschaftliche Forschungsszenarien fruchtbar machen?

Diesen und anderen Fragen, die mit dem Einsatz digitaler Verfahren der Textanalyse einhergehen, werden wir im Rahmen des Workshops “Named Entity Recognition für Geisteswissenschaftler:innen mit Stanford CoreNLP” nachgehen. Dabei lernen Sie ein ausgewähltes Tool im Hands-On-Modus kennen, das in den Digital Humanities zur sog. Named Entity Recognition, also: die automatische Klassifikation/Annotation wiederkehrender Entitäten wie Personen, Werke, Orte und Organisationen, eingesetzt wird. Neben einer kurzen inhaltlichen Einführung in die Named Entity Recognition steht vor allem die praktische Anwendung der Methode im Vordergrund.

Dabei können Sie entweder direkt mit eigenen Texten arbeiten oder auf vorbereitete Materialien zurückgreifen. Technische Vorkenntnisse sind für die Teilnahme nicht vonnöten. Bringen Sie lediglich einen internetfähigen Laptop, für Ihre Forschung relevante Texte (optional) und eine große Portion Neugier auf digitale Verfahren der Textanalyse mit.

Referent:in: Marie Flüh (UHH). Die Teilnehmer:innenzahl ist beschränkt auf 15, daher wird um Anmeldung an forschungsdienste@sub.uni-hamburg.de gebeten.

images/02_events/ML%20Sprachverarbeitung%20SUB.jpg#joomlaImage://local-images/02_events/ML Sprachverarbeitung SUB.jpg?width=800&height=300
Wendsday, August 16th, 2023 | 17:00 - 18:30 p.m

Natural Language Processing für Digital Humanities - Grundlagen und neuste Entwicklungen

Staats- und Universitätsbibliothek, Raum BT17a

Verfahren des maschinellen Lernens im Kontext der Sprachverarbeitung sind momentan in aller Munde. Noch ist unklar, wie und wo genau Systeme wie etwa ChatGPT in der Forschung zum Einsatz kommen werden. Schon lange werden jedoch, auch in den Digital Humanities, mit regel-basierten und statistischen Verfahren Texte automatisiert analysiert. Für Forschende bleibt es wichtig ein Verständnis der Methoden zu entwickeln, um so jeweils die passende Technik zur Anwendung zu bringen und dabei insbesondere die Schwächen der Methoden zu berücksichtigen.

In seinem Vortrag beleuchtet Hans Ole Hatzel zunächst die Grundlagen der computergestützten Textverarbeitung und erklärt dabei von Tokens und Types bis hin zu Word Embeddings und Sentiment Analyse unterschiedliche etablierte Techniken. Einige Verfahren werden mit Beispielen aus den Digital Humanities hinterlegt, um neben den Methoden selbst auch zu verdeutlichen, wie sie konkret Anwendung finden. Am Schluss folgt ein Ausblick auf die Verwendung von Large Language Models, der Technologie hinter ChatGPT, in den Digital Humanities.

Referent:in: Hans Ole Hatzel (UHH)

People

images/03_personen/anne_lauscher.png#joomlaImage://local-images/03_personen/anne_lauscher.png?width=240&height=240

Anne Lauscher

Professor of Data Science
anne.lauscher@uni-hamburg.de
images/03_personen/debayan%201.jpg#joomlaImage://local-images/03_personen/debayan 1.jpg?width=364&height=364

Debayan Banerjee

research associate
debayan.banerjee@uni-hamburg.de
images/03_personen/dirk_hartung.jpg#joomlaImage://local-images/03_personen/dirk_hartung.jpg?width=500&height=500

Dirk Hartung

Executive Director, CLTDS
dirk.hartung@law-school.de
images/03_personen/gregor-wiedemann.jpg#joomlaImage://local-images/03_personen/gregor-wiedemann.jpg?width=360&height=360

Gregor Wiedemann

Senior Researcher Computational Social Science
Head of the Media Research Methods Lab (MRML)
g.wiedemann@leibniz-hbi.de
images/03_personen/marc_schulder.jpeg#joomlaImage://local-images/03_personen/marc_schulder.jpeg?width=481&height=489

Marc Schulder

Research Associate
IDGS
DGS-Korpus project
marc.schulder@uni-hamburg.de
images/03_personen/Stefan_Bonn.jpg#joomlaImage://local-images/03_personen/Stefan_Bonn.jpg?width=360&height=360

Stefan Bonn

Institute Director, Institute of Medical Systems Biology
Professor for Systems Biology
stefan.bonn@zmnh.uni-hamburg.de

Institutions

images/04_Institute/logo-lt.jpg#joomlaImage://local-images/04_Institute/logo-lt.jpg?width=360&height=361

Language Technology Group, Dept. of Informatics, UHH

Research group working on all aspects of natural language processing with a focus on semantics, human-in-the-loop methods and adaptive systems

images/04_Institute/hbi-logo.jpg#joomlaImage://local-images/04_Institute/hbi-logo.jpg?width=360&height=360

Media Research Methods Lab at the Leibniz-Institute for Media Research | Hans-Bredow-Institut

The Media Research Methods Lab (MRML) at the HBI combines the methodological expertise of the HBI in an organisational unit that focuses on linking established social science methods with novel digital procedures.

images/04_Institute/SUB-Logo.png#joomlaImage://local-images/04_Institute/SUB-Logo.png?width=272&height=185

Referat für Digitale Forschungsdienste, State and University Library Hamburg Carl von Ossietzky

Unit for the integration of digital humanities activities and services into the SUB portfolio

Universität Hamburg
Adeline Scharfenberg
Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein. 

Universität Hamburg
Adeline Scharfenberg
Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein. 

Universität Hamburg
Adeline Scharfenberg
Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein.