The plumbing of corpus linguistics: A guided tour of the corpus-processing pipeline (Methodenworkshop)

Dozent(en)David Lukes
AnsprechpartnerChristina Meuser, Dennis Dressel
Emailcontact@hpsl.uni-freiburg.de
Anmeldung per Email ist erforderlich.
Termin23.-25. Januar 2019
OrtAlter Senatssaal, Wilhelmstraße 26

While it’s not necessary to know how corpus software works in order to use it, having a high-level idea of the entire process, from raw data to what happens when you type a query into a search interface, can help you become a power user. Providing you with such a general idea is the goal of this workshop. We’ll cover the following topics:

  • technical background: how text is represented inside a computer (file formats, plain text, character sets and encodings)
  • adding annotation: metadata (author, year of publication…), morphological tagging
  • corpus query systems: what’s their purpose (why not directly search the plain text files?), how they work behind the scenes, standard formats

The concepts will be illustrated with practical examples using the corpus query systems Corpus Workbench, (No)SketchEngine and ANNIS, and other related tools. By the end of the workshop, you should have a better intuition for what can and cannot be achieved using corpora, and you should also be better equipped to deal with the technical pitfalls of conducting corpus research.


News

Die HPSL bietet zum Herbstsemester 2019 ein Stipendium für Doktorand/innen in Basel. Bewerbungsschluss ist der 17.April 2019. Weitere Informationen finden Sie hier.

Wir freuen uns, Sie zu unserem 10-jährigen Jubiläum einladen zu dürfen!

Ab 1. Dezember 2018 stehen Ihnen als assoziierte ProfessorInnen unserer Schule Prof. Dr. Juan Ennis, U. La Plata / Buenos Aires; Prof. Dr. Mar Garachana, U. Barcelona, Prof. Dr. Elisabeth Gülich, U. Bielefeld und Prof. Dr. Michael B. Buchholz, I.P.U. Berlin als BetreuerInnen und/oder GutachterInnen zur Verfügung. Wir begrüßen die neuen KollegInnen in unserer Runde!

Am 15.Oktober 2018 wurde das Corpus Salcedo von Pieter Muysken veröffentlicht. Es wurde in Freiburg und Basel in Zusammenarbeit mit einem internationalen Team editiert und kann nun über das in Freiburg entwickelte Korpusverwaltungstool moca3 (Daniel Alcón) genutzt werden.

Hermann-Paul-Preis für herausragende Dissertationen

Seit Winter 2018 verleihen wir jährlich den Hermann-Paul-Preis für herausragende Dissertationen. 
Weitere Informationen zur Verleihung 2019 finden Sie in Kürze hier.

Gastwissenschaftler

Scholarships

PhD Scholarships Hermann Paul Scholarships in Linguistics 2019

The call for the Hermann Paul Scholarship in Linguistics 2019 in Basel is now open. Find more information here

PhD Scholarships Hermann Paul Scholarships in Linguistics 2018

The Hermann Paul Scholarship in Linguistics 2018 in Basel went to Joelle Loew. Congratulations!

PhD Scholarships Hermann Paul Scholarships in Linguistics 2017

The Hermann Paul Scholarships in Linguistics 2017 in Basel went to Robert Reinecke and Valentina Saccone. Congratulations!

Upcoming Events

25.-26. Februar 2019
Transferring embodied knowledge. Multimodal approaches to interactive practices for knowledge constitution

26. Februar 2019, 16-18 Uhr
Das Gespräch als Gegenstand linguistischer Forschung. Interdisziplinäre Aspekte am Beispiel von Arzt-Patient-Gesprächen (Ringvorlesung Sprache und Kommunikation)

Newsletter

Forschen
über
Ausbildungsstufen
und
Grenzen
hinweg