Anna Zielińska, Björn Hansen, Marek Nekula, Felicja Księżyk, Aneta Bučková, Carolin Centner, Barbara Alicja Jańczak, Anna Jorroch, Iga Kościołek, Irena Prawdzic, Michał Woźniak

Międzynarodowy zespół slawistów i germanistów oddaje do użytku badaczy i badaczek multimodalny korpus dwujęzyczności polsko-niemieckiej LangGener. Korpus jest efektem projektu „Pokoleniowe zróżnicowanie języka: zmiany morfosyntaktyczne wywołane przez polsko-niemiecki kontakt językowy w mowie osób dwujęzycznych” finansowanego ze środków Narodowego Centrum Nauki, nr projektu 2016/23/G/HS2/04369, afiliowanego w Instytucie Slawistyki Polskiej Akademii Nauk oraz ze środków Niemieckiej Wspólnoty Badawczej (Deutsche Forschungsgemeinschaft), nr projektu HA 2659/9-1, afiliowanego w Uniwersytecie w Ratyzbonie (Universitӓt Regensburg).

Korpus obejmuje ok. 78 godzin nagrań w języku polskim i niemieckim z 58 przedstawicielami dwóch generacji. Pierwszą generację tworzą osoby urodzone przed 1945 rokiem w Niemczech, na ziemiach przyłączonych do Polski w 1945 roku, które pozostały w Polsce. Nazywamy tę grupę Generacja Polska/Generation Polen, skrót GP– od kraju zamieszkania. Drugą generację stanowią osoby urodzone także na tych terenach, ale po 1945 roku, czyli już w Polsce. Przedstawiciele tej generacji wyemigrowali do Niemiec i tam mieszkają. Nazywamy tę generację Generacja Niemcy/Generation Deutschland, skrót GD. Korpus jest anotowany gramatycznie i socjolingwistycznie (!). Użytkownikom korpusu oddajemy do dyspozycji nagrania i ich transkrypcje wykonane metodą półortograficzną, przystępną dla wszystkich odbiorców. Jednym z celów projektu była dokumentacja wymierających dialektów niemieckich na terenie zachodnio-północnej Polski.
Dlatego teksty nagrane w języku niemieckim w Polsce zostały przetranskrybowane z zachowaniem cech dialektalnych. Dodatkowo korpus został uzupełniony o bogate metadane zawierające: kryptonim mówcy; rok urodzenia; generację (GD ; GP); płeć; rok imigracji (dla GD); poziom wykształcenia (podstawowe niepełne, podstawowe pełne, zawodowe, średnie, wyższe), zawód; region urodzenia; miejsce urodzenia; region zamieszkania i miejsce zamieszkania. Ponadto metadane zawierają opisy idiolektów; przy czym szczegółowo opisane są cechy dialektów niemieckich w Polsce.

Gramatycznie zaanotowano zjawiska kontaktu językowego (kalki), wskazując frazę składniową, w obrębie której dane zjawisko wystąpiło. Typy fraz wyodrębniono na podstawie wykładnika, który określa właściwości gramatyczne danej grupy wyrazów. Wyróżniono  następujące typy fraz: nominalną, czasownikową, przyimkową, przymiotnikową, przysłówkową oraz zdaniową. Zjawiskami kontaktu językowego są z kolei: bezpośrednia replikacja morfemów i form fonologicznych z języka źródłowego; replikacja wzorców, czyli dystrybucji, znaczenia lub związku formy z funkcją według modelu języka źródłowego (sama forma nie jest przy tym replikowana); inne różnice w stosunku do normy danego języka, których nie można wyjaśnić zastosowaniem wzorców z języka źródłowego; code-switching, czyli przełączanie kodu językowego wewnątrz jednej wypowiedzi; odchylenia w zakresie porządku składniowego; autokorektę, czyli wyrażenia i sformułowania, które mówcy sami identyfikują jako nieadekwatne lub niepoprawne i zastępują je innymi wyrażeniami i sformułowaniami.

Nowatorska anotacja socjolingwistyczna ma ułatwić opracowywanie wywiadów pod względem treści odnoszących się do biografii językowych mówców. Biografia językowa to historia przyswajania i używania języków w ciągu całego życia człowieka, z uwzględnieniem nabywania, używania, zmiany i utraty języka w politycznym i społecznym kontekście. Anotacja opiera się na trzech kategoriach: etapów życia (czyli: wczesnego dzieciństwa, dzieciństwa, wieku szkolnego, wieku dorastania, dorosłości i wieku podeszłego), sfer użycia języka/domeny
(czyli: rodziny/domu, sąsiedztwa/miejsca zamieszkania, religii/wyznania, przyjaciół/znajomych, edukacji, pracy, administracji, mediów/prasy, telewizji, internetu, związków mniejszości narodowych, podróży, ego dokumentów/pamiętników, listów) oraz konceptualizacji dwujęzyczności (czyli: przeżycia językowego, ideologii językowych, zarządzania językiem). Zespół ma nadzieję, że korpus LangGener spotka się z zainteresowaniem i będzie wykorzystywany przez językoznawców, kulturoznawców, socjologów, antropologów i przedstawicieli innych dyscyplin naukowych do własnych badań. Korpus LangGener jest dostępny pod linkiem:

https://langgener.ijp.pan.pl/#!/