| ||
Obszar | cały świat | |
Liczba mówiących | ok. 3,3 mld[a] | |
Prajęzyk | język praindoeuropejski | |
Podział | 13 grup językowych (↓) | |
Kody rodziny językowej | ||
---|---|---|
ISO 639-5 | ine | |
ISO 639-6 | ineu | |
Glottolog | indo1319 | |
Występowanie | ||
![]() Języki indoeuropejskie na terenach Eurazji | ||
Ta strona zawiera symbole fonetyczne MAF. Bez właściwego wsparcia renderowania wyświetlane mogą być puste prostokąty lub inne symbole zamiast znaków Unikodu. |
Języki indoeuropejskie[1] – jedna z głównych rodzin językowych świata, największa pod względem liczby mówiących. Istnieje od co najmniej trzech i pół tysiąca lat w Europie, Indiach (stąd przymiotnik: indoeuropejskie) oraz Azji Zachodniej, współcześnie w użyciu na wszystkich zamieszkałych kontynentach. Zalicza się do niej kilkaset[b] spokrewnionych ze sobą języków, którymi jako ojczystymi posługuje się ok. 3,3 miliarda osób na całym świecie (co stanowi ponad 40% ziemskiej populacji).
Najnowsze klasyfikacje wyróżniają trzynaście indoeuropejskich grup językowych – albańską, bałtycką, celtycką, germańską, helleńską, indoaryjską, irańską, nuristańską, ormiańską, romańską (wywodzącą się z dawnej italskiej), słowiańską oraz wymarłe anatolijską i tocharską. Bliżej spokrewnione grupy łączone są w szersze kategorie – podrodziny, np. bałtosłowiańską (obejmującą języki bałtyckie i słowiańskie) czy indoirańską (indoaryjskie, irańskie i nuristańskie), niektórzy językoznawcy proponują również inne.
Do rodziny indoeuropejskiej należą prawie wszystkie języki Europy[c], w tym polski, wiele języków subkontynentu indyjskiego i Wyżyny Irańskiej, a także znacząca liczba języków starożytnych, odkrytych i udokumentowanych w różnym stopniu. Siedem z dziesięciu najczęściej używanych języków świata to języki indoeuropejskie: angielski (ponad 1,25 miliarda użytkowników) oraz hindi, hiszpański, francuski, bengalski, rosyjski i portugalski – każdym z nich mówi co najmniej 200 milionów ludzi. Są nimi też takie duże języki, jak: urdu, niemiecki, marathi, włoski czy perski. Co najmniej jeden z indoeuropejskich języków jest językiem urzędowym w większości państw świata.
Druga, po afroazjatyckiej, najstarsza pod względem źródeł historycznych nieprzerwanie istniejąca rodzina językowa – najdawniej zaświadczonym w piśmie (od XVII w. p.n.e.) językiem indoeuropejskim jest hetycki. Z połowy drugiego tysiąclecia p.n.e. pochodzą najstarsze teksty greckie (mykeńskie), zapewne z tego samego okresu pochodzi też najstarszy staroindyjski zabytek literacki – Rygweda. Spisana ona została jednak wiele wieków później na podstawie długiej tradycji ustnej, podobnie jak staroirańska Awesta. Niektóre z dawnych języków, jak sanskryt, klasyczna greka czy łacina znane są z tysięcy obszernych tekstów, inne tylko z pojedynczych inskrypcji, imion, nazw miejscowych lub cytatów w tekstach ówczesnych autorów.
Języki tej rodziny wykazują umiarkowane zróżnicowanie typologiczne; zasadniczo są one językami fleksyjnymi – odpowiednie wyrazy podlegają rozbudowanej koniugacji oraz deklinacji – aczkolwiek w wielu z nich, jak np. w językach germańskich, odmiana słów została mocno uproszczona. Podmiot generalnie znajduje się na początku zdania (w językach grupy celtyckiej – orzeczenie), jednak przy ścisłym zachowaniu odpowiednich form języki indoeuropejskie pozwalają na dość dużą dowolność szyku wyrazów. Wyjątkiem są języki typu pozycyjnego, takie jak angielski czy francuski, które z reguły wymagają określonej kolejności elementów w zdaniu.
Wspólnym przodkiem wszystkich języków indoeuropejskich był praindoeuropejski, którym mówiono kilka tysięcy lat p.n.e. na nieokreślonych dokładniej terenach zachodniej Eurazji. Nie został on zaświadczony bezpośrednio (nie są znane żadne źródła historyczne praindoeuropejskiego), lecz jego istnienie zostało wywnioskowane na podstawie licznych zbieżności w słownictwie, fonetyce i gramatyce różnych języków współczesnych i dawnych. Według językoznawców wiele z owych podobieństw jest zbyt głębokich, aby powstało wyłącznie wskutek wzajemnego oddziaływania – muszą być zatem odziedziczone z prajęzyka. Został on częściowo zrekonstruowany przy pomocy metody porównawczej.
Badaniem i porównywaniem języków tej rodziny, ich pochodzeniem, rozwojem i pokrewieństwem zajmuje się nauka zwana indoeuropeistyką. Natomiast umiejscowienie indoeuropejskiej praojczyzny jest przedmiotem wielu spekulacji nie tylko językoznawczych, lecz także archeologicznych, genetycznych i kulturoznawczych; dominujacą hipotezą jest teoria kurhanowa. Bliższe pokrewieństwo językowe z innymi rodzinami nie jest bliżej znane, aczkolwiek podejmowane są próby poszukiwania takich związków i wysuwane są różne propozycje.
Terminu języki indoeuropejskie jako pierwszy użył Thomas Young w 1813 r., współcześnie nazwa ta jest używana na całym świecie. W niemieckojęzycznej literaturze stosuje się też, dawniej bardziej rozpowszechnione, określenie języki indogermańskie.
Języki indoeuropejskie są przedmiotem badań nauki zwanej indoeuropeistyką, która jest specjalistycznym obszarem językoznawstwa. Zajmuje się ona badaniem rozwoju poszczególnych języków rodziny, zmian językowych w czasie i formułowaniem związanych z tym reguł, odtwarzaniem wymowy języków martwych, opracowywaniem klasyfikacji genetycznej[d] języków indoeuropejskich, a przede wszystkim rekonstrukcją ich przodka – języka praindoeuropejskiego[2]. Tym samym pokrywa się częściowo z językoznawstwem historyczno-porównawczym[3]. Rodzina indoeuropejska znajduje się również w sferze zainteresowań kulturoznawstwa, archeologii oraz genetyki, dla których rekonstrukcja prajęzyka jest celem służącym poznaniu hipotetycznej kultury praindoeuropejskiej, jej praojczyzny oraz genetycznego pochodzenia jej ludności[4]. Nowoczesne językoznawstwo indoeuropejskie – z zastosowaniem metod badawczych z prawdziwego zdarzenia – powstało na początku XIX w.[5] Wcześniejsze spostrzeżenia na temat podobieństw między niektórymi językami długo nie spowodowały szerszego zainteresowania tematem w ówczesnym świecie naukowym, powoli dochodząc do głosu dopiero w drugiej połowie osiemnastego stulecia[6].
Jednym z osiągnięć indoeuropeistyki jest udowodnienie faktycznego istnienia rodziny indoeuropejskiej – czyli takiej gromady języków, w której podstawowe podobieństwa wynikają z ich pochodzenia ze wspólnego źródła (prajęzyka), a nie z wzajemnych zapożyczeń[7] – oraz jej „genetycznego” (w kontekście językowym) charakteru, przypominającego model drzewa rodowego[8][e]. Podstawowa klasyfikacja języków indoeuropejskich jest więc klasyfikacją filogenetyczną (zwaną też historyczną[9]), opartą na udowodnionym lub co najmniej mocno domniemanym bliższym pokrewieństwie niektórych języków, widocznym w podobieństwach fonologicznych, słownikowych i gramatycznych. W specjalistycznych zastosowaniach (np. w badaniach nad typologią indoeuropejską) stosuje się też klasyfikację strukturalną, opartą na kryteriach morfologicznych, składniowych czy fonologicznych[10]. Szczególnym jej przypadkiem jest podział języków indoeuropejskich na języki kentum i satem, oparty na różnicach fonetycznych związanych z procesem palatalizacji indoeuropejskiej – na początku XX w. był on nawet uznawany za podstawowy i pierwotny wewnętrzny podział rodziny[11].
Główną metodą naukową w badaniach nad językami indoeuropejskimi jest metoda porównawcza[12], która opiera się na poszukiwaniu regularności w strukturze fonetycznej słów i w ich odmianie. Dzięki niej udowodnione zostało nie tylko istnienie rodziny, lecz także zrekonstruowany został pokaźny zasób słownictwa i gramatyki praindoeuropejskiej[13]. Inne często wykorzystywane w pracy badawczej metody to rekonstrukcja wewnętrzna[14], odtwarzająca dawniejsze fazy historyczne języka na podstawie istniejącego materiału, a także – kontrowersyjna, odrzucana przez wielu językoznawców – masowa komparacja leksykalna, porównująca słownictwo wielu języków i służąca poszukiwaniu powiązań filogenetycznych całej rodziny z innymi[15]. Metody wypracowane przez językoznawstwo indoeuropejskie znacząco przyczyniły się do postępu w badaniach nad innymi rodzinami językowymi[16].
W polskiej literaturze językoznawczej nie wypracowane zostały standardy terminologiczne dotyczące klasyfikacji genetycznej języków – autorzy dosyć dowolnie używają różnego nazewnictwa, często w sposób niekonsekwentny[f]. W niniejszym artykule za podstawową jednostkę podziału rodziny indoeuropejskiej – zgodnie z modelowym podziałem Tadeusza Milewskiego[17] – przyjęto grupę językową (jest to kategoria reprezentująca pewien poziom w hierarchii, nie należy jej mylić z potocznym rozumieniem „grupy języków” o dowolnych kryteriach). Innych jednostek użyto według klasycznej systematyki Alfreda Majewicza: wewnątrz grupy – podgrupa, zaś powyżej – pomiędzy grupą, a rodziną – podrodzina językowa[18]. Z kolei terminem „gałąź”, na wzór stosowanego w literaturze anglojęzycznej pojęcia branch[19], określono każdą jednostkę podziału filogenetycznego o dowolnej randze (podrodzina, grupa itd.) wewnątrz rodziny. Został on użyty tam, gdzie zaszła potrzeba zwięzłego zestawienia ze sobą różnych poziomów systematycznych bądź w przypadku, gdy ranga nie została sprecyzowana.
W literaturze z drugiej dekady XXI w. wyróżnianych jest z reguły 13 podstawowych grup językowych, często łączonych w 10 dużych gałęzi o różnych rangach[19]. Podział tego typu został zaprezentowany poniżej; symbolem † oznaczono języki lub grupy wymarłe, natomiast symbolem (†) – grupę lub język zasadniczo martwy, ale zachowany w niektórych dziedzinach (jak np. łacina). Rodzinę indoeuropejską tworzą zatem następujące gałęzie – grupy (jeśli nie zaznaczono inaczej) i podrodziny języków[19][20]:
Oprócz tego do rodziny tej należy też pewna liczba dokładniej niesklasyfikowanych języków starożytnych; istniały również języki, których indoeuropejski charakter jest dyskusyjny, lecz bywa rozważany. Wśród tych pierwszych znajduje się gromada luźno powiązanych języków paleobałkańskich†, wyróżnionych na podstawie kryterium geograficznego (używane na Bałkanach i niektórych pobliskich obszarach), w tym dwa kompleksy językowe[21]:
Ich charakter (faktyczne gałęzie języków czy może grupy dialektów pojedynczego języka) i pokrewieństwo z innymi grupami są przedmiotem spekulacji. Kwestie języków niesklasyfikowanych, ich przynależności do języków indoeuropejskich oraz ewentualnej pozycji w hierarchii rodziny zostały dokładniej przedstawione w innej sekcji.
Niektóre z indoeuropejskich grup językowych – co zostało już uwzględnione wyżej – na podstawie ich postulowanego bliższego pokrewieństwa często łączone są w kategorie wyższego rzędu, czyli podrodziny:
a także proponowane przez część językoznawców[22]:
Podrodzina indoirańska jest uznawana przez językoznawców bez żadnych wątpliwości – bliskie pokrewieństwo grup wchodzących w jej skład jest bardzo dobrze udokumentowane, także dzięki wielu źródłom historycznym[23]. Niewiele mniejsze uznanie dotyczy również języków bałtosłowiańskich[24][25] (dawniej postulowanie ich bliższych związków bywało czasem uważane za kontrowersyjne[26]). Więcej sporów wywołuje proponowana podrodzina italoceltycka[27], ale w XXI w. znacząca część naukowców uznaje wspólne pochodzenie języków celtyckich i italskich[22][28]. Mniej więcej taki sam status posiada kategoria helleno-ormiańska[29][30].
Szczegółowe stosunki między poszczególnymi grupami oraz dokładny kształt indoeuropejskiego drzewa rodowego są przedmiotem dyskusji i spekulacji; zostały one szerzej omówione w innej sekcji niniejszego artykułu. Bez większych kontrowersji wyróżniana jest grupa anatolijska, która wydaje się najbardziej odrębną gałęzią w hierarchii rodziny[19] – stanowi tym samym pierwszy, najwcześniejszy odłam indoeuropejskiego pnia.
W większości zaprezentowanych indoeuropejskich grup językowych można dokonać dalszego, bardziej szczegółowego podziału na podgrupy. Do każdej z nich należą języki o bardzo bliskim pokrewieństwie, najczęściej sąsiadujące ze sobą geograficznie. Przykładowy podział zaprezentowano w poniższej tabeli, opartej na klasycznych opracowaniach Ruhlena[31] i Majewicza[32] z końca XX w. Przyjęto następujące zasady i założenia:
Należy jednak pamiętać, że takie podziały są subiektywne i mogą się dość istotnie różnić w zależności od opracowania, także w kwestii hierarchii poszczególnych kategorii. Dotyczy to w szczególności grup indoaryjskiej – z uwagi na wielką liczbę jej drobnych, słabo zbadanych języków oraz romańskiej – co w tym przypadku spowodowane jest złożonością stosunków językowych owej gałęzi, pełnej wielu przenikających się etnolektów i wymykającej się prostej systematyce[34]. W nowszych klasyfikacjach obie dzielone są na trzy duże podgrupy. Romańska podgrupa italo-zachodnia obejmuje na niższych poziomach podziału większość klasycznych gałęzi przedstawionych w powyższej tabeli, a dodatkowo wyróżnia języki gallo-italskie (z lombardzkim czy piemonckim) oraz mozarabskie[35][36]. Z kolei w klasyfikacji Ethnologue mocno odmienna w stosunku do dawniejszych propozycji bywa przynależność poszczególnych języków indoaryjskich do konkretnych gałęzi[37]. Współczesne podziały wspomnianych grup przedstawione zostały poniżej.
Grupa językowa | Podgrupa (nowszy podział) |
Wybrane języki współczesne |
---|---|---|
indoaryjska | wewnętrzna | gudźarati, merwari, nepalski, pendżabski, radżastani, romski, zachodniopendżabski |
zewnętrzna | asamski, bengalski, bhodźpuri, kaszmirski, marathi, orija, syngaleski | |
zachodnie hindi | bradź, hindi, urdu | |
romańska | południowa | korsykański, sardyński |
wschodnia | arumuński, istrorumuński, meglenorumuński, rumuński | |
italo-zachodnia | francuski, hiszpański, kataloński, portugalski, prowansalski, sycylijski, włoski |
W niektórych zaprezentowanych podgrupach można dodatkowo wyodrębnić gałęzie językowe o jeszcze niższych rangach, do których należą języki o największym stopniu pokrewieństwa i najbardziej do siebie podobne. Przykładami takich kategorii są np.[20][31]:
Pełna klasyfikacja danego języka w hierarchii rodziny indoeuropejskiej może więc wyglądać następująco – na przykładach polszczyzny i języka bengalskiego:
Do indoeuropejskich należy też wiele języków bliżej niesklasyfikowanych – przede wszystkim paleobałkańskich[21], które są zbiorem rozmaitych wymarłych języków starożytnych, używanych głównie na terenach Bałkanów, a także częściowo w Azji Mniejszej i Italii. Są one znane z niewielkiej liczby źródeł pisanych, a w niektórych przypadkach wyłącznie z nazw miejscowych i stanowią przyczynę wielu spekulacji i kontrowersji. Do języków tych należą m.in.[l]:
oraz języki lub dialekty ilirskie†.
Spekuluje się, że język dacki jest bardzo bliski trackiemu lub wręcz jest jego dialektem[38][39]. Wysuwane są różne propozycje ich umiejscowienia w hierarchii rodziny – bywają traktowane jako bliżej niesklasyfikowany kompleks języków trackich[40] lub nawet jako odrębne, izolowane języki[33]. Inni badacze z kolei umieszczali je w jednej grupie z ormiańskim (pod łączną nazwą tracko-ormiańskich)[41] lub łączyli je z bałtosłowiańskimi w ramach szerszej kategorii bałto-bałkańskiej[42].
Bardzo słabo zaświadczony język myzyjski bywał dawniej łączony z dackim w grupę dako-myzyjską[43], a w niektórych nowych klasyfikacjach występuje jako dialekt frygijskiego[44]. Niewiele wiadomo również o peońskim, który najczęściej bywa zestawiany z trackimi lub ilirskimi (jako pośredni między nimi)[45]. Z językami ilirskimi jest łączony również mesapijski[46] (używany w starożytności na południowych terenach Półwyspu Apenińskiego), dawniej umieszczany wraz z nimi w odrębnej grupie iliro-mesapijskiej[47]. Same języki ilirskie bywały również zestawiane wraz z trackimi w większą kategorię języków tracko-ilirskich[48]. Kontrowersją bywa też łączenie współczesnego języka albańskiego, jedynego (w tradycyjnym ujęciu) przedstawiciela swojej grupy, z dawnymi językami lub dialektami Ilirów. Ich ślady pozostały jednak prawie wyłącznie w nazwach miejscowych, dlatego też niewiele można o nich powiedzieć[49].
Frygijski z kolei dawniej łączony był z językami trackimi i umieszczany w grupie tracko-ormiańskiej[41], współcześnie językoznawcy zwracają uwagę na jego dużą odrębność od nich i skłaniają się ku uznaniu jego bliższych związków z grupą helleńską (umieszczają go bezpośrednio w niej, bądź postulują istnienie szerszej kategorii greko-frygijskiej)[50][51]. Natomiast liburnijski i wenetyjski, używane kiedyś odpowiednio na terenach Dalmacji oraz dzisiejszej Wenecji Euganejskiej, są często łączone z grupą italską[47][52] (jako jej odrębne gałęzie). Dodatkową zagadką są widoczne wpływy przedindoeuropejskie w liburnijskim[47].
Do języków paleobałkańskich zasadniczo należą też[21]:
Ten pierwszy jednak nie jest prawie w ogóle uwzględniany we współczesnych publikacjach głównego nurtu nawet jako potencjalny indoeuropejski i prawdopodobnie należy do zupełnie innej rodziny językowej, choć dawniej rozważano jego indoeuropejską pozycję[53]. Natomiast język staromacedoński jest w XXI w., bez większych kontrowersji, klasyfikowany w grupie helleńskiej – jako jej osobna gałąź bądź wręcz jako język siostrzany starożytnej greki†[54].
Poza językami paleobałkańskimi do indoeuropejskich zaliczane są z reguły[o]:
a czasami również języki, których przynależność do rodziny indoeuropejskiej bywa podważana, choć niewykluczona:
Jako indoeuropejski, choć o nieustalonej pozycji, klasyfikowany przeważnie jest język elymijski z zachodniej Sycylii, mimo niewielu jego zachowanych źródeł[55]. Z kolei język luzytański z terenów Półwyspu Iberyjskiego ma jednoznacznie pośredni charakter celtycko-italski – bywa więc umieszczany w jednej z tych grup[56][57], bądź traktowany jest jako mieszany. Natomiast piktyjski, który używany był na północy Szkocji, klasyfikowany jest najczęściej w obrębie języków celtyckich[58]. W przeszłości zdarzało się, że bywał umieszczany poza nimi jako odrębna mowa indoeuropejska lub nawet nieindoeuropejska, pojawiały się też teorie o istnieniu dwóch różnych języków piktyjskich (jeden indo-, drugi przedindoeuropejski)[59].
W języku liguryjskim, używanym dawniej na terenach współczesnej Ligurii, odkryto wpływy przedindoeuropejskie, jego przynależność do rodziny indoeuropejskiej bywa więc podważana[60] – choć niektórzy wiążą lud mówiący owym językiem z Celtami[61]. Wreszcie północnopiceński ze środkowej Italii – mimo że rozszyfrowano litery z inskrypcji w tym języku, sprawia on trudności podczas prób identyfikacji znaczenia słów i jego status jest niejasny. Niektórzy badacze wskazują jednak, że struktura głosek w jego wyrazach przypomina indoeuropejską[62].
Duże rozbieżności występują w szacowanej liczbie języków indoeuropejskich:
Klasyfikacja | alb. | anat. | bałt. | celt. | germ. | helleń. | indoar. | irań. | ital. | nurist. | orm. | słow. | toch. | inne | Razem |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A. Majewicz (1989)[63] | 1 | 8 | 8 | 10 | 23 | 4 | 62 | 50 | 42 | – | 8 | 19 | 2 | 42 | 279 |
M. Ruhlen (1991)[31] | 1 | 5 | 3 | 7 | 16 | 3 | 49 | 49 | 23 | 5 | 2 | 15 | 2 | – | 180 |
Ethnologue 23 (2020)[20] | 4 | – | 5 | 6 | 47 | 6 | 218 | 85 | 44 | 6 | 2 | 21 | – | 1 | 445 |
Glottolog 4.3 (2020)[33] | 4 | 10 | 2 | 14 | 106 | 12 | 223 | 96 | 85 | 5 | 3 | 20 | 2 | 6 | 588 |
języki żywe
Jest to związane przede wszystkim z faktem, że niemożliwe jest ustalenie precyzyjnych kryteriów, pozwalających odróżnić język od dialektu – przebieg takiej granicy zawsze ma charakter mocno subiektywny[64]. Zwrócił na to uwagę w swojej klasyfikacji Alfred Majewicz, a jako dodatkowy problem wskazał podział języków na odmiany (niewiele się różniące lub wręcz identyczne) z powodów pozalingwistycznych (politycznych itp.), np.[65]:
Przedstawione w tabeli liczby mają więc wartość szacunkową, sam Majewicz podał jedynie zbiorczą liczbę około 280 etnolektów indoeuropejskich[67]. Należy dodać, że nuristańskie sklasyfikował jako podgrupę języków indoaryjskich[68], natomiast języki trackie powiązał z ormiańskimi jako grupę tracko-ormiańską[69]. Ruhlen z kolei pominął wszystkie starożytne języki paleobałkańskie, a z samych indoeuropejskich wyłączył języki anatolijskie – umieszczając obie kategorie w rodzinie nazwanej indo-hetycką[70].
Natomiast współczesne listy, wymienione w tabeli powyżej, traktują wiele dotychczasowych dialektów jako odrębne języki – stąd tak duża rozbieżność w łącznej liczbie. Klasyfikacja Ethnologue, opublikowana przez organizację SIL International, ignoruje w całości całkowicie wymarłe języki anatolijskie i tocharskie, skupiając się na współczesnych grupach. Baza Glottolog natomiast umieszcza dawny język tracki, a także kilka innych wymarłych języków, jako zupełnie osobne gałęzie rodziny indoeuropejskiej[33] (uwzględnione w kolumnie „inne”). Dodatkowo klasyfikuje język (staro)pruski† jako odrębny w ramach podrodziny bałtosłowiańskiej[71], czyli de facto osobną indoeuropejską grupę językową, traktując języki zachodniobałtyckie jako pośrednie między słowiańskimi, a (wschodnio)bałtyckimi – co jest dużą kontrowersją.
Kolejny aspekt dotyczy tzw. makrojęzyków, czyli jednostek klasyfikacyjnych standardu ISO 639-3. Za makrojęzyki zostały uznane grupy etnolektów różniących się odmianami, które są traktowane jako warianty tej samej mowy ze względów politycznych, religijnych czy kulturowych[72]. Co za tym idzie, w zależności od klasyfikacji mogą one być zliczane jako pojedyncze języki lub też za odrębne języki mogą być uznawane ich poszczególne odmiany. Do indoeuropejskich makrojęzyków według normy ISO 639-3 należą[73]:
Następna problematyczna kwestia związana jest z językami kreolskimi. Są to języki mieszane, powstałe (w przypadku omawianej rodziny) na bazie języków indoeuropejskich kolonizatorów, z bardzo dużym dodatkiem elementów języków lokalnych[74]. Zaliczone zostały one w poczet rodziny indoeuropejskiej przez Majewicza[75] (umieszczone w powyższej tabeli w kolumnie „inne”), a także w klasyfikacji Glottolog, gdzie zostały przypisane (w zależności od języka) do poszczególnych grup – szczególnie licznie w germańskiej.
Do kreoli należą m.in.[76][77]:
Niektóre z nich posiadają oficjalny status – kreolski haitański jest jednym z języków urzędowych na Haiti, podobnie jak bislama na Vanuatu i tok pisin w Papui-Nowej Gwinei. Z kolei papiamento jest jednym z oficjalnych języków na terytoriach Aruby, Bonaire i Curaçao[78].
Wreszcie, należy pamiętać, że języki indoeuropejskie są językami naturalnymi i błędne jest zaliczanie do nich rozmaitych języków sztucznych, stworzonych na ich bazie (nie robi tego żadna z zaprezentowanych w niniejszej sekcji klasyfkacji). Niemniej jednak pewna liczba wymyślonych międzynarodowych języków pomocniczych opartych jest na indoeuropejskiej podstawie. Należy do nich m.in. esperanto – najbardziej rozpowszechniony na świecie sztuczny język pomocniczy, bazujący głównie na językach romańskich[79].
Szacuje się, że pod koniec drugiej dekady XXI w. językami indoeuropejskimi jako ojczystymi mówi ok. 3,3 miliarda ludzi[80], czyli ponad 40% ziemskiej populacji. Poniższa tabela przedstawia dziesięć najczęściej używanych indoeuropejskich języków pod względem liczby mówiących (w milionach; dane opublikowane w lutym 2020)[81].
Lp. | Język indoeuropejski |
Grupa językowa |
Liczba mówiących |
W tym język ojczysty |
---|---|---|---|---|
1. | angielski | germańska | 1268 | 369,7 |
2. | hindi | indoaryjska | 637,3 | 342,0 |
3. | hiszpański | romańska | 537,9 | 463,0 |
4. | francuski | romańska | 276,6 | 77,3 |
5. | bengalski | indoaryjska | 265,2 | 228,5 |
6. | rosyjski | słowiańska | 258,0 | 153,6 |
7. | portugalski | romańska | 252,2 | 227.9 |
8. | urdu | indoaryjska | 170,6 | 69,0 |
9. | niemiecki | germańska | 131,6 | 75,5 |
10. | marathi | indoaryjska | 95,3 | 83,1 |
jęz. ojczysty
bardzo wysoki
wysoki
średni
niski
bardzo niski
Językami indoeuropejskimi mówią ludzie na wszystkich zamieszkałych kontynentach – nie tylko jako ojczystymi, lecz także jako dodatkowymi językami. W czasach nowożytnych rozprzestrzeniły się one z zachodniej Eurazji na cały świat wskutek kolonizacji pozostałych lądów[82], co spowodowało znaczny wzrost liczby osób mówiących od dziecka językami należącymi do tej rodziny. Jako ojczyste są one głównymi językami w następujących rejonach poszczególnych części świata[83]:
Dominującą rolę odgrywa język angielski, będący językiem internetu i globalnej komunikacji. Wiele osób na całym świecie uczy się angielskiego jako drugiego bądź kolejnego języka – szacuje się, że liczba ta może nawet przekraczać miliard[84].
Natomiast wiele mniejszych języków indoeuropejskich, w szczególności tych należących do podrodziny indoirańskiej (w tym cała grupa nuristańska), jest zagrożonych wymarciem, w Europie zaś zagrożone są m.in. języki celtyckie, retoromańskie, a także zachodniosłowiańskie języki łużyckie i kaszubski[85]. Także wiele lokalnych, drobnych języków romańskich i germańskich jest wypieranych przez duże języki ogólnokrajowe. Aczkolwiek zdarzają się próby rewitalizacji wymarłych już języków – tak stało się z celtyckimi kornijskim i manx, które ożywiono odpowiednio w XX i XXI w. Istnieje już bardzo niewielka grupa osób, dla których języki te są językami ojczystymi[86][87].
Współcześnie języki indoeuropejskie są językami urzędowymi w przeważającej większości krajów świata – wykaz owych języków został przedstawiony na poniższych listach, zgodnie z obowiązującą oficjalnie wersją opublikowaną przez Główny Urząd Geodezji i Kartografii[88]. Obejmuje on wszystkie uznawane przez Polskę kraje oraz terytoria niesamodzielne (niektóre z nich posiadają więcej niż jeden język urzędowy). Nazwy języków i ich odmiany zostały podane zgodnie z cytowanym źródłem i w niektórych przypadkach mogą się różnić od nazw powszechnie stosowanych w językoznawstwie.
Duże języki, urzędowe w co najmniej 5 krajach[88]:
Pozostałymi językami o statusie urzędowym są[88]:
Wyłącznie na terytoriach zależnych oficjalnymi językami są farerski (terytorium Wyspy Owcze), manx (terytorium Wyspa Man) i ogólny norweski (5 terytoriów)[89].
Ponadto niektóre języki indoeuropejskie są językami oficjalnymi dużych międzynarodowych organizacji, m.in:
Niektóre języki indoeuropejskie, wskutek wieloletniego bliskiego sąsiedztwa i wzajemnego oddziaływania, tworzą ligi językowe. W ich skład wchodzą języki z różnych, niekoniecznie blisko spokrewnionych ze sobą grup, które wykształciły wspólne cechy. Przykładem może być bałkańska liga językowa, do której należą głównie następujące języki z terenu Bałkanów[92]:
Ich cechą charakterystyczną jest upraszczanie deklinacji – indoeuropejska odmiana rzeczowników jest szczątkowa i w większości wymienionych języków ogranicza się do dwóch przypadków gramatycznych; w serbskim obserwowany jest proces rosnącego synkretyzmu przypadków, a w jego czarnogórskiej odmianie upodobniły się do siebie miejscownik i wyrażenia kierunku ruchu[93]. W językach ligi bałkańskiej istnieje dodatkowy czas przyszły tworzony przy pomocy czasownika posiłkowego „chcieć”, kilka czasów przeszłych, a bezokolicznik zanika. Ponadto większość z nich wytworzyła rodzajnik określony dołączany na końcu wyrazu, a w bułgarskim, macedońskim i albańskim występuje tzw. tryb nieświadka[94].
Innymi ligami językowymi są np. liga rokitnicka – do której należą języki polski i kaszubski (zachodniosłowiańskie), ukraiński i białoruski (wschodniosłowiańskie) oraz litewski (bałtyckie)[95], czy też liga wielkich języków Europy (tzw. liga SAE – Standard Average European), obejmująca języki angielski i niemiecki (germańskie), francuski, hiszpański i włoski (romańskie) oraz rosyjski (słowiańskie)[96]. Języki ligi SAE, wskutek ich wielowiekowego globalnego zasięgu, wykształciły dużą liczbę odpowiadających sobie słów i związków frazeologicznych o identycznych w owych językach znaczeniach, a także podlegają trwającemu wciąż upraszczaniu odmiany[97].
Powszechnym zjawiskiem wśród języków indoeuropejskich jest również istnienie wielu kontinuów dialektalnych, które dotyczą bardzo blisko spokrewnionych języków. Przenikają się one nawzajem, tworząc pomiędzy sobą pośrednie, lokalne dialekty, używane na co dzień przez ich użytkowników. Zmieniający się stopniowo, wraz z przemieszczaniem się na mapie językowej, ciąg takich płynnie przechodzących w siebie dialektów i języków nosi nazwę owego kontinuum[98]. Takimi kontinuami są w Europie np.[99]:
Natomiast w Azji istnieje wiele kontinuów języków indoaryjskich – dziesiątki z nich tworzy wzajemnie przenikające się ciągi językowe, co jest m.in. przyczyną podawania tak bardzo zróżnicowanej liczby języków owej grupy (często ciężko wyznaczyć granice pomiędzy poszczególnymi etnolektami oraz określić, co jest odrębnym językiem, a co tylko dialektem)[100].
Poniżej zaprezentowana została krótka charakterystyka wszystkich głównych indoeuropejskich grup językowych. Podane informacje dotyczące liczby ich użytkowników mają charakter szacunkowy (na podstawie danych opublikowanych w Ethnologue w lutym 2020)[20] i odnoszą się wyłącznie do języków ojczystych. W niektórych przypadkach (jeśli dane takie zostały udostępnione) podano alternatywne wartości według internetowej wersji Encyklopedii Britannica[101][q] – zostały one poprzedzone symbolem ʙ.
Języki albańskie
Według tradycyjnego ujęcia należy do nich jedynie język albański[102] (w dwóch zróżnicowanych odmianach: gegijskiej i toskijskiej). W nowszych klasyfikacjach, traktujących jego odmiany i dialekty jako odrębne języki, wyróżnia się cztery języki albańskie[103][104]. Są one używane głównie w Albanii, Kosowie i zachodniej Macedonii przez ok. 7 mln osób. Albańskie enklawy językowe istnieją też w południowych Włoszech (arboreska) i Grecji (arwanicka). Zaświadczone w piśmie dopiero od XV w.[105], stanowią jedną z najmłodszych indoeuropejskich grup językowych pod względem źródeł historycznych. Uległy bardzo silnym wpływom języków sąsiednich, z którymi należą do bałkańskiej ligi językowej. Przedmiotem spekulacji są ich związki ze starożytnymi językami ilirskimi† (według niektórych badaczy właśnie z nich wywodzi się współczesny albański)[106][107].
Języki anatolijskie†
Wymarła grupa starożytnych języków używanych w Anatolii na terenach dzisiejszej Turcji, najbardziej odrębna filogenetycznie i o najbardziej archaicznym charakterze pośród języków indoeuropejskich[108]. Należał do niej m.in. język hetycki†, najstarszy znany w piśmie indoeuropejski język – odkryte zostały teksty datowane na XVII w. p.n.e, a ślady hetyckich nazw własnych znaleziono nawet w obcojęzycznych tekstach z XIX w. p.n.e.[109] Ma on fundamentalne znaczenie dla badań rozwoju języków tej rodziny, gdyż zachował ślady praindoeuropejskich głosek krtaniowych[110]. Hetycki, podobnie jak inne starsze języki anatolijskie, np. luwijski† czy palajski†, stosował do zapisu pismo klinowe[111]. Nowsze języki należące do tej grupy znane są jeszcze z początków naszej ery[111].
Języki bałtyckie
Współcześnie należą do nich języki litewski i łotewski (w tym pewne dosyć odrębne dialekty), używane przez ok. 6 mln osób [ʙ ok. 4,9 mln] na południowo-wschodnich krańcach Morza Bałtyckiego. W piśmie znane dopiero od XVI w.[112] Litewski jest uważany za najbardziej archaiczny ze wszystkich współczesnych języków indoeuropejskich, stanowi tym samym cenny materiał do badań językoznawczych. Blisko spokrewniony z nim łotewski jest już znacznie bardziej nowoczesny[112]. Natomiast wymarły język pruski†, należący do innej podgrupy, posiadał jeszcze bardziej konserwatywny charakter niż litewski[113]. Języki bałtyckie zachowały m.in. 7 przypadków gramatycznych[114].
Języki celtyckie
W starożytności szeroko rozpowszechnione w Europie, a nawet w Azji Mniejszej[115], współcześnie w zaniku. Kilkoma należącymi do nich językami mówi ok. 1 mln osób na Wyspach Brytyjskich, Wyspach Normandzkich i w Bretanii. Najstarszym zaświadczonym w piśmie językiem tej grupy (od VI w. p.n.e.) jest lepontyjski†[116]. Ich wewnętrzna klasyfikacja filogenetyczna budzi spory językoznawców, tradycyjnie dzielone są one pseudogeograficznie na języki kontynentalne (np. galijski† czy celtyberyjski†) i wyspiarskie[117]. Do tych drugich należą wszystkie istniejące współcześnie języki, takie jak irlandzki, walijski czy szkocki. Alternatywnym podziałem jest podział fonetyczny na języki p-celtyckie i q-celtyckie – oparty na ewolucji praceltyckiej głoski *kʷ – który nie pokrywa się z podziałem geograficznym[118]. Używają nietypowego jak na rodzinę indoeuropejską szyku wyrazów typu VSO, z orzeczeniem na początku zdania[119].
Języki germańskie
Duża grupa w Europie Zachodniej, Północnej i Środkowej, wielu krajach Ameryki, w Australii oraz Oceanii, ok. 550 mln mówiących [ʙ min. 550 mln[r]]. Do germańskich należą m.in. dwa duże języki – angielski (o zasięgu ogólnoświatowym) oraz niemiecki, znaczącymi są też niderlandzki, języki skandynawskie oraz jedyny rdzenny germański język Afryki – afrikaans. Najstarsze zabytki językowe tej grupy (w języku gockim†) pochodzą z IV w. n.e.[120] Charakterystycznym zjawiskiem fonetycznym są przesuwki spółgłoskowe, osłabiające wymowę niektórych głosek (prawo Grimma). Języki germańskie wyróżniają się też w rodzinie indoeuropejskiej nietypowo wysokim odsetkiem wyrazów o nieustalonym, przedindoeuropejskim pochodzeniu[121].
Języki helleńskie
W tradycyjnym ujęciu zachowany do dzisiaj jedynie język grecki (w tym jego odmiany), którym mówi ok. 15 mln osób w Grecji i na Cyprze; nowsze klasyfikacje wyróżniają kilka języków helleńskich[122][123]. Druga najstarsza grupa indoeuropejska pod względem zabytków językowych – najwcześniejsze teksty w języku mykeńskim†, zapisane pismem linearnym B, szacowane są na ok 1450 r. p.n.e.[124]. Współczesna greka, zwana językiem nowogreckim, wywodzi się ze starożytnego standardu zwanego koine†, który różnił się od greki klasycznej†[125]. W użyciu alfabet grecki.
Języki indoaryjskie
Największa pod względem liczby mówiących (liczba użytkowników znacznie przekracza 1 miliard [ʙ pow. 800 mln]) oraz pod względem liczby języków grupa[37], używana głównie na subkontynencie indyjskim. Należą do niej takie duże języki indoeuropejskie, jak hindi, bengalski, urdu, marathi czy lahnda. Do języków indoaryjskich należą też używane w różnych rejonach świata języki romskie. Najstarsze indyjskie zabytki literackie w sanskrycie wedyjskim† (choć spisane wiele wieków później) szacowane są na 1500 lat p.n.e.[126] Języki tej grupy posługują się dużą liczbą systemów pisma, określanych zbiorczo jako indyjskie alfabety sylabiczne, z których najpowszechniej używanym jest dewanagari[127]. Niektóre języki, takie jak urdu czy pendżabski, stosują pismo arabskie[66] w postaci alfabetu perskiego.
Języki irańskie
Grupa z terenów głównie Bliskiego Wschodu i Azji Środkowej, należącymi do niej językami mówi ok. 200 mln osób. Największym językiem tej grupy jest perski, inne znaczące języki to m.in. paszto czy kurdyjski. Irańska enklawa istnieje też na południu Rosji (język osetyjski). Najstarszy tekst znany wśród tej gałęzi języków, Awesta, szacowany jest na ok. 1000 r. p.n.e.[128], a być może jest jeszcze starszy. Język awestyjski† posiadał bardzo archaiczny charakter, zbliżony do języka indoaryjskiej Rygwedy[129] – co jest jednym z dowodów na bliższe pokrewieństwo grupy indoaryjskiej i irańskiej. Współcześnie większość języków irańskich używa do zapisu alfabetu perskiego[130].
Języki italskie(†) wraz z romańskimi
Starożytna grupa wymarłych języków z terenów historycznej Italii. Najstarsze inskrypcje italskie pochodzą z połowy I tysiąclecia p.n.e.[131] Grupa ta zwraca szczególną uwagę językoznawców, gdyż należąca do niej łacina(†) jest jedynym w rodzinie indoeuropejskiej przypadkiem bezpośrednio zaświadczonego wymarłego języka, który dał początek całej innej grupie języków współczesnych. Owymi kontynuatorami łaciny ludowej† są dzisiejsze języki romańskie, mówi nimi ok. 800 mln osób [ʙ 920 mln] w Europie Zachodniej, Południowej oraz w obu Amerykach. Należą do nich m.in. takie duże języki indoeuropejskie, jak hiszpański, francuski, portugalski i włoski.
Języki nuristańskie
Niewielka, wymierająca grupa kilku języków używanych przez ok. 100 tys. osób [ʙ pow. 100 tys.] w rejonie Hindukuszu w Afganistanie, pośrednia między językami indoaryjskimi, a irańskimi[132]. Nie posiadają formy pisanej, w językoznawstwie znane są dopiero od dziewięnastego stulecia[133].
Języki ormiańskie
Według tradycyjnego ujęcia jedyny istniejący do dziś język, ormiański. Nowsze klasyfikacje traktują jego odmianę zachodnioormiańską jako język odrębny[134][135]. Mówi nimi ok. 7 mln osób [ʙ 6,7 mln] głównie w Armenii i Górskim Karabachu. Zaświadczone w piśmie od ok. V w. n.e., ich system fonetyczny uległ silnym przekształceniom i nawet rdzennie indoeuropejskie wyrazy często nie przypominają swoich odpowiedników w innych grupach[136]. W starszej polskiej literaturze językoznawczej wiązane z nimi bywały wymarłe języki bądź dialekty trackie† (jako grupa tracko-ormiańska)[41]. W użyciu alfabet ormiański.
Języki słowiańskie
Występują na terenach Europy Środkowej i Wschodniej, na Bałkanach oraz w Azji Północnej, mają ok. 270 mln użytkowników [ʙ 315 mln]. Najstarsze teksty pochodzą z IX w. z języka staro-cerkiewno-słowiańskiego†[137]. Największym językiem tej grupy jest rosyjski, znaczącymi są też polski, ukraiński, serbsko-chorwacki[138][k] czy czeski. Języki słowiańskie używają do zapisu, obok pisma łacińskiego, także cyrylicy (języki wschodniosłowiańskie i w dużej mierze południowosłowiańskie). Wiele z nich zachowało bardzo rozbudowaną odmianę wyrazów (np. 7 przypadków gramatycznych w języku polskim czy 6 w rosyjskim), charakterystyczne dla słowiańszczyzny jest również wyrażanie aspektu (dokonanego bądź niedokonanego) przy pomocy odrębnych czasowników[139].
Języki tocharskie†
Dwa lub trzy wymarłe, dawne języki z zachodniego pogranicza współczesnych Chin[140]. Pod względem fonologicznym należą do języków kentum, co jest rzadkością we wschodniej części indoeuropejskiego obszaru językowego. Znane z manuskryptów odkrytych na przełomie XIX i XX w., datowanych na VI–VIII w. n.e.[133]
Języki indoeuropejskie są, z niewielkimi wyjątkami, językami fleksyjnymi[141] – odpowiednie wyrazy składają się z rdzenia znaczeniowego oraz dołączanych morfemów, nadających słowom znaczenie szczegółowe lub funkcję w zdaniu i podlegają odmianie. Typowymi, o dużej liczbie form, są m.in. języki bałtosłowiańskie czy też łacina. W części języków odmiana rzeczownika uległa uproszczeniu, jak np. w językach germańskich i celtyckich[142].
Dominuje system trzech rodzajów gramatycznych – męskiego, żeńskiego i nijakiego. Gdzieniegdzie został on zredukowany do dwóch: bez nijakiego, jak we francuskim, hiszpańskim, hindi czy urdu[143] lub z nijakim i wspólnym (utrum), jak w duńskim i szwedzkim[144]. Bardzo rzadko w rodzinie indoeuropejskiej zdarzają się języki nieposiadające żadnego rodzaju – należą do nich ormiański i perski[143] oraz afrikaans[142], a w angielskim został on ograniczony wyłącznie do zaimków osobowych. Z reguły występują dwie liczby gramatyczne – pojedyncza i mnoga. Wyjątkiem są języki łużyckie i słoweński, które zachowały liczbę podwójną[145]. W niektórych pozostałych językach występują jedynie ślady jej dawnej obecności, jak np. w czeskim[145], irlandzkim[146] lub polskim (l.podw. „oczy”, l.mn. „oka”; l.podw. „uszy”, l.mn. „ucha”).
Na szczególną uwagę zasługuje wspomniany język afrikaans, gdyż posiada on skrajnie uproszczoną, jak na języki indoeuropejskie, morfologię – nie tylko nie występuje w nim rodzaj, lecz także nie posiada on przypadków gramatycznych oraz odmiany czasownika przez osoby i liczby[142]. Natomiast w językach zachodnioromańskich przypadki wyrażane morfologicznie (z użyciem końcówek fleksyjnych) całkowicie zanikły[147], zamiast tego wyrażane są one poprzez odpowiednie rodzajniki (tak jak np. w hiszpańskim[148]). Rodzajnik określony (w formie odrębnego wyrazu) oprócz języków romańskich występuje w grupie celtyckiej oraz w podgrupie zachodniogermańskiej, nie istnieje natomiast prawie w ogóle wśród bałtosłowiańskich i indoirańskich[149]. Nietypowo może on przyjmować formę przyrostka dołączanego na końcu słowa – ma to miejsce w językach skandynawskich, ormiańskim oraz orija[149]. Wtórnie taki przyrostek określony wykształcił się również w językach ligi bałkańskiej – albańskim, bułgarskim, macedońskim i rumuńskim[92].
Poniżej zaprezentowano odmianę przez przypadki liczby pojedynczej rzeczownika „ręka” w wybranych językach rodziny indoeuropejskiej. Formy rosyjskie i greckie podano dodatkowo w transliteracji na pismo łacińskie; wzory odmiany opracowano na podstawie różnych ogólnodostępnych słowników[s], odrębne źródła wykorzystano dla języków hiszpańskiego[148] i irlandzkiego[150]. Formy hiszpańskie, tworzone wyłącznie rodzajnikami, dla odróżnienia od właściwej odmiany morfologicznej występującej w pozostałych zaprezentowanych językach zapisano kursywą.
Język | Mianownik | Dopełniacz | Celownik | Biernik | Narzędnik | Miejscownik | Ablatyw | Wołacz |
---|---|---|---|---|---|---|---|---|
polski | ręka | ręki | ręce | rękę | ręką | ręce | — | ręko |
rosyjski | рука́ [ruká] | руки́ [rukí] | руке́ [rukié] | ру́ку [rúku] | руко́й [rukо́j] | руке́ [rukié] | — | — |
litewski | ranka | rankos | rankai | ranka | ranką | rankoje | — | ranka |
grecki | χέρι [chéri] | χεριού [cherioú] | — | χέρι [chéri] | — | — | — | χέρι [chéri] |
łacina | manus | manūs | manuī | manum | — | — | manū | manus |
hiszpański | la mano | de la mano | a la mano | la mano | — | — | — | —[t] |
niemiecki | die Hand | der Hand | der Hand | die Hand | — | — | — | — |
angielski | hand | hand's | — | — | — | — | — | — |
irlandzki | lámh | láimhe | láimh | — | — | — | — | a lámh[u] |
W większości języki tej rodziny należą do języków syntetycznych, czyli takich, w których formy odmiany są jednowyrazowe i tworzone są przy pomocy różnych przedrostków i przyrostków. Niewielka część z kolei jest językami analitycznymi – wyrażającymi formy gramatyczne wielowyrazowo, przy pomocy dużej liczby odrębnych czasowników posiłkowych i przyimków. Najbardziej analityczny charakter wśród indoeuropejskich przejawiają języki afrikaans i bengalski[142]. W dużym stopniu cechy analityczne posiadają też angielski, norweski i francuski[151], a także bułgarski i macedoński[152]. Natomiast języki czystego typu w zasadzie nie istnieją, można mówić co najwyżej o przewadze cech syntetycznych lub analitycznych[153] – czego dowodzą przykłady poniżej.
Pod względem stosunków morfosyntaktycznych języki indoeuropejskie należą zasadniczo do nominatywno-akuzatywnych – agens zdania przechodniego oraz podmiot zdania nieprzechodniego są wyrażane przy pomocy mianownika, a dopełnienie bliższe przy pomocy biernika[154]. Wyjątkiem są nieliczne języki zachowujące się jak ergatywno-absolutywne, ale wyłącznie w niektórych konstrukcjach (ang. split ergativity). Należą do nich przede wszystkim hindi (a tym samym urdu[v]) oraz wymarły hetycki[155], a także paszto[156].
Typowymi szykami zdania w językach indoeuropejskich są SVO i SOV[119], w których na początku występuje podmiot. Szyk SVO, z dopełnieniem na końcu, posiadają m.in. polski, grecki, hiszpański, albański, niemiecki i wiele innych języków europejskich. Z kolei szyk SOV, w którym zdanie kończy się orzeczeniem, występuje w łacinie, ormiańskim oraz w wielu językach indoirańskich, np. hindi czy perskim. Natomiast typ VSO, z orzeczeniem na początku i dopełnieniem na końcu zdania, jest charakterystyczny dla języków grupy celtyckiej[119].
Ponieważ indoeuropejskie języki zasadniczo są fleksyjne, szyk zdania nie pełni aż tak dużej roli i w sporym zakresie jest ruchomy. Zmienia się wtedy nacisk na poszczególne wyrazy, lecz samo znaczenie zdania nie – decydują bowiem poszczególne formy odmiany słów, które po przestawieniu brzmią wszakże identycznie. Nie jest to jednak dozwolone w językach pozycyjnych, gdzie o znaczeniu decyduje pozycja wyrazów w zdaniu. Językami pozycyjnymi są np. angielski i francuski[157] – zmiana szyku jest w nich bardzo mocno ograniczona, w szczególności gdy chodzi o kolejność podmiotu i dopełnienia (zamiana miejscami powoduje zmianę znaczenia na przeciwne).
W niniejszej sekcji zaprezentowane zostały przykłady słownictwa w różnych językach indoeuropejskich, przedstawiające różnorodność i podobieństwo form. Każda współczesna grupa językowa, z wyjątkiem słabo dostępnej w źródłach grupy nuristańskiej, reprezentowana jest przez jeden (lub w niektórych przypadkach dwa) języki. Wyrazy w alfabetach innych niż łaciński zapisano również w transkrypcji na pismo łacińskie (według polskich zasad, o ile nie zaznaczono inaczej); tabele opracowano na podstawie różnych ogólnodostępnych słowników[s].
Odmiana czasu teraźniejszego czasownika „być”; odrębne źródło wykorzystano dla języka paszto[158] (transkrypcja podana w oryginalnej wersji):
Forma | albański | łotewski | walijski | angielski | duński | grecki | hindi | paszto | ormiański | rumuński | włoski | chorwacki |
---|---|---|---|---|---|---|---|---|---|---|---|---|
alb. | bałt. | celt. | germ. | helleń. | indoar. | irań. | orm. | rom. | słow. | |||
być | qenë | būt | bod | be | være | –[w] | होना [hona] |
–[x] | լինել [linel] |
fi | essere | biti |
jestem | jam | esmu | wyf | am | er | είμαι [eímai] |
हूँ [hun] |
یم [yəm] |
եմ [em] |
sunt | sono | sam |
jesteś | je | esi | wyt | are | είσαι [eísai] |
है [hai] |
یې [ye] |
ես [es] |
ești | sei | si | |
jest | është | ir | yf | is | είναι [eínai] |
ده / دی[y] [da] / [da] |
է [e] |
este | è | je | ||
jesteśmy | jemi | esam | ŷm | are | είμαστε [eímaste] |
हैं [hai] |
یو [yu] |
ենք [enk] |
suntem | siamo | smo | |
jesteście | jeni | esat | ŷch | είσαστε [eísaste] |
हैं / हो[z] [hai] / [ho] |
یاست [yā́stai] |
եք [ek] |
sunteți | siete | ste | ||
są | janë | ir | ŷnt | είναι [eínai] |
हैं [hai] |
دي [di] |
են [en] |
sunt | sono | su |
Podstawowe formy liczebników (w przypadku różnych form rodzajowych podano formy rodzaju męskiego); wykorzystano dodatkowe źródła[159][160]:
Licz. | albański | angielski | czeski | grecki | hindi | irlandzki | litewski | ormiański | perski | włoski |
---|---|---|---|---|---|---|---|---|---|---|
alb. | germ. | słow. | helleń. | indoar. | celt. | bałt. | orm. | irań. | rom. | |
1 | një | one | jeden | ένα [éna] | एक [ek] | aon | vienas | մեկ [mek] | یک [jek] | uno |
2 | dy | two | dva | δύο [dío] | दो [do] | dó | du | երկու [jerku] | دو [do] | due |
3 | tre | three | tři | τρία [tría] | तीन [tin] | trí | trys | երեք [jerek] | سه [se] | tre |
4 | katër | four | čtyři | τέσσερα [téssera] | चार [ćhar] | ceathair | keturi | չորս [czors] | چهار [czar] | quattro |
5 | pesë | five | pět | πέντε [pénte] | पांच [panćh] | cúig | penki | հինգ [hing] | پنج [pandż] | cinque |
6 | gjashtë | six | šest | έξι [éksi] | छह [ćhah] | sé | šeši | վեց [wec] | شش [szesz] | sei |
7 | shtatë | seven | sedm | εφτά [eftá] | सात [sat] | seacht | septyni | յոթ [jot] | هفت [haft] | sette |
8 | tetë | eight | osm | οχτώ [ochtó] | आठ [ath] | ocht | aštuoni | ութ [ut] | هشت [haszt] | otto |
9 | nëntë | nine | devět | εννέα [ennéa] | नौ [nau] | naoi | devyni | ինը [iny] | نه [no] | nove |
10 | dhjetë | ten | deset | δέκα [déka] | दस [das] | deich | dešimt | տաս [tas] | ده [da] | dieci |
Podstawowe słowa oznaczające członków najbliższej rodziny:
Wyraz | albański | angielski | czeski | grecki | hindi | irlandzki | litewski | ormiański | perski | włoski |
---|---|---|---|---|---|---|---|---|---|---|
alb. | germ. | słow. | helleń. | indoar. | celt. | bałt. | orm. | irań. | rom. | |
matka | ëma | mother | matka | μητέρα [mitéra] |
माता [mata] |
máthair | motina | մայր [majr] |
مادر [madr] |
madre |
ojciec | atë | father | otec | πατέρας [patéras] |
पिता [pita] |
athair | tėvas | հայր [hajr] |
پدر [pedr] |
padre |
siostra | motër | sister | sestra | αδελφή [adelfí] |
बहन [bahan] |
deirfiúr | sesuo | քույր [kujr] |
خواهر [choar] |
sorella |
brat | vëllau | brother | bratr | αδελφός [adelfós] |
भाई [bhai] |
deartháir | brolis | եղբայր [jechpajr] |
برادر [bradr] |
fratello |
Najstarszymi zaświadczonymi w piśmie językami indoeuropejskimi są poniższe języki, w których zachowały się wymienione zabytki:
Poniżej przedstawiony został pierwszy znany zapis łaciński wraz z transkrypcją.
MANIOS:MED:FHE:FHAKED:NUMASIOI
Maniusz wykonał mnie dla Numeriusza[170]
Dodatkowo bezcennymi zabytkami są starożytne teksty religijne Rygweda (w języku wedyjskim†), pochodząca prawdopodobnie z połowy drugiego tysiąclecia p.n.e.[126] i Awesta (stąd wzięła się nazwa języka awestyjskiego†), co najmniej sprzed tysiąca lat p.n.e.[128] – spisane wiele wieków później, ale na podstawie bardzo długiej tradycji ustnej. Oba zachowały wiele archaicznych form językowych.
Tat saviturvarenjam || Bhargo devasja dhīmahi || Dhijo jo nah praćodajāt
To Sawitara najwspanialsze || Obyśmy światło osiągnęli || Niech nasze myśli w górę wzniesie![171]
Zaprezentowana powyżej Mantra Gajatri zawiera stare indoeuropejskie formy gramatyczne, używane – zgodnie z szacowanym datowaniem tekstu – około 3500 lat temu we wczesnych językach indoaryjskich.
Wśród językoznawców nie ma zgodności, gdzie znajdowała się pierwotna ojczyzna (urheimat) języka praindoeuropejskiego – przodka całej rodziny indoeuropejskiej. Dominują dwie hipotezy[172]:
Teoria pontyjsko-kaspijska została przedstawiona przez Mariję Gimbutas w r. 1956 na podstawie porównania wyników badań archeologicznych i językoznawczych. Gimbutas umieściła indoeuropejską ojczyznę na Stepie Pontyjskim, nadając swojej teorii nazwę kurhanowej (od kurhanów – kopcowatych mogił neolitycznych występujących na tym obszarze) i utożsamiła Praindoeuropejczyków z kulturą grobów jamowych. Według niej ekspansja języków indoeuropejskich wiązała się z najazdami ludów pasterskich, tworzących ową kulturę[173].
Zgodnie z tezą Gimbutas pomiędzy 4400 a 2800 r. p.n.e. konni wojownicy podbili większość obszarów Europy oraz środkowo-zachodniej Azji, wypierając miejscową ludność i narzucając jej swój język. Wraz ze zdobywaniem nowych terenów i osiedlaniem się na nich, pierwotny język najeźdźców ewoluował, dając podstawy dzisiejszej indoeuropejskiej rodzinie językowej[174].
Z kolei w r. 1987 Colin Renfrew zasugerował związki pomiędzy rozprzestrzenianiem się języków indoeuropejskich, a rewolucją neolityczną. Według jego teorii ojczyzna Indoeuropejczyków znajdowała się na terenie Anatolii pomiędzy 6500 a 5000 lat p.n.e.[175] W przeciwieństwie do teorii kurhanowej teoria anatolijska zakłada pokojowe rozprzestrzenianie się języka i kultury indoeuropejskiej. Renfrew twierdzi, że językiem praindoeuropejskim posługiwali się anatolijscy rolnicy ok. 7 tysięcy lat temu. 500 lat później, wskutek rolniczych migracji, język ów został zaniesiony na tereny dzisiejszej Grecji, a następnie wzdłuż Dunaju do Europy Środkowej. Podczas jego rozpowszechniania powstawały różne dialekty, które dały początek poszczególnym indoeuropejskim grupom językowym[176].
Zarówno według teorii kurhanowej, jak i anatolijskiej pierwotna siedziba Indoeuropejczyków była powiązana z szeroko pojętym rejonem Morza Czarnego (odpowiednio jego północnej bądź południowej strony). Należy jednak pamiętać, że obecne linie brzegowe bardzo często nie odpowiadają tym sprzed kilku tysięcy lat. Zgodnie z hipotezą Ryana-Pitmana morze owo było kiedyś dużo mniejszym, słodkowodnym jeziorem. Około 5600 lat p.n.e. miałoby dojść do wzrostu poziomu Morza Śródziemnego związanego z ociepleniem klimatu na tyle, że jego wody przełamały Bosfor i zalały depresję nadczarnomorską, tworząc dzisiejsze Morze Czarne[177]. Według Krzysztofa Witczaka i Andrzeja Kowalskiego rozwój rolnictwa w północnej Eurazji związany był z ucieczkami ludności z tamtejszych terenów zalewowych. Powstanie Morza Marmara mogło spowodować wówczas rozerwanie wspólnoty praindoeuropejskiej – ludność Anatolii została odłączona przez naturalną barierę morską, ich język zatem jako pierwszy zaczął różnicować się w stosunku do języka praindoeuropejskiego[177].
W 2003 r. biolodzy ewolucyjni Russell Gray i Quentin Atkinson na podstawie glottochronologicznych badań 87 języków indoeuropejskich ustalili, że języki anatolijskie faktycznie stanowią najstarszą grupę w rodzinie, zarazem najbardziej zbliżoną do języka praindoeuropejskiego. Jego wiek został określony na 7800 do 9800 lat (czyli w przedziale ok. 7800–5800 p.n.e.)[24].
Na temat pochodzenia języków indoeuropejskich wysuwano też wiele innych hipotez[178], jednak nie zyskały one większego uznania. Należą do nich m.in.:
a także dawne, sprzeczne z nauką hipotezy przypisujące Praindoeuropejczykom (mającym jakoby zamieszkiwać np. południe Szwecji lub ogólnie rejony nad Bałtykiem) określone cechy antropologiczne (np. blond włosy i niebieskie oczy), które to koncepcje wykorzystywano w rasistowskich teoriach narodowego socjalizmu (pojęcie „Aryjczyka”)[182].
Pokrewieństwo indoeuropejskiej rodziny językowej z innymi rodzinami nie jest bliżej znane. W literaturze językoznawczej pojawiają się, na podstawie pewnych obserwowanych zbieżności morfologicznych i fonologicznych, następujące propozycje najbliższych krewnych języków indoeuropejskich:
Teorie te z reguły pozostają jednak w kręgu zainteresowań nielicznych językoznawców i nie spowodowały szerszego odzewu. Wyjątkiem jest hipoteza indo-uralska, której zwolennikiem w XXI w. jest m.in. Frederik Kortlandt – według niego ludność praindouralska zamieszkiwała tereny na południu od Uralu. Jej część przemieściła się bardziej na zachód, nad Morze Czarne, gdzie doszło do kontaktów językowych z ludnością kultury majkopskiej i gdzie wykształcił się język praindoeuropejski[187].
Znacznie bardziej znane są propozycje Josepha Greenberga, a także Władysława Illicza-Switycza i Arona Dołgopolskiego (którzy rozpowszechnili starą hipotezę Holgera Pedersena), postulujących istnienie makrorodzin językowych o dużym zasięgu:
Przedstawione propozycje makrorodzin (jak można zauważyć, eurazjatycka w zasadzie zawiera się w nostratycznej jako jej część) budzą kontrowersje wśród głównego nurtu językoznawców, gdyż są zbudowane wyłącznie na podstawie podobieństw słownikowych (z wykorzystaniem masowej komparacji leksykalnej)[15] – bez uwzględnienia zbieżności gramatycznych, które są trwalsze niż słownictwo. Znalazły jednak one pewną liczbę zwolenników (np. Allan Bomhard[189]).
Niektórzy posunęli się jeszcze dalej – Harold Fleming postulował istnienie ogromnej fyli językowej grupującej makrorodziny nostratyczną, amerindiańską, dene-kaukaską i austrycką, której nadał nazwę boreańskiej[190]. Według niego są one spokrewnione ze sobą bardziej, niż z pozostałymi językami świata. Wreszcie, można postulować istnienie prajęzyka całej ludzkości, z którego wywodziłyby się wszystkie istniejące kiedykolwiek rodziny językowe i języki[191]; jest to możliwe do uzasadnienia na gruncie biologicznym – zgodnie z teorią wyjścia z Afryki wszyscy ludzie pochodzą genetycznie od niedużej populacji homo sapiens, żyjącej na niewielkim obszarze[aa]. Językoznawcy uważają jednak, że udowodnienie powszechnego pokrewieństwa języków jest niemożliwe – choć nieliczni (np. Greenberg i Ruhlen) dokonują nawet prób rekonstrukcji globalnej pramowy[192].
Drzewo filogenetyczne zbudowane na podstawie genealogii Y-DNA populacji europejskich wskazuje na istnienie populacji z męską haplogrupą R1, żyjącą ponad 23 tys. lat temu w Azji Centralnej, z której wywodzą się dwie duże podgrupy haplotypów często występujących u mieszkańców zachodniej i południowej Eurazji: R1a i R1b[193]. Przeprowadzone w 2015 r. na dużą skalę badania DNA pokazały, że haplogrupa R1a i większość haplogrupy R1b rozprzestrzeniły się w Europie wraz z językami indoeuropejskimi. Według owych badań około 75% ludności tworzących kulturę ceramiki sznurowej posiada materiał genetyczny wywodzący się od mieszkańców terenów kultury grobów jamowych[194].
Haplogrupa R1a pojawia się częściej w Europie Środkowej i Wschodniej oraz w Azji Południowej[195]. Natomiast R1b przeważa wśród mieszkańców Europy Zachodniej – badania archeogenetyczne z 2017 r. na szczątkach kilkunastu osób żyjących 4200–1430 lat p.n.e., odkrytych w Portugalii, wskazują na wyraźne zmiany cech osobniczych w czasie wraz z jednoczesnym wzrostem odsetka tej haplogrupy. Może to dowodzić migracji ludności kilka tysięcy lat temu ze wschodnioeuropejskich stepów do zachodniej Europy[196].
Na indoeuropejski charakter kultury grobów jamowych wskazuje analiza Davida Anthony'ego z 2019 r. – według niego Praindoeuropejczycy posiadali mieszankę genów ludów zbieracko-łowieckich z Europy Wschodniej i Kaukazu. Sam język praindoeuropejski miałby wówczas bazować przede wszystkim na języku dawnej ludności wschodnioeuropejskiej, z pewnymi wpływami języka ludności kaukaskiej[197]. Badacz sugeruje również możliwy wpływ języka ludów kultury majkopskiej (utożsamianej z późniejszymi językami abchasko-adygejskimi), ale dla odmiany z minimalnymi tylko (o ile w ogóle) wpływami genetycznymi[198].
Należy jednak podkreślić, że język sam w sobie nie mówi nic ani o genach, ani o pochodzeniu etnicznym jego użytkowników[199]. W historii ludzkości często zdarzało się bowiem, że narody przejmowały języki ludów przez siebie podbitych (np. nieindoeuropejscy Protobułgarzy, którzy przejęli język Słowian[200]) lub też język najeźdźców (np. Galowie, którzy przejęli język starożytnych Rzymian[201]); do przejmowania języka mogło także dochodzić w wyniku pokojowych kontaktów kulturowych. Również same wspomniane haplogrupy wyodrębniły się kilkanaście tysięcy lat przed powstaniem rodziny języków indoeuropejskich[193].
Wspólnym przodkiem języków indoeuropejskich[ab], nie zaświadczonym bezpośrednio, ale zrekonstruowanym częściowo za pomocą metody porównawczej, był język praindoeuropejski (skrót: pie.). Przyjmuje się jego obecność w okresie neolitu na terenach zachodniej Eurazji[202]. Za istnieniem takiego języka przemawiają bardzo liczne wspólne cechy słownictwa, fonetyki oraz struktur gramatycznych wśród domniemanych językowych członków rodziny indoeuropejskiej. Są one na tyle duże, że współczesne językoznawstwo odrzuca możliwość ich upodobnienia się wyłącznie wskutek wzajemnego oddziaływania[7].
Zgodnie z konwencją stosowaną w publikacjach językoznawczych gwiazdką * poprzedzono formy (wyrazy, rdzenie, głoski itp.) zrekonstruowane metodami badawczymi. Natomiast pomiędzy ukośnikami /.../ podano zapis fonetyczny, najbardziej zbliżony do polskiej wymowy.
Praindoeuropejski posiadał następujący zestaw głosek[203]:
Spółgłoski | warg. | przjęz. | palat. | welar. | labial. | krtan. |
---|---|---|---|---|---|---|
zwarte bezdźwięczne | *p | *t | *ḱ | *k | *kʷ | |
zwarte dźwięczne | *b | *d | *ǵ | *g | *gʷ | |
zw. dźw. przydechowe | *bʰ | *dʰ | *ǵʰ | *gʰ | *gʷʰ | |
szczelinowe | *s | *h₂ | *h₃ | *h₁ | ||
nosowe | *m | *n | ||||
płynne | *r, *l | |||||
półsamogłoski | *i̯ | *u̯ | ||||
Samogłoski | niskie | półprzymkn. | wysokie | |||
krótkie | *a | *e | *o | *i | *u | |
długie | *ā | *ē | *ō | *ī | *ū |
Istniało również 6 dyftongów – dwugłosek (*ai̯, *au̯, *ei̯, *eu̯, *oi̯, *ou̯)[204]. Dodatkowo z rzadka mogły pojawiać się dyftongi z samogłoskami długimi *ē lub *ō (*ēi̯, *ēu̯, *ōi̯, *ōu̯)[204][205].
Według zapisu podanego w powyższej tabeli spółgłoski *ḱ oraz *ǵ oznaczają – zgodnie z ich charakterem – głoski miękkie, bliskie polskich /ki/ oraz /gi/. Głoski *kʷ oraz *gʷ to spółgłoski zaokrąglone, zbliżone do polskich /kł/ oraz /gł/. Spółgłoski *bʰ, *dʰ, *ǵʰ, *gʰ oraz *gʷʰ były spółgłoskami przydechowymi. Głoski *i̯ (czasem zapisywana w literaturze jako *y) oraz *u̯ (czasem zapisywana jako *w) oznaczają spółgłoski półotwarte, równoznaczne polskim /j/ oraz /ł/. Istniały również zgłoskotwórcze (tworzące sylabę) warianty niektórych spółgłosek, oznaczane odpowiednio jako *l̥, *m̥, *n̥ oraz *r̥[206].
Natomiast trzy głoski zapisywane jako *h (z dolnym indeksem) miały wymowę nieznaną w języku polskim. Są związane z teorią laryngalną, która opiera się na tezie Ferdinanda de Saussure'a z 1878 r. o istnieniu w praindoeuropejskim tzw. laryngałów (głosek o artykulacji gardłowej lub krtaniowej)[207]. Oznaczane są one symbolami[208]:
Ich istnienie pozwala wyjaśnić pewne irracjonalne z pozoru zjawiska fonologiczne w językach indoeuropejskich[209]. Ślady laryngałów odkryte zostały w języku hetyckim z grupy anatolijskiej[110]. W pozostałych grupach języków zniknęły na bardzo wczesnym etapie rozwoju, prawdopodobnie przechodząc w samogłoski, odpowiednio /e/, /a/ oraz /o/ (co można zaobserwować w języku greckim)[210]. Sama teoria laryngalna została rozwinięta w XX w. i stanowiła milowy krok w rozwoju indoeuropeistyki[207].
Większość praindoeuropejskich rdzeni wyrazowych składała się z dwóch spółgłosek (lub grup spółgłosek), między którymi pojawiała się samogłoska (najczęściej *e) lub dyftong[211]. Charakterystycznym zjawiskiem była wymiana samogłosek (przegłos, inaczej apofonia) w morfemach słowotwórczych (rdzeniach i przyrostkach). W zależności od budowy wyrazu i jego formy gramatycznej ten sam rdzeń lub przyrostek mógł wystąpić w następujących stopniach[212]:
Rdzenie w różnych stopniach były jedynie formami bazowymi o ogólnym znaczeniu – same w sobie nie stanowiły konkretnych form gramatycznych.
Dopiero od nich można było utworzyć właściwe formy wyrazów (np. przy pomocy różnych przedrostków lub przyrostków[215]).
Możliwa była również reduplikacja na początku słowa, podwajana była wtedy pierwsza spółgłoska (lub dwie pierwsze, gdy wyraz zaczynał się od *s- lub *hₓ-) z dodatkiem e- lub i-[216].
Echa apofonii praindoeuropejskiej można dostrzec w językach potomnych, np. w charakterystycznej wymianie samogłosek w angielskich czasownikach nieregularnych.
Charakterystyczną cechą praindoeuropejskiego było również występowanie tzw. ruchomego s-[219]. Spora grupa słów posiadała w niektórych formach głoskę /s/ na początku wyrazu, która z kolei w innych formach nie występowała. Zjawisko to nie zostało dotychczas jednoznacznie wyjaśnione. Jego ślady licznie występują w słownictwie współczesnych języków indoeuropejskich, co pokazują zaprezentowane niżej przykłady[220].
Praindoeuropejski był językiem fleksyjnym, podobnie jak język polski. Deklinacja uwzględniała osiem przypadków (siedem jak w polskim oraz ablatyw, odpowiadający na pytania „skąd?” „od kogo/czego?”) oraz trzy liczby: pojedynczą, podwójną i mnogą[221]. Odmianie takiej podlegały rzeczowniki, zaimki osobowe oraz przymiotniki[222]. Trzy rodzaje gramatyczne (męski, żeński i nijaki) rozwinęły się według niektórych indoeuropeistów tylko poza językami anatolijskimi – teoria ta zakłada, że dawniejszy system zawierał dwie klasy rzeczowników (ożywione, które później podzieliły się na męskie i żeńskie, oraz nieożywione)[223].
Przykładowa odmiana przez przypadki rzeczownika „wilk” w rekonstrukcji Ranko Matasovića[224][ad]:
Forma | Mianownik | Dopełniacz | Celownik | Biernik | Narzędnik | Miejscownik | Ablatyw | Wołacz |
---|---|---|---|---|---|---|---|---|
liczba poj. | *wlkʷos | *wlkʷosyo | *wlkʷōy | *wlkʷom | *wlkʷoh₁ | *wlkʷoy | *wlkʷōd | *wlkʷe |
liczba podw. | *wlkʷoh₁ | *wlkʷows | ?[ae] | *wlkʷoh₁ | ?[ae] | *wlkʷows | ?[ae] | *wlkʷoh₁ |
liczba mn. | *wlkʷōs | *wlkʷōm | *wlkʷobʰos | *wlkʷons | *wlkʷōys | *wlkʷoysu | *wlkʷobʰos | *wlkʷōs |
Czasowniki podlegały odmianie przez czasy, strony, osoby, liczby, aspekt i tryb[225]. Czas gramatyczny, jaki znany jest z języka polskiego, miał w praindoeuropejskim zupełnie inny charakter. Występował jedynie w szczątkowej wersji – dwa czasy, teraźniejszy i przeszły, istniały wyłącznie dla trybu oznajmującego aspektu dokonanego[226]. Nie istniała również strona bierna jako taka, jej przybliżone znaczenie było wyrażane przy pomocy strony medialnej (coś „się” robi, zamiast biernego „coś jest robione”)[227]. Najbardziej istotną kategorią był natomiast aspekt czasownika – najważniejszy był wynik czynności, a czas jej wykonywania był mniej ważny. Skutkiem tego było istnienie trzech form aspektowych[226]:
Trybów z kolei było cztery: oznajmujący, przypuszczający (w tym zamiary i czynności przyszłe[228]), życzący i rozkazujący. Wszystkie kombinacje trybów, aspektów i czasów wyglądały więc następująco[226]:
Tryb | Aspekt | ||
---|---|---|---|
niedokonany | dokonany (aoryst) |
stanu (perfectum) | |
oznajmujący | teraźniejszy | ![]() |
![]() |
przeszły | |||
przypuszczający | ![]() |
![]() |
nieznany |
życzący | ![]() |
![]() |
nieznany |
rozkazujący | ![]() |
![]() |
nieznany |
Oznacza to, że dla każdego czasownika, który podlegał pełnej koniugacji, w trybie oznajmującym istniało po 7 różnych form (4 formy strony czynnej i 3 strony medialnej – której nie posiadało, jak wskazano wyżej, perfectum) dla każdej kombinacji liczby i czasu.
Przykładowa odmiana strony czynnej praindoeuropejskiego czasownika „być” w różnych trybach aspektu niedokonanego według Donalda Ringe'a[229]:
Forma | Tryb oznajmujący | Tryb przypuszczający |
Tryb życzący |
Tryb rozkazujący | |
---|---|---|---|---|---|
teraźniejszy | przeszły | ||||
1 os. l.poj. | *h₁ésmi | *h₁ésm̥ | *h₁ésoh₂ | *h₁siéh₁m | — |
2 os. l.poj. | *h₁ési | *h₁és | *h₁ésesi | *h₁siéh₁s | *h₁és; *h₁sdʰí |
3 os. l.poj. | *h₁ésti | *h₁ést | *h₁éseti | *h₁siéh₁t | *h₁éstu |
1 os. l.podw. | *h₁suós | *h₁sué | *h₁ésowos | *h₁sih₁wé | — |
2 os. l.podw. | *h₁stés | *h₁stóm | *h₁ésetes | *h₁sih₁tóm | *h₁stóm |
3 os. l.podw. | *h₁stés | *h₁stā́m | *h₁ésetes | *h₁sih₁tā́m | *h₁stā́m |
1 os. l.mn. | *h₁sm̥ós | *h₁sm̥é | *h₁ésomos | *h₁sih₁mé | — |
2 os. l.mn. | *h₁sté | *h₁sté | *h₁ésete | *h₁sih₁té | *h₁sté |
3 os. l.mn. | *h₁sénti | *h₁sénd | *h₁ésonti | *h₁sih₁énd | *h₁séntu |
Podstawowym narzędziem badawczym w rekonstrukcji form praindoeuropejskich jest wspomniana już wcześniej metoda porównawcza. Dzięki niej powstały hipotetyczne formy takie, jak zaprezentowane w poprzedniej sekcji. Owocem pracy naukowej nad odtwarzaniem prajęzyka był słownik etymologiczny Juliusa Pokorny'ego z 1959 r., wykorzystywany do dziś i uaktualniany przez niektórych językoznawców zgodnie z obowiązującym stanem wiedzy[220].
Przykłady zrekonstruowanych wyrazów (wielka litera H oznacza nieokreślony laryngał) za Robertem Beekesem[230]:
oraz za Jamesem Clacksonem[231]:
Różne rekonstrukcje liczebników praindoeuropejskich (w wersji Sihlera z możliwych opcji podano wyrazy w stopniu pełnym):
Autor | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 100 |
---|---|---|---|---|---|---|---|---|---|---|---|
A. Sihler (1995)[232] | *Hoi-no- | *d(u)wo- | *trei- | *kʷetwor- | *penkʷe | *s(w)eḱs lub *weḱs |
*septm̥ | *oḱtō | *(h₁)newn̥ | *deḱm̥(t) | *ḱm̥tom lub *dḱm̥tom |
R. Beekes (2011)[233] | *Hoi(H)nos | *duoh₁ | *treies | *kʷetuōr | *penkʷe | *(s)uéks | *séptm | *h₃eḱteh₃ | *(h₁)néun | *déḱmt | *dḱmtóm |
W 1868 r. August Schleicher napisał w hipotetycznym języku praindoeuropejskim (rekonstrukcja głównie na podstawie sanskrytu) krótkie opowiadanie Owca i konie[234]. Jego tekst w późniejszych latach był wielokrotnie poprawiany i aktualizowany zgodnie z wizją prajęzyka poszczególnych językoznawców. Poniżej przedstawione zostały oryginalna wersja Schleichera (jeszcze bez laryngałów), wersja Andrew Byrda z r. 2013[235] oraz tłumaczenie na język polski – wszystkie wersje podzielono na odpowiadające sobie wersy w celu łatwego porównania form gramatycznych. Tekst Byrda został również nagrany przez niego samego i jest dostępny do odsłuchu[236].
Avis akvāsas ka
wersja Schleichera (1868)
Avis, jasmin
varnā na ā ast,
dadarka akvams,
tam, vāgham garum vaghantam,
tam, bhāram magham,
tam, manum āku bharantam.
Avis akvabhjams ā vavakat:
kard aghnutai mai
vidanti manum
akvams agantam.
Akvāsas ā vavakant:
krudhi avai,
kard aghnutai vividvant-svas:
manus patis
varnām avisāms karnauti
svabhjam gharmam vastram
avibhjams ka varnā na asti.
Tat kukruvants
avis agram ā bhugat.
H₂óu̯is h₁éḱu̯ōs-kʷe
wersja Byrda (2013)
h₂áu̯ei̯ h₁i̯osméi̯
h₂u̯l̥h₁náh₂ né h₁ést,
só h₁éḱu̯oms derḱt.
só gʷr̥hₓúm u̯óǵʰom u̯eǵʰed;
só méǵh₂m̥ bʰórom;
só dʰǵʰémonm̥ h₂ṓḱu bʰered.
h₂óu̯is h₁ékʷoi̯bʰi̯os u̯eu̯ked:
“dʰǵʰémonm̥ spéḱi̯oh₂[af]
h₁éḱu̯oms-kʷe h₂áǵeti,
ḱḗr moi̯ agʰnutor”.
h₁éḱu̯ōs tu u̯eu̯kond:
“ḱludʰí, h₂ou̯ei̯!
tód spéḱi̯omes, n̥sméi̯ agʰnutór ḱḗr:
dʰǵʰémō, pótis,
sē h₂áu̯i̯es h₂u̯l̥h₁náh₂
gʷʰérmom u̯éstrom u̯ept,
h₂áu̯ibʰi̯os tu h₂u̯l̥h₁náh₂ né h₁esti.
tód ḱeḱluu̯ṓs
h₂óu̯is h₂aǵróm bʰuged.
Owca i konie
tłumaczenie dosłowne[237]
Owca, która
wełny nie miała,
zobaczyła konie;
jeden wóz ciężki ciągnął,
jeden ładunek wielki,
jeden człowieka szybko wiózł.
Owca do koni zawołała:
„Serce boli mnie
widząc człowieka
konie poganiającego”.
Konie zawołały:
„Słuchaj, owco,
serce boli, ujrzawszy:
człowiek, pan,
wełnę owcom ścina
sobie na ciepłą odzież,
a owce wełny nie mają”.
To usłyszawszy
owca z pola wybiegła.
Innym tekstem tego typu jest opowiadanie Król i bóg, pochodzące z Rygwedy i przetłumaczone z sanskrytu wedyjskiego† na praindoeuropejski przez kilku językoznawców w latach 90. XX w., w niezależnych od siebie wersjach[238].
jęz. praindoeuropejski
współczesne języki ie.
Według tradycyjnego modelu Tadeusza Milewskiego droga od języka praindoeuropejskiego do stanu współczesnego przebiegała według następującej kolejności[239]:
W pierwszej fali migracji na południe wyruszyła ludność praanatolijska, a później, niezależnie od niej, prahelleńska. Na wschód posuwała się społeczność pratocharska, a w kierunku peryferiów zachodnich – praitaloceltycka (podzielona później na praitalską i praceltycką). Natomiast tereny na północy zajęła ludność pragermańska. Języki lub dialekty używane przez wymienione społeczności Milewski określił jako peryferyjne[240]. Z kolei w drugiej fali migracji południe zostało zajęte przez społeczność praormiańską, a wschód – praindoirańską (podzieloną później na praindoaryjską i prairańską). Na zachodzie natomiast osiedliła się ludność praalbańska, a na północy – prabałtosłowiańska (podzielona później na prabałtycką i prasłowiańską). W tym przypadku języki i dialekty zostały określone jako centralne[240].
W ten sposób powstał ogólny podział na indoeuropejskie grupy językowe, z grubsza odpowiadający (pomijając języki wymarłe) stanowi współczesnemu. Szacuje się, że nastąpiło to nie później niż 2000 lat p.n.e.[241]
Podział geograficzny |
południowe | wschodnie | zachodnie | północne |
---|---|---|---|---|
peryferyjne | anatolijskie; helleńskie |
tocharskie | italoceltyckie | germańskie |
centralne | tracko-ormiańskie | indoirańskie | albańskie | bałtosłowiańskie |
Dalszy rozwój i ekspansja miały miejsce już w czasach historycznych[82]:
Trudno ocenić, jak w różnych okresach historycznych zmieniała się liczba mówiących – dane takie w literaturze są rzadkie. Leonard Bloomfield podał szacowane liczby dotyczące sześciu dużych języków pod koniec XVI i na początku XX w. (w milionach)[242]:
Rok | angielski | niemiecki | rosyjski | francuski | hiszpański | włoski |
---|---|---|---|---|---|---|
1600 | 6 | 10 | 3 | 14 | 8,5 | 9,5 |
1912 | 150 | 90 | 106 | 47 | 52 | 37 |
2020[81] | 1268 | 132 | 258 | 277 | 538 | 68 |
Jedną z najważniejszych zmian, jakie dokonały się w trakcie rozwoju późnych dialektów indoeuropejskich, była zmiana artykulacji głosek z szeregu *ḱ – *k – *kʷ. W praindoeuropejskim spółgłoska *ḱ była spółgłoską miękką, a spółgłoska *kʷ – zaokrągloną (przypominającą w wymowie polskie /kł/). Dodatkowo *ḱ różniło się miejscem artykulacji – było wymawiane bardziej ku przodowi jamy ustnej (jako głoska palatalna), w odróżnieniu od pozostałych głosek wspomnianego szeregu, które były tylnojęzykowe[243]. Pierwotny stan praindoeuropejski wyglądał więc następująco[203]:
Głoska | Zaokrąglenie | Zmiękczenie |
---|---|---|
*ḱ | ![]() |
![]() |
*k | ![]() | |
*kʷ | ![]() |
W pewnym okresie doszło do zmiany, która dokonała się na dwa sposoby[244]:
Analogicznym zmianom podlegały także szeregi głosek[245]:
Cały proces zmiany wymowy głosek *ḱ, *ǵ i *ǵʰ w centralnych dialektach praindoeuropejskich zwany jest palatalizacją indoeuropejską[246]. Po przeprowadzeniu opisanych innowacji językowych zarówno w dialektach centralnych, jak i peryferyjnych sytuacja fonologiczna przedstawiała się więc w następujący sposób[247]:
Zakres językowy |
Głoski bezdźwięczne |
Głoski dźwięczne |
Głoski przydechowe | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Język praindoeur. |
*ḱ | *k | *kʷ | *ǵ | *g | *gʷ | *ǵʰ | *gʰ | *gʷʰ | |||
dialekty peryferyjne |
k | *kʷ | g | gʷ | gʰ | gʷʰ | ||||||
dialekty centralne |
s (š; ś) |
k | z | g | z | gʰ |
W części grup lub poszczególnych języków nastąpiły później jeszcze dalsze zmiany[248]. Odmienna ewolucja opisanych wyżej praindoeuropejskich głosek stała się podstawą dawnego głównego podziału w wewnętrznej klasyfikacji rodziny[11]. Języki peryferyjne, w którym nastąpiły zmiany pierwszego rodzaju, nazwano językami kentum, natomiast języki centralne, w których nastąpił drugi rodzaj zmian – językami satem. Nazwy te pochodzą od wymowy liczby 100 w łacinie (centum, wymawiane /kentum/) i w awestyjskim (/satem/)[247].
Ostateczny podział wyglądał następująco[244]:
Języki trackie miały charakter satemowy[249], zaś frygijski był językiem kentumowym[250]. Natomiast albański – formalnie satem – w pewnych nielicznych przypadkach posiada formy typowe dla języków kentum[251]. Z tego powodu zwracana jest uwaga na pewną odrębność albańskiego, w którym trzy szeregi głosek opisane w niniejszej sekcji przekształciły się w dużej mierze na trzy różne sposoby[252]. Obecnie, pod względem geograficznym, na terenach Eurazji języki satem zajmują generalnie wschód (uwzględniając areały albańskojęzyczne) indoeuropejskiego obszaru językowego, podczas gdy na zachodzie (z uwzględnieniem areałów greckojęzycznych) znajdują się języki kentum – co zostało pokazane na ilustracji. Nie należy też niewłaściwie interpretować stanu współczesnego – np. „sto” w języku hiszpańskim to cien lub ciento (wymawiane w przybliżeniu /sjen(to)/), co na pierwszy rzut oka przypomina języki satemowe – jest to jednak efektem późniejszej ewolucji hiszpańskiego już po jego wyodrębnieniu się z kentumowej łaciny.
Uważa się, że powstanie poszczególnych grup języków satemowych nastąpiło dopiero po zajściu palatalizacji indoeuropejskiej[247][253]. W literaturze czasem można spotkać określenie języka pra-satemowego jako ich hipotetycznego wspólnego przodka[254] (w klasyfikacji filogenetycznej wszystkie języki satemowe tworzyłyby wtedy takson monofiletyczny).
Obok opisanej wyżej palatalizacji indoeuropejskiej, która spowodowała powstanie języków satem, do istotnych praw głosowych (zmian fonetycznych, często również nazywanych w literaturze językoznawczej regułami) w rozwoju języków indoeuropejskich należą m.in.:
Ślady i efekty tego typu zmian widać w wielu indoeuropejskich językach współczesnych i dawnych. Poniżej zaprezentowano przykłady odpowiadających sobie etymologicznie słów (niektóre o zmienionym znaczeniu), pokazujących skutki działania palatalizacji indoeuropejskiej oraz przesuwek germańskich (lub ich braku) – kolejno w językach: łacińskim, polskim, litewskim i angielskim, wraz z podaną na początku zrekonstruowaną formą praindoeuropejską[220]. Puste miejsce w tabeli oznacza, że w cytowanym źródle brak etymologicznego odpowiednika w danym języku.
Pierwotne znaczenie |
praindoeur. | łaciński | polski | litewski | angielski | |
---|---|---|---|---|---|---|
ital. | słow. | bałt. | germ. | |||
‘kto’ | *kʷo- | > | quī | kto | kas | who |
‘pies’ | *ḱu̯on- | canis | suka (‘samica psa’) |
šuo | hound (‘pies myśliwski’) | |
‘serce’ | *ḱerd- | cor(dis)[ah] | serce | širdis | heart | |
‘sto’ | *ḱm̥tóm | centum | sto | šimtas | hundred | |
‘wołać’ | *ǵʰau- | — | (w)z(y)wać | žavėti (‘zachwycać’) |
call | |
‘ziemia’ | *ǵʰðem- | humus[ai] (‘gleba, grunt’) |
ziemia | žemė | — | |
‘znać’ | *ǵnō- | gnōscō (‘znam’) |
znać | žinoti (‘wiedzieć’) |
know[aj] (‘znać, wiedzieć’) |
hipotetyczna praojczyzna – zasięg kultury halsztackiej (800–500 p.n.e.)
języki dyskusyjne, potencjalnie celtyckie (np. luzytański)
maksymalny zasięg (ok. 270 r. p.n.e.)
zasięg w średniowieczu
zasięg współczesny
Istnienie indoeuropejskiej rodziny językowej zostało wykazane przy pomocy różnych narzędzi badawczych, przede wszystkim metody porównawczej. Spośród wielu różnych przesłanek jednym z najczęściej prezentowanych dowodów są formy czasownika „być” w sanskrycie i łacinie[260].
Można zauważyć istnienie głoski s- we wszystkich pokazanych przykładach, stanowiącej rdzeń znaczeniowy wyrazu. Jednocześnie, co bardzo istotne, istnieje bardzo podobny fonetyczny wzorzec odmiany końcówek w obu językach, kolejno[261]:
gdzie V oznacza samogłoskę. Tego typu regularności w dwóch różnych językach, dalekich geograficznie i odległych czasowo, są bardzo mocnym argumentem za ich pochodzeniem od wspólnego przodka[261]. Kolejnym dowodem mogą być formy czasownika o znaczeniach: „nieść”, „brać”[262].
Istnieje ogromna liczba takich fonologiczno-morfologicznych odpowiedników wśród domniemanych członków rodziny indoeuropejskiej[263]. Pozwala to uznać postulowany prajęzyk, od którego owe języki pochodzą oraz ich pokrewieństwo. W rzeczywistości języki indoeuropejskie są najlepiej zbadaną rodziną językową[16], której istnienie nie budzi żadnych wątpliwości.
Zbiór takich regularności pozwala dodatkowo nie tylko udowodnić istnienie rodziny, ale i wyróżnić w jej ramach grupę językową. Przykładem mogą być odpowiadające sobie słowa w językach kolejno: angielskim, niderlandzkim, dawnym staro-wysoko-niemieckim† i współczesnym niemieckim[264].
W przedstawionych wyrazach widać regularność fonetyczną w środku lub na końcu wyrazu (odpowiednio -t : -t : -z : -ss). Cały szereg tego typu odpowiedników pozwala umieścić wymienione języki w ramach jednej grupy indoeuropejskiej[265], w tym przypadku germańskiej. Badania językoznawcze pozwoliły również udowodnić przynależność do języków indoeuropejskich np. języków anatolijskich czy też wenetyjskiego[266]. Pozwoliły one też na odrzucenie innych, jak np. używanego w Europie baskijskiego[267].
Alternatywnie – nie na podstawie podobieństw morfologiczno-fonologicznych, lecz w oparciu o cechy języka – Nikołaj Trubieckoj w latach 30. XX w. zaproponował następujące sześć kryteriów przynależności do rodziny indoeuropejskiej[268]:
W zakres badań nad pokrewieństwem języków wchodzi również kształt wewnętrznej struktury rodzin językowych. Do jego opisu stosowane są dwa główne modele[269]:
We współczesnej nauce przyjmuje się, że najbliższym rzeczywistości i najbardziej odpowiednim modelem opisowym dla rodziny indoeuropejskiej jest ten pierwszy, „genetyczny” (w sensie językowym), na wzór znanego z nauk przyrodniczych modelu drzewa rodowego (inaczej: filogenetycznego)[8][271]. Teoria falowa w przypadku języków tej rodziny może być uzupełnieniem drzewa – możliwość taka dotyczy w szczególności grupy germańskiej, która w sporej mierze wykazuje falowy charakter (wiele jej cech prawdopodobnie zostało przejętych od sąsiadów językowych we wczesnym okresie rozwojowym)[272].
Zgodnie z modelem drzewa filogenetycznego istnieje domniemane założenie, że wszystkie języki należące do danej grupy indoeuropejskiej miały wspólnego przodka. Owe prajęzyki poszczególnych grup wywodziły się z kolei od języka praindoeuropejskiego, który był ostatnim wspólnym przodkiem całej rodziny (po drodze mogły istnieć również stopnie pośrednie). I tak, biorąc za przykład grupę języków słowiańskich, wszystkie one wywodzą się od wspólnego języka prasłowiańskiego, który z kolei pochodził od języka prabałtosłowiańskiego, którego przodkiem zaś był praindoeuropejski. Dokładny kształt indoeuropejskiego drzewa rodowego i związki pomiędzy poszczególnymi jego gałęziami są przedmiotem spekulacji i rozważań badaczy.
Tadeusz Milewski w latach 60. XX w., zgodnie ze swoim tradycyjnym modelem ekspansji, postulował następującą kolejność wyłaniania się poszczególnych gałęzi indoeuropejskich[273]:
Donald Ringe, Tandy Warnow i Ann Taylor w 2002 r., przy użyciu metod analizy matematycznej zapożyczonych z biologii ewolucyjnej, zaproponowali następującą sekwencję[108]:
Z kolei David Anthony (w 2007) zasugerował poniższy przebieg, wraz z przybliżonym czasem pojawiania się najwcześniejszych przodków językowych poszczególnych gałęzi[274]:
Natomiast Robert Beekes (w 2011) i Mate Kapović (w 2017), niezależnie od siebie, zaproponowali poniższą kolejność[275]:
W zasadzie – co potwierdzają powyższe propozycje – nie jest kwestionowany pogląd, że najbardziej odrębną grupą języków indoeuropejskich są języki anatolijskie. Inaczej mówiąc, grupa ta (a ściślej: język praanatolijski) oddzieliła się od praindoeuropejskiego jako pierwsza[108]. Głównym dowodem na to jest ich bardzo wysoka archaiczność – zachowały one wiele cech, które w pozostałych grupach zanikły[al]. Oznacza to, że dwie dowolne inne grupy języków indoeuropejskich są bardziej spokrewnione ze sobą, niż z anatolijską. Z tego też powodu wszystkie nie-anatolijskie gałęzie nazywane są czasem w literaturze językoznawczej językami indoeuropejskimi właściwymi[276], a wraz z anatolijskimi – językami indo-hetyckimi[70].
Coraz częstsze uznanie zyskuje również teza, że kolejną grupą języków, która oddzieliła się od wspólnego rdzenia, były języki tocharskie. Grupy, które pozostały po wykształceniu się gałęzi tocharskiej, bywają nazywane głównymi (ang. core Indo-European)[277]. Na dalszym etapie rozwoju dawna wspólnota językowa zaczęła się różnicować w coraz większym stopniu. Przedstawione propozycje sugerują, że jako kolejne powstały języki praitalski i praceltycki, przez część językoznawców łączone w podrodzinę o bliższym stopniu pokrewieństwa[22]. Zaś po wyodrębnieniu się zalążków grup germańskiej i helleńskiej, pozostałe dialekty – nazywane centralnymi – poddane zostały pewnym procesom głosowym, które stały się podstawą fonologicznego podziału na języki kentumowe i satemowe. Po zajściu owych innowacji nastąpił ostateczny rozpad późnej indoeuropejskiej wspólnoty językowej na grupy, jakie znane są mniej więcej w dzisiejszym kształcie[278].
Najbardziej niepewna jest pozycja grupy germańskiej; badania z 2002 r. sugerują jej bliższe związki z gałęzią albańską[108]. Natomiast sam Ringe w 2017 – w innej swojej publikacji – zwrócił uwagę na możliwość istnienia łańcucha wzajemnie przenikających się dialektów germańskich, bałtosłowiańskich i indoirańskich w ich początkowej fazie rozwoju[279].
Wśród postulowanych gałęzi językowych, skupiających grupy o rzekomo bliższym pokrewieństwie, znajdowały się również m.in.[280][281]: bałto-słowiańsko-germańska, helleno-aryjska (lub helleno-ormiańsko-aryjska – grupujące języki helleńskie, indoirańskie i ewentualnie ormiański), helleno-albańska, indoirańsko-albańska, germano-romańska, celto-germano-romańska czy ario-helleno-italo-celtycka (grupująca języki indoirańskie, helleńskie i italoceltyckie). Większość z tych propozycji nie zyskała jednak szerszej aprobaty językoznawców.
Nie wszystkie innowacje w językach indoeuropejskich można jednak wytłumaczyć modelem genealogicznym – zdarza się, że ta sama zmiana występuje w bardziej odległych od siebie genetycznie grupach. Do wyjaśnienia tego typu zjawisk stosuje się teorię falową.
Zmianami obejmującymi różne grupy indoeuropejskie, które można wytłumaczyć wspomnianym już wcześniej modelem fali, są np.[282]:
Linie wyznaczające granice takich „fal” na mapach językowych nazywane są izoglosami. Przykłady izoglos, przedstawiające niektóre indoeuropejskie innowacje językowe, pokazane zostały na ilustracji.
Istotną dla modelu falowego przyczyną są kontakty graniczne, gdy dochodzi do wymiany pewnych cech na styku różnych grup lub języków wskutek ich sąsiedztwa[283]. Zmiany tego typu utrwalają się następnie na większym obszarze. Część językoznawców wskazuje na to, że we wczesnej fazie rozwoju niektórych grup indoeuropejskich dochodziło do takiego rodzaju kontaktów pomiędzy sąsiadującymi gałęziami językowymi. Ślady tego zjawiska można odnaleźć w językach współczesnych – według grupy badaczy miały one miejsce w następujących przypadkach[272]:
Z kolei David Anthony zasugerował, że we wczesnych stadiach rozwoju dochodziło do wzajemnych pożyczek wśród następujących gałęzi językowych[274]:
Według Anthony'ego doszło również do wtórnego upodobnienia się języków bałtosłowiańskich – wskutek częstych wzajemnych zapożyczeń już po rozpadzie na odrębne grupy bałtycką i słowiańską. Na mniejszą skalę zjawisko to miałoby też zajść pomiędzy grupą italską, a celtycką[274].
Współcześnie efekty szeroko zakrojonych kontaktów językowych pomiędzy różnymi sąsiadującymi indoeuropejskimi grupami można zaobserwować na Półwyspie Bałkańskim, którego języki wytworzyły wiele wspólnych innowacji, tworząc bałkańską ligę językową.
Już w starożytności zauważono podobieństwa między językiem greckim, a łacińskim (np. héks : sex ‘sześć’, heptá : septem ‘siedem’), świadomie wskazywano nawet na pewne regularności – jak greckie h- na początku wyrazu odpowiadające łacińskiemu s-. Tłumaczono to tym, że łacina pochodzi jakoby od greki. Kwestia pokrewieństwa języków nie zwracała jednak szerszej uwagi badaczy aż do czasów nowożytnych[6].
W XVI w. przybywający na subkontynent indyjski Europejczycy zaczęli zwracać uwagę na podobieństwa pomiędzy językami indoaryjskimi, irańskimi oraz językami Europy. W 1583 r. Thomas Stephens, jezuicki misjonarz, w liście do brata podzielił się swoimi spostrzeżeniami na temat takich podobieństw wśród greckiego, łacińskiego i języków indyjskich. Dwa lata później (w 1585) Filippo Sassetti, kupiec z Florencji, zauważył podobieństwa pomiędzy sanskrytem, a językiem włoskim (np. devaḥ : dio ‘bóg’, sarpaḥ : serpe ‘wąż’, sapta : sette ‘siedem’, aṣṭa : otto ‘osiem’, nava : nove ‘dziewięć’)[284]. Obserwacje owe nie zwróciły jednak uwagi ówczesnych językoznawców.
Jako pierwszy w świecie naukowym pokrewieństwo między językami indoeuropejskimi zauważył holenderski językoznawca Marcus Zuerius van Boxhorn w r. 1647. Zestawił on ze sobą języki: łacinę, grecki, perski, sanskryt, germańskie, słowiańskie i bałtyckie i przypisał im istnienie wspólnego językowego przodka, którego nazwał językiem scytyjskim[285]. Jego hipoteza także nie doczekała się jednak szerszego rozgłosu wśród ówczesnych badaczy.
W XVIII w. Gaston Coeurdoux porównał odmianę czasowników sanskryckich, łacińskich oraz greckich i zasugerował, że są one ze sobą spokrewnione[286]. Powszechnie odkrycie pokrewieństwa języków indoeuropejskich przypisuje się jednak Williamowi Jonesowi, sędziemu i filologowi brytyjskiemu, który w wykładzie wygłoszonym w 1786 r. w Kalkucie zwrócił uwagę na zaskakujące zbieżności w zakresie słownictwa i struktury gramatycznej pomiędzy sanskrytem, a językami europejskimi[287]. Nowo odkryta rodzina języków nie miała jeszcze wówczas powszechnie stosowanej nazwy. W 1810 r. geograf Conrad Malte-Brun zaproponował termin języki indogermańskie (używane w literaturze niemieckojęzycznej do dziś), a trzy lata później – w 1813 – Thomas Young po raz pierwszy użył określenia języki indoeuropejskie[288], które w XXI w. używane jest na całym świecie.
Pierwszymi poważnymi dziełami indoeuropeistycznymi były publikacje Franza Boppa: On the conjugational system of the Sanskrit language compared with that of Greek, Latin, Persian and Germanic z 1816 r. oraz Comparative Grammar, wydawana w kilku częściach od 1833 i ukończona w 1852. Obie książki stanowią początek indoeuropeistyki jako dziedziny naukowej[5]. W 1861 r. z kolei swoje dzieło A Compendium of the Comparative Grammar of the Indo-European, Sanskrit, Greek and Latin Languages ukończył August Schleicher. W r. 1878 Ferdinand de Saussure zaproponował hipotezę istnienia laryngałów (głosek o artykulacji gardłowej lub krtaniowej)[207] w prajęzyku jako wyjaśnienie pewnych absurdalnych na pierwszy rzut oka zjawisk fonetycznych, obserwowanych w językach indoeuropejskich (np. w starożytnej grece†)[209]. Powszechnie zaakceptowany został też pierwszy główny podział w klasyfikacji rodziny, oparty na różnicach fonologicznych – na języki kentum i satem, który przetrwał co najmniej do drugiej dekady XX w.[11]
W następstwie odkrycia tekstów anatolijskich i tocharskich (i odczytania niektórych z nich w pierwszej dekadzie XX w.[289]) indoeuropeistyka dokonała ogromnego postępu. W 1927 r. Jerzy Kuryłowicz zauważył w anatolijskim języku hetyckim ślady głosek laryngalnych[110], co potwierdzało tezę de Saussure'a sprzed kilkudziesięciu lat. Rozwinięta na tej podstawie teoria laryngalna wniosła nieoceniony wkład w badania nad językami indoeuropejskimi i bywa uważana za najważniejsze odkrycie w dziejach dyscypliny[207]. Kolejnym etapem było opublikowanie przez Kuryłowicza w 1956 L'Apophonie en indo-européen, kluczowego dzieła na temat przegłosu indoeuropejskiego. Trzy lata później, w 1959, Austriak Julius Pokorny udostępnił Indogermanisches etymologisches Wörterbuch, słownik etymologiczny wyrazów indoeuropejskich. Jest to do dziś największe źródło zrekonstruowanych rdzeni języka praindoeuropejskiego, aczkolwiek nie uwzględnia najnowszych trendów w morfologii i fonologii (pomija m.in. najnowsze dane z badań nad językami anatolijskimi i tocharskimi).
W 1998 (rok publikacji) słownik Pokorny'ego został zmodernizowany i dostosowany do współczesnego stanu indoeuropeistyki przez niemieckiego językoznawcę Helmuta Rixa pod tytułem Lexikon der indogermanischen Verben. W XXI w. wydane zostały leksykon nominalnych części mowy kilku autorów (Nomina im Indogermanischen Lexikon, 2008) oraz leksykon partykuł i zaimków George'a Dunkela (Lexikon der indogermanischen Partikeln und Pronominalstämme, 2014). Wymienione pozycje stanowią najbardziej aktualne źródła wiedzy na temat języka praindoeuropejskiego. Natomiast głównymi wydawanymi czasopismami indoeuropeistycznymi są amerykański Journal of Indo-European Studies oraz niemieckie Indogermanische Forschungen (obecnie większość artykułów publikowanych jest w nich w języku angielskim).
W międzynarodowym, bibliotecznym systemie uniwersalnej klasyfikacji dziesiętnej pozycjom z dziedziny językoznawstwa indoeuropejskiego przyporządkowana została klasa o numerze 811.1/.2[290].
Badaniem języków indoeuropejskich zajmowali się m.in.:
Nie są znane żadne źródła historyczne języka praindoeuropejskiego, nie wiadomo zatem, jak ówczesna ludność nazywała (jeśli w ogóle miało to miejsce) swój język. W historii językoznawstwa pojawiały się różne propozycje, jakim terminem określić badaną rodzinę. Sugerowano następujące nazwy[291]:
Przed II wojną światową konkurowały ze sobą określenia języki indoeuropejskie oraz języki indogermańskie. To drugie było jednak często wykorzystywane m.in. w ideologii narodowego socjalizmu, utożsamiającej Niemców z Aryjczykami[292]. Z tego powodu po wojnie jego użycie zostało stopniowo zarzucone na rzecz pierwszego terminu i obecnie występuje ono prawie wyłącznie w literaturze niemieckojęzycznej (już bez rasistowskich konotacji). Rzadko bywa też spotykana nazwa języki indo-hetyckie, używana przez tych językoznawców, którzy traktują języki anatolijskie nie jako najbardziej odrębną grupę w ramach rodziny indoeuropejskiej, lecz jako jej gałąź siostrzaną[70].
Inne artykuły przeglądowe na temat języków indoeuropejskich:
Alfabetyczny indeks haseł związanych z językoznawstwem indoeuropejskim:
Przekrojowe hasła związane z językoznawstwem indoeuropejskim:
Artykuły z zakresu geografii językowej świata:
Wszystkie wykorzystane w artykule źródła internetowe zostały zarchiwizowane w Internet Archive. Linki do poszczególnych podstron i ich archiwów zostały umieszczone przy odpowiednich przypisach.
Uczę się języka hebrajskiego. Tutaj go sobie utrwalam.
Zawartość tej strony pochodzi stąd.