O.S.E.L. - Evoluce jazyků a pravěké migrace
 Evoluce jazyků a pravěké migrace
Nakolik spolu souvisí evoluce genů a lidských jazyků? Co nám mohou kladistické analýzy říct o pravěkých migracích? A jak vypadá genetický strom indoevropských jazyků?


Následující text vychází z přednášky Daniela Frynty z pražské PřF UK, která se uskutečnila v rámci klubu Xenopus. Články do odborných časopisů na toto téma napsali společně Rexová, Frynta a Zrzavý.

Genetická a kladistická klasifikace jazyků je striktně vzato možná pouze tehdy, pokud je jazyková evoluce skutečně divergentní: tedy nedochází ke vzniku smíšených jazyků a přejímání slov. K obojímu samozřejmě dochází, proto je třeba drobné zpřesnění - větvící se stromy dávají smysl tehdy, pokud je obojí dostatečně vzácné - což platí (velmi dobře třeba u jednosměrných migrací, např. v Tichomoří).

V minulosti o něco podobného usilovala srovnávací lingvistika a lexicostatistika. Obě se dostaly podstatně méně daleko než dnešní genetika, a to z důvodu dosti paradoxního - lingvistika se totiž rozvíjela 'příliš brzy', tedy v době, kdy ještě nebyly k dispozici výkonné počítače schopné statisticky zpracovat rozsáhlé soubory dat.

Dnešní kladistika posupuje velmi jednoduše. Vezme se nějaké jazykové jádro (x slov, zpravidla základních a navíc takových, u kterých se předpokládám, že se je člověk učí od rodičů) a srovná se se stejně vybraným jádrem v jiných jazycích. Dostaneme x-rozměrný prostor plný jedniček a nul (eventuálně můžeme stejnost/podobnost/odlišnost slov hodnotit i na jemnější škále). Následně hledáme takový strom, který k přibližně požadovanému výsledky dospěje s nejmenším počtem kroků/větvení (které odpovídají mutacím z kladistiky biologické).

Poznámka autora: Tady vás možná napadá, že počítačové řešení této úlohy by výrazně usnadnil kvantový počítač, který by dokázal udržet v paměti všechny možné stromy najednou. Když se nad tím ale zamyslíte dále, zjistíte, že jde o úlohu podobnou jako problém obchodního cestujícího - taktéž se hledá nejkratší cesta grafem. Pro řešení úlohy obchodního cestujícího žádný efektivní kvantový algoritmus bohužel prozatím neexistuje. A úplně na okraj, když už je tento článek mj. o genetice, úloha obchodního cestujícího byla ukázkou, na které se demonstrovaly možnosti prvního DNA počítače Leonarda Adlemana.

Pokračujme v kladistice. Nasnadě je následující námitka. Nezávisí ale strom, který takto dostaneme, na výběru konkrétních slov? Zvolíme tedy slova jiná, buď úplně, nebo množinu alespoň obměníme částečně, a necháme počítač opět počítat. Bude výsledkem strom stejný, nebo alespoň lišící se mimo hlavní kmeny a větve? Pokud ne, naše řešení je nestabilní a nepodařilo se nám dobrat k rozumnému výsledku (což se z řady důvodů může stát - např. když budeme chtít rekonstruovat evoluci jazyků příliš hluboko do minulosti). Stabilita řešení se vyjadřuje tzv. indexem konzistence.

A nyní k slíbené aplikaci kladistiky, konkrétně provedené v programu PAUP, na indoevropské jazyky. Celé zkoumání je zarámováno následujícími úvahami:

- První téměř jistě indoevropskou kulturou na našem území je šňůrová keramika v pozdním eneolitu, které předcházela (snad) neindoevropská kultura řivnáčská. Šňůrová keramika k nám přišla z východu a odpovídala by původu Indoevropanů někde v oblasti Volhy.

- Pokud by ale byla Indoevropany nesena již neolitická kultura lineární keramiky, což předpokládá menšina historiků/archeologů, svědčilo by to snad pro původ Indoevropanů v Malé Asii.

Výsledek? Základní skupiny (jazyky slovanské apod.) vyšly tak, jak se předpokládalo. Další společnou skupinu představovaly dohromady jazyky slovanské, baltské, indické a iránské. Jiná skupina byla představována jazyky keltskými, germánskými a románskými. Mimochodem - takové členění velice připomíná dělení (starší a myslím, že později snad zavržené) indoevropských jazyků na kentumové (podle označení číslovky 100 - centum, ve starověké latině čteno zřejmě kentum) a satemové (100 - satem v sanskrtu).

Tyto všechny skupiny tvořily ještě společnou 'nadskupinu', mimo kterou stály řečtina a arménština. Status albánštiny je nejasný. Úplně mimo ostatní indoevropské jazyky stála chetitština - z toho by se sice dalo vyvozovat, že první dělení bylo Chetité-ostatní (což by napovídalo pro maloasijský původ Indoevropanů), to ale nesedí z řady jiných důvodů. Chetité nám vycházejí tak odlišní nejspíš proto, že jejich jazyk máme zaznamenán z nejstarší doby.

Poznámka autora: Bedřich Hrozný ovšem uváděl, že jazyk Chetitů je ostatním indoevropským jazykům příbuzný poměrně úzce - proto se mu ho také podařilo rozluštit.

Výsledky toho všeho nejsou úplně jasné. Daniel Frynta je interpretoval jako náznak toho, že do Čech dorazili Indoevropané až v době eneolitu (z východní Evropy), není ale jasné, zda to nebylo až pozdější dělení - Řekové, Arméni a Chetité se možná odtrhli už dříve. V Řecku by mohl být Indoevropany nesen už neolit.

Poznámka autora: To je však v rozporu s tím, co říká historie. Předkové dnešních Řeků nejspíš přišli do Řecka v několika vlnách z nitra Balkánu (tedy by patřili k 'ostatním' Indoevropanům z východní Evropy), navíc až v době po expanzi šňůrové keramiky do střední Evropy.

Závažná námitka spočívá i v tom že nerozumíme egejským písmům předcházejícím lineárnímu písmu B (nejstarší známá forma řečtiny). Protože u lineárního písma A známe fonetické hodnoty většiny znaků (stejné jako u B), indoevropskému jazyku bychom téměř jistě porozuměli. A především, struktura tohoto písma (jak byla převzata do lineárního písma B) vůbec indoevropským jazykům neodpovídá, ale svědčí spíše pro jazyk se slabikami téměř výlučně tvořenými dvojicí samohláska-souhláska. Knósos se tedy v slabičném lineárním písmu B psal jako Ko-no-so, A-re-ka-sa-na-da-ra je nejstarším záznamem jména Alexandra atd. Pro řečtinu (a jiné indoevropské jazyky) se takový způsob zápisu vůbec nehodil, význam slov se bylo třeba domýšlet, byl však převzat z písem starších. Lze proto důvodně předpokládat, že se jimi zapisovaly jazyky neindoevropské. 
Takže s původem Indoevropanů je to nejspíš nadále nejasné.



Střípky na okraj:


Autor: Pavel Houser
Datum:13.04.2004