Často užívaná slova nepodléhají mutacím

Člověk |

Matematikové z Harvardu se zaměřil na anglická nepravidelná slovesa. Vzali si 177 sloves, která byla nepravidelná v době vzniku Beowulfa. Do dnešního dne si z nich nepravidelné časování podržela zhruba polovina, ostatní podlehly tlaku na „standardní“ ohýbání s příponou –ed...

Často užívaná slova nepodléhají mutacímpravidelné páteční „přetištění“ staršího článku

Na Science Worldu jsme již několikrát psali o evoluci jazyků, memech apod. Různá slova jsou v populaci různě zastoupená, což samozřejmě znamená, že jsou mj. méně náchylná ke změnám/mutacím než ta častější (selekci mezi slovy ovlivňují i další faktory). Takový závěr lze téměř samozřejmě předpokládat, problém však je v tom, že dosud se podobné úvahy mohly těžko opřít o nějaká kvantitativní data, byla to tak trochu „coctail-party science“.

Tým, který vedl evoluční biolog Mark Pagel z univerzity v irském Readingu, nyní prokoumal databázi indoevropských slov. Zpracoval přitom slova odpovídající 200 různým významům/pojmům v 87 jazycích.
Skutečně se potvrdilo, že slova užívaná nejčastěji (v článku jsou jako příklad uváděny základní číslovky, jistě by bylo možné najít i další kategorie, třeba označování rodinných příslušníků atd.) si jsou mezi jednotlivými jazyky nejpodobnější, tedy během evoluce z indoevropského „prajazyka“ prošly nejméně změnami. Míra příbuznosti slov mezi jednotlivými slovníky totiž dobře odpovídala statistikám četnosti těchto slov v současných indoevropských jazycích.
Zpracovávána byla nejen podstatná jména, ale zkoumalo se i to, jak jsou k mutacím náchylné jednotlivé slovní druhy. Zde se jako nejstabilnější ukázaly „nosné“ části sdělení – na rozdíl od třeba zájmen nebo spojek.

Výsledkem průzkumu je i jakási předpověď: jaká slova mají jakou šanci rychle zmutovat nebo být nahrazena a jaká zde s námi naopak mohou být i za 10 000 let (to je samozřejmě značně ošidná prognóza). Zajímavé je, že některé „memy“ by pak z tohoto hlediska byly vlastně i stabilnější než mnohé biologické geny.

Matematikové z Harvardu vedení Erezem Liebermanem podnikli obdobný výzkum, který se zaměřil na anglická nepravidelná slovesa. Vzali si 177 sloves, která byla nepravidelná v době vzniku Beowulfa a sledovali je ve středověké i moderní angličtině. Do dnešního dne si z nich nepravidelné časování podržela zhruba polovina, ostatní podlehly tlaku na „standardní“ ohýbání s příponou –ed. Ukázalo se, že nepravidelnost si zachovala hlavně nejčastěji užívaná slovesa (be, have, go, come, take…) – a naopak.
Následně bylo dohledáno nejméně frekventované nepravidelné sloveso v dnešní angličtině, které je tedy horkým kandidátem na mutaci. Jedná se o sloveso wed (oženit/provdat), která má podle slovníku další tvary wed, wed, brzy však můžeme počítat s tvarem wedded.

Zdroj: New ScientistÚvodní foto: historicair, wikipedia, licence obrázku GFDL, Creative Commons Uveďte autora-Zachovejte licenci 3.0 Unported
Související články
Komentáře

23.01.2015, 22:44

.... thank you!...

19.01.2015, 05:08

.... good!!...

10.12.2014, 12:57

.... hello!...

21.10.2014, 10:28 petusek

Ad stabilita slovních druhů

K tomuto bych jen upozornil na skutečnost, že s těmi slovními druhy to není tak jednoduché. Jistě, největší zastoupení mají prototypická substantiva, a to zejména části těla. Ještě před nimi jsou ale některá osobní zájmena jako "my". V rámci jednotlivých kategorií je to také různé: nižší číslovky jsou obecně stabilnější než vyšší, byť "1" se zdá paradoxně podle některých studií méně stabilní než "2" (snad kvůli vysoké tendenci k polysemii). Obecně lze říci, že takřka každá generalizace je zavádějící a abstrahuje od mnohdy důležitých dílčích skutečností. Lze totiž například očekávat, že výraz znamenající "bodnout zhora dolů lehce našikmo kopím s měděným hrotem nepoužívaným k rituálnímu obřadu vítání mladíků mezi muže do měkké tkáně jedlého zvířete, které bylo samicí, ale ne březí" nepřežije následující století a bude nahrazen či zapomenut, pakliže se nepřizpůsobí (tj. například nezobecní svůj význam na pouhé "probodnout" či jen "zabít", nebo se neposune technologickým směrem například do významu "propíchnout polystyrenový prefabrikát žhavou jehlicí").

21.10.2014, 10:11 petusek

Ad "mutace"

Pozor na použití výrazu mutace v takovémto kontextu. Jedna věc je, když se mění lexikální jednotky po formální stránce, tedy když se vyvíjí jejich zvuková podoba v čase v souladu s hláskovými změnami, k nimž v tom kterém jazyce dochází. Další (vlastně paralelní) změnou je vývoj sémantický - význam se může porůznu rozšiřovat, zužovat či posouvat atd. Změnou je také úplná náhrada lexému zcela jiným, ať již domácím, nebo přejatým. V Pagelově studii jde nikoliv o to, že frekventované jednotky se nemění po zvukové stránce, to by byl velký omyl (srov. příbuzná slova něm. Hund /hunt/, lat. canis /kanis/ > fr. /šję/!), jde spíš o to, že lexémy s určitou konkrétní sémantickou hodnotou jsou odolnější právě vůči nahrazení, protože dané pojmy s touto sémantickou hodnotou korespondující jsou v jazyce či jazycích obecněji nejfrekventovaněji používané (viz pytlíkové přirovnání v jiném komentáři). Dejme tomu, že máme výraz /otets/, jehož sémantická hodnota je [RODIČ][-žena] (oproti [RODIČ][+žena] "matka", ale to volím tak trochu arbitrárně kvůli názornosti). Protože slovo vyjadřuje koncept, který je základní, neměl by být ohrožen. Ovšem v jazyce může být i lexikální konkurent, který má k němu blízko, například "táta". V některých kontextech může být "otec" příznakovější ([RODIČ][-žena][FORMÁLNÍ] oproti pouhému [RODIČ][-žena]), v jiných zase "táta" ([RODIČ][-žena][NEFORMÁLNÍ] oproti pouhému [RODIČ][-žena]). Pokud se posune hodnota kontextu použití z [NEFORMÁLNÍHO] na [NORMÁLNÍ] (=[]), pak se "táta" stane [RODIČ][-žena] (tj. méně příznakovým) a "otec" bude příznakovější, tudíž i ohroženější nahrazením (jinými slovy, frekvence použití "táta" bude vysoce převyšovat "otec" ve většině domén). Již dnes má spousta Čechů problém s příbuzenskými termíny "zeť" a "snacha", protože (a taky proto!) jsou v rámci svého subsystému nejméně frekventované, nahrazujíce je "muž/manžel mé dcery" a "žena/manželka mého syna" (samozřejmě je nutno zohlednit i skutečnost, že ne každý se dožije dospělosti svých potomků a ne každý je provdá či ožení, čímž se elegantně, byť náhodně, vracíme k tématu WED). Je také třeba říci, že ani velmi stabilní lexémy nejsou zcela imunní vůči nahrazení. Může totiž narůstat jejich polysemie (víceznačnost), například "oko" dostane jako další význam/použití "otvor", zatímco myslivecké "světlo" se nejprve žertovně, poté - svezouce se na hypotetické módní vlně - se vší vážností stane dominantním výrazem pro "orgán zraku", přičemž "oko" se ve svém původním významu začne používat jen v příznakových stylech atd. apod. (snad jsem myšlenku dostatečně nastínil a nikoliv jen ještě více zamotal - jsem ochoten sám sebe případně dále okomento[vá]vat). To vše je pro historické srovnávání jazyků vysoce relevantní, protože nám to ukazuje, na která slova se primárně dívat při hledání kognátů (tj. příbuzných slov). Je vyšší pravděpodobnost, že se třeba "matka" v příbuzných jazycích A a B stále zachovala (rozuměj slova pro tento koncept stále vychází ze slova společného prajazyka, "pra-AB"), tudíž má smysl nejprve srovnat slova nesoucí tento význam. Nic to ale nemění na standardních principech jako pravidelné hláskové responze, které je stále nutno hledat a odhalovat, to jest odpovídají hlásky takového slova v jazyce A pravidelným způsobem hláskám slova v jazyce B? Například za jistých podmínek francouzské počáteční /š/ skutečně odpovídá pravidelně německému počátečnímu /h/ (viz "pes"). Pokud ano, můžeme konstatovat jejich příbuznost neboli společný původ. Ale jak jsem zmínil, může dojít k náhradě. Proto české /otets/ není příbuzné latinskému /pater/. Podle podobnosti bychom řekli, že je podobnější třeba irskému /athair/, jenže podobnost nestačí. Koneckonců praindoevropské počáteční /p/ v keltštině odpadlo, takže irské slovo naopak latinskému /pater/ příbuzné je.

21.10.2014, 09:10 petusek

Ad frekvence aneb pytlík receptů a pytlík (polo)t(o)varů

Efekt textové frekvence si můžeme (samozřejmě zjednodušeně) představit třeba jako dva pytlíky: pytlík receptů, v němž jsou postupy pro kuchtění nových slabik, slov, slovních spojení atd., a pytlík (polo)t(o)varů, kde už jsou (téměř nebo zcela) hotová slova, spojení, fráze atd. Tyto pytlíky jsou propojeny, ba dokonce by někdo mohl říci, že jde o dva konce jednoho velikého pytle - různé póly téhož kontinua, chcete-li, v němž mohou být entity i promíchány. Ať tak či onak, čím častěji je mluvčí nucen použít například určité slovo, tím víc se toto slovo posouvá z pytlíku receptů do pytlíku polotovarů. Mozek si tak efektivně zajišťuje, aby měl často používané hezky po ruce a nemusel časově náročnou proceduru generování absolvovat pořád dokola. Vzniká tak jakýsi seznam entit (tvarů i pravidel) seřazených podle priority (tj. v podstatě frekvence použí). Většina nepravidelných sloves v angličtině (ba i v jakémkoliv jiném jazyce) patří právě k nejfrekventovanějším, tudíž jsou jejich nepravidelné tvary právě oněmi pohotově předpřipravenými polotovary, pro které stačí jen natáhnout pomyslnou ruku. Jenže morfo(no)[log/syntakt]ické pravidlo pravidelného tvoření (v našem případě anglických minulých tvarů a tvarů příčestí minulého) může číhat na seznamu nebezpečně blízko, takže stačí, aby frekvence nepravidelných tvarů významněji poklesla a už jsou přeskočeny generickým pravidlem a upadají v zapomění - individuálně a v závislosti na mnoha faktorech následně i sociálně. Vzhledem k tomu, že "wed" je v angličtině zhusta nahrazováno "get married", věřím, že predikce, že brzy budeme slýchat pouze "wedded", má velký potenciál býti správnou. Stačí si uvědomit, že malé děti osvojující si angličtinu coby rodný jazyk, nezřídka dělají chybu v nepravidelných slovesech nahrazujíce nepravidelné tvary tvary pravidelně tvořenými (neboli jejich ED-pravidlo má vyšší prioritu než konkrétní WED-WED-WED, BUY-BOUGHT-BOUGHT, GO-WENT-GONE atd.). Pokud programujete, můžete si jedno představit třeba předpřipravené konstanty/enumy/statické proměnné vs. metody/funkce vracející hodnotu na základě argumentů, kterýžto program/kód se ale podle potřeby programátora dynamicky mění s vývojem jedince (a/uvnitř/v rámci společnosti).

20.01.2014, 22:46 cc

jo.

Na tom něco nepochybně bude. (Také mám drobné obavy, jestli v metodice nebyla nějaká zrada. Něco na způsob: se zvoleným vzorkem se nemohlo dojít k jinému výsledku.)

20.01.2014, 21:45 admin

dalsi faktory

mozna nejde jen o frekvenci uzivani, ale napr. i v jakem veku se clovek se slovem seznami ("prvni" slova se pak dejme tomu predavaji detem, siri se tedy primo biologicky a spolu s geny, jsou konzervativnejsi nez jina). / jinak se mi zda, ze slovni zasoba a gramatika se v tomto chova hodne jinak, tj. mizejici slova a mizejici nepravidelne casovani opet mohou byt uplne jine mechanismy (i kdyz urcite ma smysl snazit se o jednotny popis, po vzoru prirodnich ved...)

17.01.2014, 19:40 cc

čili vlastně

opak chování mutací biologických, kde naopak časté používání krapet zvyšuje riziko mutace; zase ale nahlíženo z hlediska důležitosti je konzervativnost obdobná

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.