真人番摊官网关注互联网产品管理,交流产品设计、用户体验心得!

全球语种谱系图看看机器翻译需要跨越的大山_深圳专利翻译

时间:2019-09-26 14:13 来源:未知 作者:admin

  由内容质量、互动评论、分享传布等多维度分值决定,勋章级别越高(),代表其在平台内的分析表示越好。

  原题目:全球语种谱系图,看看机械翻译需要逾越的大山_深圳专利翻译

  当前机械翻译手艺能够分成两类,一种是 Rich Resource NMT,也就是双语语料丰硕的言语对(好比中文 - 英文);另一种叫 Low Resource NMT,即贫乏足够的双语语料(好比中文 - 希伯来语)。

  目前的机械翻译在Rich Resource 上曾经做得很是好了,以至在某些锻炼集下曾经能够达到或跨越人工翻译程度。可是Low Resource此刻才方才起头,有良多风趣的研究,全体程度还处于比力初级的阶段。——周明,微软亚洲研究院副院长

  按照汗青比力言语学的研究功效,一般认为世界上的言语按其亲属关系能够分为十几或二十几个 语系,此中比力出名的有印欧语系、汉藏语系、乌拉尔语系、阿尔泰语系、闪-含语系、高加索语系、达罗毗荼语系、南岛语系(又称马来-玻利尼西亚语系)、南亚语系等十大语系。

  汗青言语学把来自一个配合原始母语的所有言语都划归到统一个语系傍边,而语系下面还分有语族、语支、言语、方言、土语等,语族细分还能够分为亚语族,语支细分也还能够分语组。

  Sub-Dialect:土语(亚方言、次方言)

  印欧语系是世界上最大的语系,亦是最为普遍研究的语系。印欧语系包含了世界上很多最主要的言语,如英语、西班牙语、法语、德语、俄语等等。这些言语是良多国度和组织的官方言语,去世界贸易、科技、学术、通信、国际会议中拥有极其主要的地位。上述言语的利用者占全球总生齿的一半以上。印欧语系还包含利用人数 浩繁的言语如葡萄牙语、印地语、孟加拉语等等。关于宗教、文化、哲学方面的一些典范言语也在印欧语系中,如拉丁语、希腊语、波斯语、梵语、巴利语等。

  印欧语系的言语有屈折的特征(动词、名词按照在句中的成分、感化分歧而发生分歧的词尾变化)。有些言语(如英语)在演变过程中丧失了良多屈折变化而变得相对简单。

  印欧语系的分布,从美洲、颠末欧洲,不断延长到印度次大陆北部。一般认为原始印欧语是在新石器时代(约公元前7000年)发源于黑海北部丛林地域(现乌 克兰、立陶宛一带)。这些欧洲大陆的原始居民在公元前3500—前2500年间起头迁徙,向西到欧洲最西端,往南到地中海,向北直至斯堪的纳维亚,往东达到印度。

  凯尔特语族是印欧语系中比力小的语族。凯尔特语晚期漫衍在欧洲的泛博地域,因为罗马人和日耳曼人的降服、民族大迁徙等缘由,凯尔特语的利用者被驱赶到了威尔士、爱尔兰、苏格兰等地。凯尔特语族包罗的次要言语有威尔士语,爱尔兰盖尔语和苏格兰盖尔语。还包罗一些曾经毁灭的言语,如康沃尔语(Cornish),高卢语(Gaulish),曼岛语 (Manx)等。凯尔特人的一支迁回法国,他们的言语叫做不列颠语(Breton)。威尔士语采用“谓—主—宾”的句子布局。

  日耳曼语族发源于古诺斯语(Old Norse)和萨克逊语(Saxon)。世界上使用最广的英语就是日耳曼语族的成员。英语和北海沿岸和沿海岛屿的弗里西亚语(Frisian)最为接近。 它们都属于西日耳曼语支。同属该语支的还有德语和荷兰语。荷兰语的变体有弗拉芒语和南非荷兰语;德语有利用希伯来字母的变体意地绪语(或称依地语、犹太德 语,Yiddish)。

  北日耳曼语支(或斯堪的纳维亚语支)包罗丹麦语、挪威语、瑞典语,冰岛语因为持久与大陆隔断,较多地保留了古诺斯语的特点。与之接近的是法罗语(Faroese)。同属斯堪的纳维亚国度的还有芬兰,但芬兰语不属于印欧语系。

  东日耳曼语族曾经消亡,包罗中欧的哥特语(Gothic)、北非的梵代尔语(Vandal)等等。德语名词有三种性、四个格。英语曾经丧失了格和性的变化。

  如尼文字,日耳曼文化土生文字

  罗曼语族又称拉丁语族,全数言语都由拉丁语演化而来。罗曼语族包含的大语种有:法语、意大利语、西班牙语、葡萄牙语、罗马尼亚语。意大利语和葡萄牙语是 现存的和拉丁语最接近的言语。法语和拉丁语只是在拼写上类似,发音曾经大不不异。西班牙语受阿拉伯语和巴斯克语影响较大,罗马尼亚语被斯拉夫语包抄,受其影响颇深。

  罗曼语族的小语种有西班牙东北部的加泰隆尼亚语(Catalan),法国南部的普罗旺斯语(Provencal),摩尔多瓦语 (Moldovian)。除拉丁语外,曾经消亡的罗曼语还有奥斯干语(Oscan)、达尔马西亚语(Dalmatian)、乌布利亚语(Umbrian) 等等。拉丁语名词有三个性、六个格,是一种高度屈折的言语,采用“主—谓—宾”的句法布局。

  斯拉夫语族处于东欧,遍及采用西里尔字母。斯拉夫语族的显著特征是复辅音发财,好比塞语叫作srpski,克语叫作hrvatski;名词的格繁多。

  东斯拉夫语支包含俄语、乌克兰语和白俄罗斯语。

  西斯拉夫语支包含波兰语、捷克语和斯洛伐克语。捷克语和斯洛伐克语曾合称为波希米亚语(Bohemian)。

  南斯拉夫语支包含保加利亚语、塞尔维亚语、克罗地亚语、斯洛文尼亚语、马其顿语、波斯尼亚语。两头有不属于印欧语系的匈牙利语离隔。这是我们目前为止碰到的第二个不属于印欧语系的欧洲言语。

  三个波罗的海国度有两种波罗的言语。一是立陶宛语,二是拉脱维亚语。爱沙尼亚语和芬兰语同宗,不属于印欧语系。这是第三个不属于印欧语系的欧洲言语。

  立陶宛语是印欧语系中最陈旧的言语之一,为研究印欧语系的发源和演化起着主要感化。波罗的语族曾经消亡的言语是古普鲁士语(Prussian)。

  希腊语自成一支。现代希腊语是尺度语克伊内语(Koine)的后裔。荷马史诗所用的希腊语称作古希腊语,和现代希腊语有诸多分歧。希腊语名词有三性四格,利用奇特的希腊字母。该字母表由腓尼基字母演变而来,是世界上最陈旧的字母之一。拉丁字母和西里尔字母都是由希腊字母演变而来。

  阿尔巴尼亚语

  阿尔巴尼亚语区位于亚得里亚海之东,塞尔维亚—克罗地亚语区之南。其本身的焦点词汇显示出它是印欧语系的一个独立分支。

  在小亚细亚有印欧语系的另一零丁分支—亚美尼亚语。该言语辅音发财,有良多波斯语借词。

  印欧语系在亚洲的大分支叫做印度—伊朗语族。它由伊朗语支和印度语支构成。伊朗语支由古波斯语演化而来。最早的文献是波斯王国的大流士一世时的碑铭,及曾经毁灭的阿维斯坦语(Avestan)写的圣经。

  伊朗语支现存的次要语种有波斯语、库尔德语。向东有阿富汗的普什图语,向西有高加索地域的奥塞梯语(Ossete/Ossetian)、塔吉克斯坦的塔吉克语。

  印度语支包含言语数目浩繁,多由梵语演化而来。梵语是古代印度的尺度言语,是文学、艺术、学术著作的言语。巴利语(Pali)是古代印度些佛经的言语。

  现代的印度语支言语中,比力主要的有印地语、乌尔都语、尼泊尔语、孟加拉语和僧伽罗语。此中印地语、尼泊尔语、孟加拉语利用天城体文字或其变体。乌尔都 语是巴基斯坦的国语,因为其国民为穆斯林,所以利用阿拉伯文字。僧伽罗语是斯里兰卡的国语,利用源自巴利文的特殊文字。

  印度语支方言浩繁,其 中利用人数较多的有以下这些言语:马拉蒂语、古吉拉特语/鸠遮拉特语(Gujerati)、旁遮普语、拉贾斯坦语(Rajasthani)、奥里亚语 (Oriya)、克什米尔语、信德语、比哈里语(Bihari)、阿萨姆语(Assamese)等等。

  除此之外,印度语支还有马尔代夫语(Maldivian)、吉普赛语(罗姆语)等等。印度南部言语如泰米尔语并不属于印欧语系。举例来说,印度北方的印地语和英、法、希腊语更为接近,而和印度南方语毫无联系关系。

  吐火罗语、赫梯语

  按照在中国新疆发觉的公元六世纪的手稿,人们晓得了中亚有吐火罗语(Tocharian/Tokharian)。吐火罗人是文化程度很高的民族,公元一千年摆布为维吾尔人所败,其后消逝。

  赫梯语(Hittite)是小亚细亚的古代言语,存有楔形文字铭文。

  吐火罗语字母

  按利用人数来算,汉藏语系是仅次于印欧语系的第二大语系。它包罗世界上利用人数最多的言语—汉语通俗话。

  汉藏语系一般归为四个语族,即汉语族、藏缅语族、侗台语族和苗瑶语族。关于汉藏语系的分类和归属,学术界不断有辩论。西方一些学者一般认为侗台和苗瑶不属于汉藏语系,而属于南亚语系。 本文从大大都中国大陆学者及部门西方学者的概念,将它们纳入汉藏语系。

  汉藏语系的言语一般是由单音节字构成的声调言语。词由单个音节的字构成,每个音节都有声调。汉语北方话有四个声调,泰语有五调,粤语有九调。良多言语是孤立语,利用虚词和语序作为表达语法意义的次要手段。

  汉语族包含中国境内汉民族利用的多种言语,即官话、吴语、粤语、闽语、赣语、湘语、客家语(Hakka)、晋话、徽话、平话等。这些言语利用约五万多汉字,常用汉字约六千个。

  藏缅语族的大语种有藏语、缅甸语;小语种有中国南部的彝语、傈僳语、拉祜语(Lahu),缅甸的克伦语(Karen),不丹的宗卡语(Jonkha),尼泊尔的内瓦里语(Newari)等等。这些言语利用的文字大多来历于印度文字。

  又称侗泰语族、侗傣语族或壮侗语族。包罗泰语、老挝语,中国的壮语、布依语、侗语、怒语等等。

  次要包罗中国少数民族的苗语、瑶语、畲语。

  闪含语系也称“亚非语系”或“阿非罗—亚细亚语系”(Afro-Asiatic Family),次要分布在亚洲的阿拉伯半岛和非洲的北部。闪含语系的名称是从圣经的传说中挪亚的两个儿子的名字来历的。圣经说挪亚的儿子闪是希伯来人的先人,含是亚述人和非洲人的先人。

  闪含语系的次要配合特征是:辅音除了清辅音、浊辅音外,还有一种重辅音,在口腔后部和喉腔构成,又叫喉音。名词有格和性,但比印欧语系简单。阿拉伯和希伯来字母只要辅音,元音用附加上辅音上的符号暗示。书写时一般也只写辅音,读者需要从语境中判断出准确的元音。

  阿拉伯语是闪语族中主要的成员。它是良多伊斯兰国度的宗教、文学、以及官方的言语,也是结合国六种工作言语之一。

  马耳他是上帝教国度,马耳他语(Maltese)利用拉丁字母,但属于闪语族。

  闪语族另一主要言语是希伯来语。它是犹太教的言语,也是旧约圣经最早的手手本利用的言语。希伯来语利用本人的一套特殊字符,作为白话已经消亡过一段时间,后来被报酬恢复为白话,此刻是以色列的国语。

  同属闪语族的还有埃塞俄比亚的阿姆哈拉语、亚述王朝的阿卡德语(Akkadian)、亚述语(Assyrian)。

  最初要提到的是阿拉米语(Aramaic),它已经是波斯王朝的次要官方言语,扩展于中东、近东的泛博地域,与希腊语合作,代替了希伯来语、亚述语等很多其它言语。后来因为阿拉伯语的扩张而被架空,现存于叙利亚、伊拉克、土耳其和伊朗的孤立小块地域。

  这是一个曾经毁灭了的语族,包罗公元前四千年古埃及的象形文字,及后期的利用近似希腊字母文字的科普特语(Coptic)。十七世纪,埃及语消亡,被阿拉伯语所代替。

  古埃及一本写在莎厕纸上,用埃及语书写的药典《厄伯斯手卷》所记录相关医治哮喘的处方。

  贝贝尔语族位于北非山地,代表言语有特哇力语(Tuareg)、卡比勒语(Kabyle)、塔马舍克语(Tamazight)等。它们在非洲北部抵盖住了阿拉伯语的进攻。

  次要分布于埃塞俄比亚、厄立特里亚、苏丹和索马里。包罗索马里语(Somali)、加拉语(Galla)、贝扎语(Beja)等等。

  乍得语族包罗尼日利亚、乍得和喀麦隆地域利用的约600种言语。此中最次要的是豪萨语,它是尼日利亚的次要言语,畴前利用阿拉伯字母,此刻采用拉丁字母。

  埃及语族、贝贝尔语族、库施特语族和乍得语族可合称“含语族”(Hamitic Branch)。

  前面提到,有三种欧洲言语不属于印欧语系:芬兰语、匈牙利语和爱沙尼亚语。它们属于乌拉尔语系。乌拉尔语的原始居民在大约1500年前从乌拉尔山脉的西 伯利亚一侧迁入欧洲,糊口习俗曾经完全欧洲化,但言语仍然保留了本来的面孔。乌拉尔语系分为两个大语族:芬兰—乌戈尔语族和萨莫耶德语族。

  该语族分为两个语支。芬兰语支包罗十分类似的芬兰语和爱沙尼亚语,以及西伯利亚的莫尔多维亚语(Mordvin)、乌德穆尔特语(Udmurt)、科米 语(Komi)等小语种。乌戈尔语支包罗匈牙利语及与之附近的处于中西伯利亚的奥斯恰克语(Ostyak)、沃古尔语(Vogul)。

  《卡勒瓦拉》第14章,芬兰民歌古诗汇集家E.兰罗特手迹

  在叶尼塞河沿岸约有一万八千人说萨莫耶德语族的言语,如塞尔库普语(Selkup)、涅涅茨语(Nenets)、牙纳桑语(Nganasan)、埃内茨语(Enets)等等。

  乌拉尔语系诸言语比前面几个语系的言语更为屈折,词尾后缀变化丰硕。芬兰语名词有15个格,匈牙利语有17个!一些常见的国名在这些言语里变得不再熟 悉,例如芬兰语中的“芬兰”、“德国”、“法国”别离叫做Suomi,Saksa,Ranska,与Finland,Germany,France相去甚 远。

  阿尔泰语系由中亚的阿尔泰山得名,此刻次要分布在中国、蒙 古、土耳其以及一些中亚国度。利用阿尔泰语系各类言语的人民晚期是中国北方的游牧民族。匈奴、乌桓、鲜卑、突厥、契丹、女真、蒙古、满各个民族在这一地域 直至西亚和东欧都曾成立国度。因为统治权不不变、和平、迁徙等缘由,居民流动性很大,和其它言语接触良多,阿尔泰言语成长汗青就比力复杂。

  阿尔泰语系分为突厥、蒙古、满—通古斯三个大语族。

  突厥语族中的土耳其语是阿尔泰语系最西边、利用生齿最多的一种言语。良多前苏联的加盟共和国的言语也都是突厥语族的成员,如阿塞拜疆语、土库曼语、哈萨 克语、吉尔吉斯语、乌兹别克语;别的还有鞑靼语(Tatar)、维吾尔语、巴什基尔语(Bashkir)等语种。中国境内的有些少数民族的译法略有分歧: “乌兹别克族”译为“乌孜别克族”;“吉尔吉斯族”译为“柯尔克孜族”;“鞑靼族”译为“塔塔尔族”。

  蒙古语利用于蒙前人民共和国和中国北方的蒙古族。蒙古国利用西里尔字母,中国的蒙古族仍然利用一种竖写的拼音文字。

  蒙古语族的小语种有布利亚特语(Buryat),卡尔梅克语(Kalmyk)

  这个语族包罗西伯利亚地域的埃文基语(Evenki),或通古斯语(Tunguse),以及满语、锡伯语(Sibo)等。但中国境内的满族人大都只能说汉语。

  晚期已经把乌拉尔语系和阿尔泰语系并称为“乌拉尔—阿尔泰语系”。后来经深切研究发觉更多相异特征,不该归并为统一语系。

  别的有的言语学家主意把日语和朝鲜语也划入阿尔泰语系,由于它们和阿尔泰言语确有配合特质。但大量相异成分又难于注释,因而也有良多人认为它们属于阿尔 泰语系只是假说。还有良多人认为日语、朝鲜语语系归属不决,或自成一支。关于日语、朝鲜语的划分问题,至今未有定论。

  日语利用汉字及两套化名。朝鲜语过去利用汉字,现用一套600多年前其独创的一种拼音文字系统。日语和朝鲜语的敬语发财,按照措辞者和措辞对象的地位分歧,采纳分歧的词汇或敬语形式。别的日语中分歧性此外人用词也有差别。

  阿尔泰语系,包罗日语、朝鲜语都是典型的黏着语(粘着语):以在词根后加构词附加成分为派生新词的次要手段,以在词干之后加语法粘附成分为形态变化的次要手段。

  在语音布局上,阿尔泰语系的言语,包罗朝鲜语,都有“元音协调”的特征。所谓元音协调是指,元音按照发音位置前后分歧分为阳性、阳性两类,在统一个词里 要么都是阳性元音,要么都是阳性元音。例如,土耳其语形成复数的词尾有两种:-lar和-ler。at(马)形成复数为atlar;而ev(房子)的复数 为evler。

  高加索语系由黑海和里海之间的高加索山脉得名。其南支的卡尔特维里语族(Kartvelian Branch)中最次要的言语是格鲁吉亚语,其它言语还有明格雷利亚(Mingrelian)、拉兹语(Laz)、斯凡语(Svan)。西北支的阿布哈兹 —阿第盖语族(Abkhaz-Adyghean Branch)次要包罗阿布哈兹语(Abkhaz)、阿第盖语(Adyghe)、卡巴尔达语(Kabardian)、阿巴兹语(Abaza)等等。东北地 区次要有车臣语(Chechen)、印古什语(Ingush)、达吉斯坦语(Daghestanian)、阿瓦尔语(Avar)、莱兹金语 (Lezgin)、拉克语(Lak)、列兹吉语(Lezgi)、塔巴萨兰语(Tabasaran)等。

  高加索言语的遍及特点是具有大量复杂的 辅音簇。有种已消亡的高加索言语包含多达81个单个辅音。俄罗斯南方的卡巴尔达语只要3个元音,并且在现实话语中常常消逝。很难想象人们措辞都是辅音是什 么样子,也许因为地处高寒地域,人们成心避免张口发元音,以提高语速并削减热量丧失。

  格鲁吉亚语字母

  或称“马来—玻利尼西亚语系”(Malayo-Polynesian Family)。该语系从印度洋、马来半岛、东南亚,越过承平洋直到新生节岛,由一千多种言语构成。该语系的利用者听说最早发源于黄河谷地,公元前 2500年摆布经台湾迁徙到菲律宾,公元前约1000年进一步迁至印度尼西亚、承平洋诸岛屿。南岛语系包罗五个分支:

  包罗台湾本土的阿美语(Amis)、泰雅语(Atayal)、排湾语(Paiwan)、邹语(Tsou)。这些言语的利用者都是台湾原居民。

  又称马来语族,是南岛语系最大的一支。此中的马来语作为一种商业和文化的言语在很多处所利用。马来语曾利用阿拉伯字母,20世纪改用拉丁字母。该语族还 包罗印度尼西亚的诸多言语如印尼语、爪哇语、巽他语(Sundanese)、马都拉语(Madurese)、巴厘语(Balinese)等等;及很多菲律 宾言语,如比萨亚语(Visayan)、他加禄语等。

  此外还有一个遥远的分支叫做马尔加什语(Malagasy),它长短洲南部岛国马达加斯加的国语。1500年前,一部门人从印度尼西亚渡过印度洋来到马达加斯加岛。他们虽然已成为非洲人,风尚习惯也变得非洲化,但言语仍然表示南岛语的特点。

  包罗较小地域的言语,如马绍尔群岛语(Marshallese)、吉尔伯特群岛语(Gilbertese)、雅浦岛语(Yapese)、瑙鲁语(Nauruan)等等。

  包罗斐济语(Fijian)、所罗门群岛语(Solomonese)等。

  包罗新西兰的毛利语(Maori)以及承平洋中靠东面的一些岛屿的言语,如萨摩亚群岛语(Samoan)、塔希提岛语(Tahitian)、夏威夷语(Hawaiian)、新生节岛语(Rapa Nui)等。

  不难发觉这些语族名称遍及带有-nesian词根。从字面意义看,Austronesian意为“南岛”;印度尼西亚(Indonesian)意为“印 度岛”;密克罗尼西亚(Micronesian)意为“小岛”;美拉尼西亚(Melanesian)意为“黑岛”;玻利尼西亚(Polynesian)意 为“群岛”。

  南岛语系言语的名词、动词形式变化很简单。马来语没有时态或格的变化。复数通过反复词根完成,如anak:小孩;anak anak:孩子们。

  承平洋诸语中代词变化复杂。物主代词“我们/我们的”在有的承平洋言语中要细分为“临时性属于”(如汽车、书本),和“永世性属于”(如身体器官)。有 的言语的指示代词“这”分为三种变化,一种指示看得见的物体;一种用来指示措辞时看不到但具有的物体;一种指示不具有的事物。还有的言语中的人称代词“我 们”分为“包罗措辞对象”和“不包罗措辞对象”两种。美拉尼西亚语的复数人称代词还有三种数的变化:双数aijumrau(我们俩);三数 aijumtai(我们仨);复数aijam(我们)。

  承平洋言语另一特点是辅音、元音数量较少。夏威夷语仅有8个辅音(H、K、L、M、N、P、W、喉塞音)和五个元音(A、E、I、O、U)。他加禄语和毛利语采用“谓—主—宾”的语法形式。马尔加什语为“谓—宾—主”。

  南亚语系分布在印度东部至中南半岛的亚洲东南部地域。一般分为三个语族。

  该语族包罗越南语、芒语(Muong)(两者都是越南境内的言语)。

  该语族次要包罗孟语(Mon),已经的泰王国的次要言语,此刻利用于缅甸、泰国、中国和越南的零散地域;高棉语,柬埔寨的国语;尼科巴语 (Nicobarese),位于苏门答腊西北的尼科巴群岛;卡西语(Khasi);中国境内(次要云南省)的佤语、布朗语(Blang)、德昂语 (De’ang)等。

  扪达语族言语零散分布于印度北部地域,包罗扪达语(Munda)、科尔库语(Korku)等近20种言语。

  南亚语系中越南语具有声调,其余言语没有声调。前面汉藏语系中提到,有学者认为“侗台”和“苗瑶”两个语族属于南亚语系。

  达罗毗荼语系

  在前文“印欧语系”中提到,印度北部言语大多属于印欧语系,但南部言语与北部差距甚远。印度南方大部的言语属于达罗毗荼语系。该语系的一显著特点是发音难度大。

  达罗毗荼语系包罗的大语种有泰米尔语,利用者约一千八百万人,分布于印度的泰米尔省、斯里兰卡北部、马来西亚,同时也是新加坡的四种国语之一;马来雅兰 语(Malayalam),约有六百万人利用;泰卢固语,约二千四百万人利用,分布于印度东南沿海马德拉斯以北的地域;卡拿拉语(Canarese),约 一万万人利用于孟买地域的卡拿拉。这些言语利用各自的书写系统,具有弯曲、圆弧形的典型南印文字特征。

  还有一种达罗毗荼语叫做婆罗灰语(Brahui),有17万人利用,在俾路支山区。

  达罗毗荼语遍及具有卷舌辅音(一称顶音),该特征是受印欧语系的印度语族言语影响而来。发这种音时,舌面卷起,舌尖抵住硬腭。这也是印度境内诸语的显著特征。别的,达罗毗荼语多表示黏着特征,名词格的变化复杂。

  一般认为达罗毗荼语系发源于此刻巴基斯坦境内的印度河谷,已经笼盖过整个印度次大陆。

  尼日尔—刚果语系

  尼日尔—刚果语系包含撒哈拉戈壁以南的非洲大陆的共900多种言语。该语系发源于西非,逐步迁移至非洲东南部。

  非洲国度的疆界并不完全反映言语的划分,而更多展示的是其被殖民的汗青,所以非洲诸言语常常不按国界划分,凡是一种言语可能被几个国度同时利用;同样,一个国度也可能有多种互不不异的言语。

  尼日尔—刚果语系包罗九个语族,次要言语有:非洲西部的弗拉尼语(Fulani),利用于尼日利亚、喀麦隆、马里、几内亚、冈比亚、塞内加尔、毛里塔尼 亚、尼日尔、布基纳法索;马林克语(Malinke),用于塞内加尔、冈比亚、几内亚、马里、科特迪瓦;门德语(Mende),次要利用于塞拉利昂;特维 语(Twi),用于加纳;埃维语(Ewe),用于加纳、多哥;莫西语(Mossi),用于布基纳法索;约鲁巴语(Yoruba),用于尼日利亚;伊波语 (Ibo),用于尼日利亚;科佩勒语(Kpelle),用于利比里亚;沃洛夫语(Wolof),用于塞内加尔;方语(Fang),用于喀麦隆、加蓬、几内 亚。

  非洲东南部从几内亚到苏丹这条地带南面,有一大群班图语族(Bantu Branch)的言语。班图语族数量浩繁,利用者约五万万人。利用者最多的一种是斯瓦希里语,用于坦桑尼亚、肯尼亚、乌干达、卢旺达、布隆迪等地;其余包 括乌干达的干达语(Ganda),卢旺达的卢旺达语(Ruanda),布隆迪的隆迪语(Rundi),刚果(金)的鲁巴语(Luba),刚果(金、布)的 林加拉语(Lingala),刚果语(Kongo),刚果(金)、赞比亚的贝姆巴语(Bemba),津巴布韦的肖纳语(Shona),津巴布韦和南非的恩 德贝勒语(Ndebele),博茨瓦纳的茨瓦纳语(Tswana),南非的祖鲁语等等。

  非洲南部言语遍及用声调表达语法意义(偶尔用于区别词义)。刚果的班达语(Banda)有三种调,本地人也利用三调的鼓来传送消息。埃菲克语(Efik)有四调,m、n看成元音利用。

  尼日尔—刚果语系的大部门言语利用丰硕的前后缀来润色名词和动词,名词、动词从不零丁呈现。弗拉尼语有18个名词限制后缀;恩义贝勒语有16种名词限制前缀和丰硕的表达亲属关系的词语,如u-baba(我的父亲)、u-yihlo(你的父亲)、u-yise(他的父亲)。

  肖纳语有200多个描述“走”的词语,如mbwembwer(摇晃屁股走),chakwair(在泥中咯吱咯吱地走),donzv(拄着手杖 走),panh(长距离地走),rauk(大步走)等等。弗拉尼语名词通过变换词首辅音来表达语法意义,如jese(脸),gese(脸的复 数),ngesa(大脸)。

  班图语族采用五进制,数字六用“五加一”表达。很多非洲部落言语中有吸气音、咂嘴音等离奇的辅音。

  除了前面这十大语系,世界上还有一百多种小语系漫衍各地,有很多土著语、原始部落的言语还没能完全为言语研究者领会和认识。在本文的最初章节,简要引见一下尚未涉及的部门非洲言语、美洲大陆的土著言语、未界定语系或独立不属任何语系的言语。

  非洲东北部另有尼罗—撒哈拉语系(Nilo-Saharan Family),包含诸如埃及南部和苏丹的努比亚语(Nubian)、肯尼亚北部的丁卡语(Dinka)和玛赛语(Masai)等言语。该语系发源自埃塞 俄比亚山区,一万年来并未有大迁移,根基仍存留在发源地。

  非洲南部有一小撮言语属于科依桑语系(Khoisan Family)。该语系的两种典型言语是霍登托语(Hottentot)和布施曼语(Bushman),利用于纳米比亚和南非。该语系曾笼盖整个非洲中部和南部的泛博地域,后为迁入的尼日尔—刚果语系所代替。

  爱斯基摩—阿留申语系(Eskimo-Aleut Family)笼盖西伯利亚、阿拉斯加及阿留申群岛地域。次要言语为爱斯基摩人的因纽特语(Inuit)。该言语合成词发财,凡是一个动词与浩繁名词及修 饰成分合成一个复合词表达意义,这种复合词即相当于其它言语中的句子。

  阿尔贡金语系(Algonquian Family)分布在美洲大陆东北部,包罗奥积瓦语(Ojibwa)、克利语(Cree)、黑脚语(Blackfoot)、密克马克语(Micmac)、 水彦语(Cheyenne)、卓克托语(Choctaw)、坡塔瓦托米语(Potawatomi)、莫希干语(Mohican)、特拉华语 (Delaware)等。该语系的很多言语名词分为两品种似性的变化:有生命的和无生命的。

  位于加拿大的阿沙巴斯甘语系(Athapascan Family)包罗拿瓦荷语(Navajo)和阿帕奇语(Apache)。拿瓦荷语有良多词语来描述分歧外形、颜色和位置的物体。在拿瓦荷人眼中的世界都由几何图形形成,事物都通过几何外形来察看和描述。

  伊洛魁语系(Iroquoian)同样位于北美洲,包罗切诺基语(Cherokee)、休语(Sioux)、摩荷克语(Mohawk)等。摩荷克语的主语在动词上按照性别标识表记标帜,词序随便,该特征与班图语族类似。

  北美大陆的承平洋沿岸有一支莫桑语系(Mosan Family),包罗贝拉—库拉语(Bella-Coola)、平头语(Flathead)和奥卡纳干语(Okanagan)。这些言语的有些词汇既能够作动词又能够作名词。只要通过上下文才能判断出准确意义。

  北美及中美洲地域的乌托—阿斯特克语系(Uto-Aztecan Family)包罗美国和墨西哥境内的河比语(Hopi)、帕帕哥语(Papago)和科曼奇语(Comanche)等。该语族的最主要的言语是拿哇特尔 语(Nahuatl)。辅音tl为该言语的显著特征之一。该言语采用五进制。

  墨西哥中部有奥托—曼吉语系(Oto-Manguean Family),包罗7个语族150多种言语。此中良多言语有声调。

  墨西哥南部尤卡坦半岛及危地马拉的玛雅语系(Mayan Family)包罗8个语族约30种言语。这些古文明的承担者约发源于公元前800年。

  中美洲的大奇布查语系(Macro-Chibchan Family)包罗洪都拉斯和尼加拉瓜的加勒比海沿岸的姑娘基多语(Miskito)和巴拿马的库纳语(Cuna)。

  佩纽蒂语系(Penutian Family)漫衍于中、南美洲,最大的一支是智利的阿劳坎尼语(Araucanian)。

  加勒比语系(Carib Family)漫衍在南美洲北部的雨林地域,包罗加勒比语(Carib)、帕诺亚语(Panoan)、奇基多语(Chiquito)等。此中巴西雨林中约350人利用的Hixykaryana的语序为“宾—谓—主”,这种语序为南美洲所独有。

  安第斯—厄瓜多尔语系(Andean-Equatorial)笼盖南美泛博地域,包罗秘鲁和厄瓜多尔印加族人的克权语(Quechua)、玻利维亚的埃玛拉 语(Aymara)、巴拉圭的瓜拉尼语(Guarani)、巴西的图皮语(Tupi)及加勒比海沿岸的阿拉瓦克语(Arawak)。

  巴布亚新几内亚的700多种言语还不怎样为人们晓得,还在研究之中。该岛上的言语可能分为六、七个大语系,一些小语系和一些独立言语。大大都巴布亚言语的利用者只要几千人,不为外界熟知。

  新几内亚岛上很多言语的配合特点是有双数代词,即利用分歧词语暗示“我们”,“我们俩”;“你们”,“你们俩”。

  奇瓦伊语(Kiwai)有已知的最复杂的动词变化布局,依托在动词上加前后缀来表达句子意义。例如:odi意为“给弓装弦”,通过添加下列前后 缀:ri-mi-bi-du-mo-i-odi-ai-ama-ri-go,来表达“在遥远的未来的某个时候,他们三小我必然会为两只弓装弦”的意义。

  伊马斯语(Yimas)有四种过去式变化,以严酷区分动作发生的过去时间与措辞时间的远近程度。

  拉托卡斯语(Ratokas)只要11种发音,是已知言语中起码的。这11个音位由5个元音和6个辅音形成:A、E、I、O、U、B、G、K、P、R、T。

  有的言语学家认为安达曼群岛和塔斯马尼亚岛言语与巴布亚言语有亲属关系。

  澳大利亚的约250种土著言语可大致分为23个语系。北方地域分布有此中的22个,如Bunaban,Ngaran,Yiwaidjan等。澳大利亚中 南部的Pama-Nyungan语系具有复杂的代词系统,例如代词“我们”有四种形式:yunmi(我们俩,你和我);mintupals(我们俩,他和 我);mipala(我们所有人,包罗你);melabat(我们所有人,不包罗你)。Jiwarli语有三个分歧动词暗示“搬运”的意义,以区分物体在 手上、在头上或在背上。澳大利亚不少土著言语利用分歧词汇与分歧乡属扳谈。Adnyamathanha语有十套代词系统,用于与分歧的亲人扳谈。Dyirbal语的每个词都有两套几乎完全分歧的词汇。该言语名词有四种性别。 深圳专利翻译

  大大都土著言语的数量词只要三个:“一”、“二”和“很多”。

  世界上还有良多言语不属于任何一个语系,这些言语称作独立言语或言语孤岛。好比日本北海道地域有一种阿伊努语(Ainu),几近毁灭。Porome语为 巴布亚新几内亚约一千人利用,没有文字系统。巴基斯坦节制下的克什米尔地域也有一种没有文字的言语叫做布鲁沙斯基(Burushaski)语。

  在法国和西班牙交壤处的比利牛斯山区西部约有五十万人说巴斯克语(Basque),它是古代伊比利亚语的残留形式。巴斯克语采用20进制,代词“它”有三种形式,别离指代离措辞人较近距离、中距离和远距离的事物。前往搜狐,查看更多

  关注 互联网的一些事 官方微信,回复" 654 " 即可在微信里阅读本篇内容。

  在查找公众号中搜索:织梦58,或者扫描下方二维码快速关注。

围观: 9999次 | 责任编辑:admin

回到顶部
describe