北大中文论坛 www.pkucn.com

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
楼主: shenj

各语种的语言文字富含共性

[复制链接]
 楼主| 发表于 2014-5-25 12:34:21 | 显示全部楼层
语言文字与概念密切相关,但不等同
20
语言文字和概念都在映射客观世界。语言文字有实体,能用作交际工具。概念没有实体。用语词表达概念是语符化现象。 21
概念是词义处理中个体的理性产品,具有主观性。虚拟空间是个体与社会共建的特殊领域,又有客观性。
22
概念世界存在于虚拟空间,是抽象的。概念语符化使概念社会化有了可能。
 楼主| 发表于 2014-5-30 14:04:31 | 显示全部楼层
  我这里提到的许多概念会有许多人看不懂,不得不做一些解释。
  语音、语义、字形、字音、字义——它们都属于语言文字信息,只能列入载荷的范畴,不可能列入载体的范畴。语音和字形属于符号的外壳,这一“外壳”概念已经被抽象处理了,称为“形式”。“形式”是经过概括的知识属性,是抽象概念。语言文字学通常不涉及物质形态的声音和图像。它们丰富多彩,具有千变万化的多样性。声音和图像是语言文字的存在方式,但并非语音或字形一类经过抽象概括的知识属性。语言文字学关心的音义结合体或形音义结合体是语言文字的存在价值,只能属于载荷范畴。“字音”与“语音”概念不同,也即属性或要素的性质不同,尽管“字音”转变为“读音”后正好就是“语音”。“字义”与“语义”也有类似的区别和联系(属性或要素的性质相似)。它们同样都属于统一体的信息内涵。
  即使是拉丁字母,字形与字音也是两个不同概念,前者是能指,后者是所指。字义通常是字母组合具有的词汇学属性。
  钢蹦的外壳是金属材质,钢蹦的内涵是币值。前者和后者也可以说是背面和正面。这些无非都是一些说法,需要适当理解。
  我不敢说我在布道于盲。世界上能人志士极多,必定会有更加聪慧的见解,必然对我会大有指益。
  任何图解都会有不足之处,失于过简,请方家见谅。
 楼主| 发表于 2014-5-30 14:18:05 | 显示全部楼层
本帖最后由 shenj 于 2014-5-31 11:35 编辑

关于“文字是记录语言的工具”

  如果不嫌罗嗦,应该说,文字是使用图像方式替换自然语言声音实体的信息交际工具。当然应该指出,书面语言是依据有声语言衍生得到的语言工具,它与有声语言同样是语言工具。它有独立的书面体制,用来弥补脱离面对面交际可能带来的不方便。此外,书面语言比有声语言稳定,能够给有声语言的发展进步提供辅助依据。这种创新的依据依旧是有声语言允许的创新手段,不是另搞一套。所谓“记录”并非每次照搬有声话语产品,只是合理地沿用有声语言固有的体制,沿用其全部词汇和句法等组成成分。它不能任意改变这一格局和构造成分,自行其是。它可以是思维意识中内部语言的外部展现。有声语言难以捕捉,书面语言可以帮助记忆,因此后者可以成为重要的知识工具,借助这种工具语言文字相得益彰,不但个人一生有好处,也使多世同堂的群体生活大有好处。
  “文字是记录语言的工具”所说的实质意义在于:
  ⑴文字是自然语言的衍生产品;
  ⑵文字使用视觉器官,代替听觉器官。读代替听,写代替说;
  ⑶书面语言与有声语言使用的语言系统一致;书面格局的发展反作用于自然语言;
  ⑷文字增强了语言的稳定性;借助文字研究语言有其方便之处。

左图是右图的分解和解析,实质内容是一致的。文化教育必须兼顾统一体和结合体两者。
工程技术专家侧重考察的是统一体,语言文字工作者主要研究的是结合体。

文字用图像替换有声语词的声音,是载体的改变,功能意义是一致的。语言文字全系统向上兼容。
 楼主| 发表于 2014-6-1 11:29:24 | 显示全部楼层
本帖最后由 shenj 于 2014-6-2 15:04 编辑

  从一定意义上说,书面文字对于语言的历史演变和方言分歧是相当宽容的,因此书同文有助于自然语言的稳定和全民普及。
  方言的隔阂可能有大有小,但是方言区公众一般选择全民通用的书面文字。这就不但是政治标准,也是民众生活现实需要的标准。使用通用的文字有助于经济、文化、行政和军事的利益。而使用通用文字的前提是方言同属一个语种。相关知识得到共识也是民族意识的需要。
 楼主| 发表于 2014-6-2 17:05:07 | 显示全部楼层
本帖最后由 shenj 于 2014-6-4 14:44 编辑

汉字是语素音节文字

  每个汉字都代表一个音节,一般一个汉字都是一个语素。连绵词和音译词一词多字是由语言决定的,它们有多少音节就有多少个字,用作一个语素。许多语素经常可以独立成词,也可以参与组成复合词或合成词。由于历史形成过程的原因,儿化现象需由两个字组成一个儿化音节,其中“儿”字不再是独立音节。汉字的音节可以解析出音素(或声、韵、调),属于知识处理,与字形无关,有别于韩文。汉字一般直接与语素对应,不是音节符号,有别于日文假名。文字是形音义结合体。以上所说指的是汉字有一字一音一义的特点。这里说的特点与所谓多音字、多义字的概念毫无关系。
  古汉语以单音词为主,也有部分多音词。在汉语演变过程中,许多单音词转化为语素,语素结合形成合成词和复合词。汉语语素组词采用类似造句方式的“意合”,词根直接组合,一般不需要词缀介入,更不需要添加词形手段(指词尾),因此临时词的形成特别方便。经过约定俗成,有用的多字词很容易得到公认和推广。这样形成的多字词迅速增加,语言就越来越丰富多彩。现代汉语单音词已经不多,只有频繁使用的单音词被沿用。多音词大量涌现,是组成语流的主体。在此基础上汉语的双音节奏又成为一种特殊的语音格局。这也是诗词格律的基础。
 楼主| 发表于 2014-6-2 19:10:39 | 显示全部楼层
本帖最后由 shenj 于 2014-6-4 00:21 编辑

1
请注意单字词渐降、二字词高比例的趋势
2,3
在56063常用词中,单字词约3000,双字词约40000。
以上图2与图3的纵坐标使用对数标度,可显示低频部分。
图3与图1完全一致。图2主要显示每万字内的分布。
4
图4与图2一致,以百分比说明分布关系。
单音词、双音词等包括儿化多一字的词。
省略五字词等长词的数据,同一列百分比之和小于100%。
以上依据的是常用词表中词种复现频度的顺序,不是词种复现的频度值。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
 楼主| 发表于 2014-6-2 19:33:41 | 显示全部楼层

  汉字另有六书等分类方法。这是造字方法的分类。我们必须注意汉字造字方法的重要性,但不应该忽略,字形是为了区分汉字字音和字义的。六书形成的是方块字,这是汉字字形的重要因素。每一个方块代表一个汉字单元。它就是汉字作为语素音节文字的重要标记。汉字形音义结合体是文字的本质属性。汉字造字方法具有多样性,任何试图一言以概之的文字类型的说法都是有巨大风险的。“表意文字”的说法极其模糊,并不正确。即便说是“表义文字”也不适宜,因为任何文字都是表义文字,没有分类价值。汉字确实不是造字方式的“表音文字”,而且据此不能作出任何分类结论。
 楼主| 发表于 2014-6-3 21:12:52 | 显示全部楼层
本帖最后由 shenj 于 2014-6-3 21:23 编辑


忽略0.3%其他词长的数据。不包括儿化词。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
 楼主| 发表于 2014-6-3 22:03:43 | 显示全部楼层

包括儿化词在内。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
 楼主| 发表于 2014-6-4 09:42:06 | 显示全部楼层
  语素文字(英语:logogram,来自古希腊文:λόγος“词”和γράμμα“字符”),又称表语文字,是表示词或语素(语言的最小语义单位)的文字。它和表音文字不同:表音文字是表示语音的文字,表音文字的一个字位表示一个音位或者音位的组合。
  在非正式的场合,语素文字往往被称为表意文字或象形文字,但这只是一种比喻或形象的说法。语素文字和表意文字、象形文字的区别主要有两点:
  1、语素文字是用来记录语言的文字,和语言有严格的对应关系。一般来说语素文字可以分解为字位,一个字位代表一个语素,当然也可能出现一个字位代表几个语素和几个字位代表一个语素的情况。与语素文字不同,表意文字只是表达一种意思,象形文字只是用图画来表示物体,这两种都不一定用来记录语言。比如禁烟的标志可以看成表意文字,但不是语素文字。
  2、目前已知的语素文字都不局限于表形和表意,而是有表音的成分。因此,语素文字也称为意音文字。
  语素文字的出现代表人类文字史走出原始时期,进入古典时期。
  “意音文字”和汉字中的“形声字”不是同一个概念,任何汉字(无论是否形声字)都是意音文字系统的字位,因为它(在特定的方言里)都有确定的一个或几个读音。
历史上发展成熟而又代表高度文化的语素文字只有西亚的楔形文字、北非的圣书字和东亚的汉字。但楔形文字和圣书字早已废止使用,汉字是当今世界上唯一仍被广泛采用的语素文字,为中国、新加坡、马来西亚等国使用。除此之外,日本语、越南和韩语/朝鲜语也使用部分汉字。
  契丹文(限契丹大字,契丹小字为拼音文字)、女真文、西夏文及越南的字喃等,均是模仿汉字而构成的语素文字。现在契丹文、西夏文已经失传,而字喃在越南于19世纪被法国统治后,就已经不再采用。
  古彝文也是一种语素文字。而现时流通于四川的凉山规范彝文,已经演变及简化为音节文字,没有了表意的功能。云南规范彝文仍然是语素文字,但使用不广泛。
 楼主| 发表于 2014-6-4 09:45:09 | 显示全部楼层
本帖最后由 shenj 于 2014-6-4 12:49 编辑
  汉字是语素文字
  也有人把汉字称为语素音节文字或语词音节文字
  记录音素的是音素文字,如英文;记录音节的是音节文字,如日文的假名;记录语素的是语素文字,如汉字。音素文字和音节文字合起来叫做表音文字,也叫拼音文字。表音文字的基本单位是字母,语素文字的基本单位是字。
  也有人把汉字称为语素音节文字或语词音节文字,这些名称是为了反映汉字既表音又表义的意音文字性质。语素音节文字的提出还反映了字体变化对象形字和会意字的影响。汉字在早期的造字过程中广泛使用了象形和会意的方法,当时这些象形字和会意字都能从形体上体现出语素或词的意义,但随着文字字体的演化,人们已经很难从象形字和会意字中看出语素或词的意义,继续把这些字称为象形字和会意字也不太合适。不过尽管字体变化了,象形和会意已经看不出来了,但在同音语素或同音词中,这些汉字仍然能把这些语素或词区别开,所以可以称为语素音节文字。
  通过对汉语这种活生生的意音文字的分析可以看出,意音文字在记录语言时提供的信息量和表音文字相比是不一样的,因为对于具有相同语音形式的一组不同的语素或词来说,表音文字所用的字都一样,但意音文字还要从字形上把这些语素区别开来。从这个角度看,意音文字有助于区分同音语素或同音词。也正是由于意音文字通常能够把同音语素或同音词区分开来,它就不可能完全按照一个字一个音形的原则来造字。
 楼主| 发表于 2014-6-4 11:48:06 | 显示全部楼层



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
 楼主| 发表于 2014-6-4 11:49:24 | 显示全部楼层


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
 楼主| 发表于 2014-6-4 12:33:54 | 显示全部楼层
本帖最后由 shenj 于 2014-6-4 14:34 编辑

请注意苏培成先生的小结:
  本文小结 上面我们讨论了汉字的语素文字说和汉字的意音文字说。这两种理论都是正确的,可以共存,而不是彼此排斥。朱德熙把这两种理论放在一起来说明,他说:“从汉字跟汉语的关系看,汉字是一种语素文字。从汉字本身的构造看,汉字是由表意、表音的偏旁(形旁、声旁)和既不表意也不表音的记号组成的文字体系。”那么,汉字的这两个方面是并列的呢,还是有主有从的呢?我们认为不是并列的,而是有主有从的。汉字是语素文字,这是汉字的根本性质。正因为汉字是语素文字,所以字数要有成千上万。要为汉字造出成千上万个不同的形体,汉字的字形和它所记录的语素要有一定的联系,也就是有一定的理据性,用单一的字符是做不到的,所以要用三种字符。所以汉字的结构特点是从汉字是语素文字这一根本性质派生出来的。这就是本文的结论。
 楼主| 发表于 2014-6-4 13:19:46 | 显示全部楼层
本帖最后由 shenj 于 2014-6-4 14:34 编辑

苏培成先生提到:
    赵元任等的语素文字说。语素(morpheme)理论产生之后,国内外都有学者认为汉字是语素文字。最早提出汉字是语素文字的是赵元任,不过他把morpheme叫做词素,而不叫做语素。赵元任说:“用文字来写语言,可以取语言里头各等不同尺寸的单位来写。……在世界上通行的能写全部语言的文字当中,所用的单位最大的文字,不是写句、写短语的,是拿文字一个单位,写一个词素,例如我们单独写一个‘毒’的字形,来写‘毒’这个词素。……以上是讲用一个文字单位写一个词素,中国文字是一个典型的最重要的例子。……他跟世界多数其他文字的不同,不是标义标音的不同,乃是所标的语言单位的尺寸不同。”
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|北大中文系 ( 京ICP备12040209号

GMT+8, 2016-8-4 14:56 , Processed in 0.135242 second(s), 19 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表