科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 2335 次
  • 编辑次数: 1 次 历史版本
  • 更新时间: 2009-03-19
admin
admin
发短消息
相关词条
H.265
H.265
IGZO技术
IGZO技术
触摸屏工作原理
触摸屏工作原理
1ZB
1ZB
喷码技术
喷码技术
机电一体化
机电一体化
PMMA塑料
PMMA塑料
自组织系统
自组织系统
终端
终端
模拟计算机
模拟计算机
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

统计语言学 发表评论(0) 编辑词条

目录

统计语言学编辑本段回目录

 

正文编辑本段回目录

  数理语言学的一个分支,应用统计数学的方法来研究语言现象的语言学科。统计语言学的研究领域目前主要包括以下几个方面:
  ①统计语言单位的出现频率,如对词汇和音位、语素出现的频率进行统计研究。
  ②统计作家的用词频率、词长分布和句长分布,以了解作家运用语言的风格;用这种方法还可判定匿名文章的作者。
  ③计算语言存在的绝对年代以及亲属语言从共同原始语分化出来的年代,这方面的研究叫做语言年代学,又称为词源统计分析法。此外,还可对亲属语言的语法、语音体系进行统计、比较。
  ④采用信息论方法研究语言的熵和羡余度。语言的熵就是在交际过程中语言符号出现的不定度。不定度的大小与语言的熵的高低一致。当语言的接收者接收到语言符号之后,不定度被消除,熵等于零,因而在交际过程中,语言接收者所得到的信息量恰恰等于被消除的熵。语言的羡余度是指语言中超过传递最少需要量的信息量的比例,在一般情况下,人们为了保证对方能够理解,总是提供比实际需要多得多的信息量,因此,不论在书面语还是口语中,语言都有羡余度。
  ⑤探讨语言的一般统计规律。例如,在按频率递减顺序排列的频率词典中,词的序号越大,词的频率越小,序号与频率之间的关系可以用数学公式描述为一定的统计规律,这个统计规律叫做齐夫定律,因其研究者之一、美国语文学家G.K.齐夫而得名。
  ⑥运用随机过程论来研究语言,把语言看成彼此联系的字母序列,前一个字母决定后一个字母的出现,于是形成一条字母链,叫做马尔科夫链,因其最早的研究者俄国数学家A.A.马尔科夫而得名。
  ⑦研究文章中两个词之间、两个语法范畴之间、两个语义类之间或两个句法类型之间的间距,以揭示文章在句法或语义上的特征。
  ⑧研究语言的词汇与文章长度的关系,以揭示文章中词汇的丰富程度和差异程度。
  统计语言学在数理语言学中有比较悠久的历史。古印度语法学家在研究《吠陀》时,就进行过单词和音节数目的统计。1851年,英国数学家A.德·摩尔根 (1806~1871) 曾把词长作为文章风格的一个特征加以统计研究。苏格兰学者L.坎贝尔于1867年、德国学者W.迪丁贝尔格于1881年都曾采用统计方法确定柏拉图著作的写作时期。1887年,美国学者T.C.门登霍尔对英国文学作品、特别是莎士比亚的作品进行过统计分析。1913年,马尔科夫研究了俄语中字母序列的生成问题,提出了马尔科夫随机过程论。1935年,齐夫发表了齐夫定律。1944年,英国数学家G.U.尤勒《文学词语的统计分析》一书中广泛使用概率和统计方法来研究语言。1950年,美国学者M.斯瓦德士进行了语言年代学的研究。1951年,美国数学家C.申农采用信息论的方法研究书面英语中的熵和羡余度; 美国学者 V.英格韦对句法现象进行了间距分析。1954年,法国学者P.基罗根据文章中词的频率分布提出了词汇丰富度的概念。1956年,英国学者G.赫尔丹出版了《语言是选择和机遇》一书,系统总结了统计语言学的研究成果。近30年来,在语言统计中日益广泛地使用计算机,逐渐改变了传统的手工查频、统计的办法,提高了统计的效率和精度。
  统计语言学大致可分为语音统计学词汇统计学语法统计学语义统计学,分别研究语言的语音、词汇、语法和语义的统计特征。从描写的角度出发,词汇统计学又可以分为年代统计学、风格统计学和分类统计学3 个分支,分别根据时代的变化、作者写作风格的不同和语言的类属或起源对词汇特征进行统计分析。
  统计语言学的许多研究成果,对于通信技术、语言教学和自然语言的信息处理都很有价值。
  参考书目
 G.Herdan,Quɑntitɑtive Linɡuistics,Butterworths,London,1964.

 

配图编辑本段回目录

 

相关连接编辑本段回目录

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 统计语言学

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。