搜索到57篇“ 统计语言学“的相关文章
- 统计语言学
- 语言与统计是一门涉及语言学、计算机科学和数学等多门学科的交叉学科。本书侧重阐述语料库、语言的基本统计、假设检验、方差、文本聚类、文本分类、各种软件介绍、R语言、运用统计进行语言的词汇、句法和语义研究以及风格语言学。
- 刘颖编著
- 关键词:统计语言学
- 基于统计语言学的韩国语固有名词研究--以准口语语料库为例
- 朴琦华
- 浅议统计语言学在作家语言风格研究中的实际应用
- 2018年
- 统计语言学是应用统计数学的方法来研究语言现象的语言学科,研究领域广泛,学界常常运用统计语言学,通过分析语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。通过"判定《静静的顿河》作者""证明《红楼梦》是否出自一人之手"两个案例可以看出,统计语言学的研究方法在进入文学研究领域后,取得了非常好的实用效果。但是,在实际应用中,除了各类词汇等可控变量,还有其他潜在因素导致统计语言学的结论有时并非绝对精准。通过进行多方面、深层次地原因分析和推断,我们发现,要得到准确的研究结果,必须做好研究的前期准备,要选择具有相似语言环境的语料,要注意避开文学语言的形象思维影响,不能滥用统计语言学研究方法,并在操作过程中严格控制各种变量,以科学的思想指导研究。
- 万晓雯
- 关键词:统计语言学实际应用
- 从统计语言学路径解读苏轼的内心世界——以《唐宋八大家散文选读》为例
- 2018年
- 从“统计语言学”视角对文本进行数字统计与比较,有利于我们发现一定的语言规律,有利于我们深层次地解读文本。王力先生在《汉语语法史》中讲到,“予(余)”是专用于单数的,“我”“吾”则可兼用于复数。鉴于此,笔者对苏教版《唐宋八大家散文选读》中的“我”“吾”“余”“予”在此书各篇中的使用情况(文中引用话语除外,下同)作了统计,结果如下表:
- 刘希乐
- 关键词:唐宋八大家数字统计解读文本内心世界选读散文
- 从统计语言学视角看苏轼的俯仰人生
- 2015年
- 有一则经典商业案例:美国沃尔玛超市的货架上,尿片和啤酒竟然放在一起出售。这两件毫不相干的商品为什么被摆在一起出售?原来,沃尔玛的工作人员在统计产品的销售信息时发现了一个奇怪的现象:每逢周末,连锁超市里的尿片和啤酒的销量总是很大。他们的工作人员调查的结果是:周末,美国有孩子的家庭中,
- 刘希乐
- 关键词:语言学俯仰连锁超市沃尔玛
- 从统计语言学视角看刘亮程的生命焦虑——由《寒风吹彻》谈起
- 2014年
- 当前,对文学作品的分析大多从思想主旨、艺术手法的角度展开,而从“统计语言学”视角进行分析的较少。统计语言学大致可分为语音统计学、词汇统计学、语法统计学和语义统计学,分别研究语言的语音、词汇、语法和语义的统计特征。本文拟从“统计语言学”视角,从词汇和语法两个层面,从刘亮程的散文名篇《寒风吹彻》人手,进行数字列表解读,并适当拓展比较,以期窥视其语言形式背后的“生命焦虑”。
- 刘希乐
- 关键词:《寒风吹彻》生命焦虑语言学思想主旨艺术手法
- 基于统计语言学模型的中文文本信息检索
- 该文从文本检索模型的基本原理入手,分析了几种传统IR模型的优缺点,给出基于统计语言模型的IR模型的基本原理、关键技术以及它的优势所在.并在标准的TREC中文实验数据集上,回答了下面两个问题:(1)中文统计语言模型-IR模...
- 王志勇
- 关键词:统计语言模型中文信息检索
- 统计语言学
- 1985年
- 应用数理统计、概率论和信息论等统计数学的方法来研究语言现象的语言学科,叫统计语言学,它是数理语言学的一个分支。统计语言学的研究领域,目前主要包括以下几个方面: 1.统计语言单位(如音素、字母、词素或词)的出现频率。早在十九世纪末期,为了语言教学的需要,学者们就开始进行语言词汇频率的统计研究。此后,又进行了音位、语素频率的统计研究。2、计算作家的语言风格。
- F.Z.W
- 关键词:统计语言学数理语言学语言学科语言词汇计算语言语言单位
- 《桃花扇》极度程度副词计量研究
- 2021年
- 本研究对《桃花扇》中的极度程度副词“最”“极”“至”“绝”进行逐个考察,采用定量与定性相结合的方法,对其来源、使用频率、组合能力、句法功能、适用句式等进行统计并分析,试图系统、客观地梳理出《桃花扇》中极度程度副词在用法、分布上所呈现出的特征。
- 何萌
- 关键词:《桃花扇》程度副词统计语言学近代汉语
- 统计语言模型内在机制及应用
- 要实现计算机对语言的处理,就必须采用数学的或逻辑的方法对自然语言进行精确描述和刻画,以便用计算机自动处理。统计语言模型是应用概率论与数理统计的知识和方法,试图刻画、记录并使用自然语言中存在的规律。本书对朴素贝叶斯、隐马尔...
- 于江德
- 关键词:文字处理统计语言学
相关作者
- 任创业

- 作品数:3被引量:5H指数:1
- 供职机构:宁夏广播电视大学
- 研究主题:物元分析 关联函数 可拓学 可拓集合 课堂教学
- 杨福义

- 作品数:8被引量:10H指数:2
- 供职机构:鞍山师范学院
- 研究主题:复杂网络 统计语言学 构词 矩阵 粒计算
- 钱军

- 作品数:33被引量:80H指数:6
- 供职机构:北京大学
- 研究主题:答疑解惑 布拉格学派 柯布 编者按 新语法学派
- 李新力

- 作品数:2被引量:2H指数:1
- 供职机构:宁夏广播电视大学
- 研究主题:《经济数学基础》 心理学 微积分 知识网 知识链
- 欧阳正清

- 作品数:3被引量:3H指数:1
- 供职机构:北京大学
- 研究主题:SARS冠状病毒 SARS 冠状病毒 进化距离 进化