搜索到2292篇“ 词性标注“的相关文章
词性标注方法、装置及计算机可读存储介质
本公开涉及一种词性标注方法、装置及计算机可读存储介质,所述方法包括:获取多语言文本中的各个分词对应的标准词向量,所述标准词向量为分词在目标向量空间下的词向量;通过词性标注模型获得每一所述分词的词性标注结果,其中,所述词性...
胡羽蓝史亮郭元凯孟二利王斌王颖哲王铄
一种基于词性标注的细粒度信息抽取方法与系统
本发明一种基于词性标注的细粒度信息抽取方法与系统,所述方法包括:预先存储的典型例句的编码和信息抽取策略;将待分析的语句进行短语级别的分词并对短语进行词性标注;对邻接的短语按照编码策略进行合并、隐藏;根据S标注出的词性和句...
肖志勇刘起东翟燕申昕李华原杨
基于词性标注和子字符增强的电力领域专家画像标签抽取方法及装置
本发明公开了基于词性标注技术和子字符增强的电力领域专家画像标签抽取方法及装置,对原始数据进行去重和缺失值处理后获取清洗后的样本集;对样本集进行聚类并对聚类结果进行标注;利用Jieba进行分词和词性标注,将词和词性结合形成...
李翔宋珂朱全银金圣华张永军任珂王留洋吴林燕韩金婷吴丁鹏汤夏磊罗林雨赵叙扬
词性标注模型生成方法和装置
本申请公开了词性标注模型生成方法和装置。该方法的一具体实施方式包括:利用用于生成词语对应的词向量的神经网络生成用于训练的语句中的每一个词语对应的词向量;基于生成的所述语句中的每一个词语对应的词向量,基于预测出的所述语句中...
卞衍尧
词性标注方法、装置、电子设备及存储介质
本申请实施例公开了一种词性标注方法、装置、电子设备及存储介质,应用于自然语言处理技术领域。其中方法包括:获取待标注文本中的未划分文本和切片集合,该切片集合包括待标注文本中已划分的k‑1个切片,未划分文本为待标注文本中除k...
李扬名
基于词性标注的启发式在线日志解析方法被引量:2
2024年
为了解决现有启发式日志解析方法中日志特征表示区分能力不足导致解析精度低、泛化差的问题,提出了一种启发式在线日志解析方法PosParser。该方法使用来源于触发词概念的功能词序列作为特征表示,包含解决复杂日志易过度解析问题的两阶段检测方法和处理变长参数日志的后处理流程。PosParser在16个真实日志数据集上取得了0.952的平均解析准确率,证明了功能词序列具有良好区分性、PosParser有良好的解析效果和鲁棒性。
蒋金钊傅媛媛徐建
关键词:日志分析词性标注系统运维
一种藏文分词与词性标注一体化方法及系统
本发明提出了一种藏文分词与词性标注一体化方法及系统,涉及电子信息领域。本发明提供的方法,通过获取用户输入藏文文本信息,调用一体化模型并切分藏文音节以及非藏文字符块,进行CRF预测,得到最优的标签预测,根据标签预测的结果整...
拥措 尹宗鹤尼玛扎西 拉毛杰 万玛才旦
基于词性标注的图像多样化描述可控生成方法
本发明提供了一种基于词性标注的图像多样化描述可控生成方法,包括训练阶段和测试阶段,采用两阶段的训练方式,第一阶段首先对多样化词性标注序列生成模型进行训练,第二阶段对可控描述生成模型进行训练。采用这种分阶段的训练方式,保证...
刘兵刘明明徐静
领域大语言模型下的古籍词性标注应用研究被引量:4
2024年
[目的/意义]大语言模型的发展为古籍文本挖掘带来了新的思路,将大语言模型与古籍数字化、智能化相结合是新时代古籍工作的必经之路。[方法/过程]文章使用《左传》词性标注语料,通过数据清洗和预处理,构建了一批高质量的词性标注指令数据,在此基础上,分别使用500、1 000、2 000、5 000条数据对大语言模型进行指令微调,并在另外1 000条数据上进行性能测试。[结果/结论]实验结果表明,“荀子”系列模型在古籍文本词性标注任务上性能优于通用领域模型,在微调数据量达到5 000时,Xunzi-Baichuan2-7B模型表现出了最优性能,F1值达到81.67%。
朱丹浩赵志枭胡蝶赵文华孙光耀王东波
关键词:《左传》词性标注
一种基于词性标注判断英语语法的应用研究
2024年
文章通过运用Part-Of-Speech Tagging词性标注工具,使计算机能够对未知英语句子的语法错误、句法错误等浅层词性特征信息进行评判。同时,通过建立词性错误特征数据库来提高计算机对英语句子的判断准确性,从而将其应用于现实教学研究。
罗军平
关键词:词性标注英语语法

相关作者

余正涛
作品数:890被引量:1,254H指数:15
供职机构:昆明理工大学
研究主题:自然语言处理技术 越南语 机器翻译 语料 跨语言
线岩团
作品数:222被引量:243H指数:8
供职机构:昆明理工大学
研究主题:越南语 自然语言处理技术 文本 新闻文本 语料
时金桥
作品数:129被引量:173H指数:9
供职机构:中国科学院信息工程研究所
研究主题:匿名通信 词性标注 分词 词性 文档
柳厅文
作品数:75被引量:121H指数:5
供职机构:中国科学院信息工程研究所
研究主题:词性标注 分词 正则表达式 相似度 文本
李全刚
作品数:51被引量:22H指数:3
供职机构:中国科学院信息工程研究所
研究主题:词性标注 通信网络 分词 相似度 候选