您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 数据通信与网络 > 中文问答系统中的信息检索模型的研究
重庆大学硕士学位论文中文问答系统中的信息检索模型的研究姓名:刘春泳申请学位级别:硕士专业:计算机系统结构指导教师:张玉芳20070420://://://://://://://://://://://中文问答系统中的信息检索模型的研究作者:刘春泳学位授予单位:重庆大学相似文献(10条)1.期刊论文蒋昌金.彭宏.马千里.林正春.王成.JIANGChang-jin.PENGHong.MAQian-li.LINZheng-chun.WANGCheng受限领域中文问答系统问句分析研究-计算机工程与设计2010,31(11)问句分析是问答系统中一个极其重要的部分,它对后续的搜索模块和答案抽取模块有着至关重要的影响.为了提高问句分析模块的性能,对中文问答系统问句分析模块进行研究和分析,在构建领域词典的基础上实现了对问句中命名实体的识别.对问句类型的识别则采用问题类别对照表的方式来实现.在对问句进行分词、词性标注之后,提取出其中的名词,动词、形容词等实词,形成初始查询向量,最后对初始查询向量进行同义词扩展和问句类型关联词扩展.实验结果表明,通过查询向量进行查询比用问句直接查询有着更高的准确率.2.学位论文张亮面向开放域的中文问答系统问句处理相关技术研究2005问答系统是信息检索分支,属于精确检索,是国外信息技术的研究热点,但在国内还处于起步阶段。信息检索是信息社会的重要特征,各种检索引擎对人们帮助很大,但是如何使计算机更好地理解人的检索需求,如何获得精确检索结果,这些目前还处于探索阶段,问答系统正是这个方面的重要研究内容。本文系统地介绍了问答系统的研究内容及现状,对中文问答系统与问句处理相关的关键技术进行了较为深入的分析与探讨,实质性工作和创新点如下:1)研究中文问答系统的理论框架和系统结构,从总体上对问答系统形成一个较为清晰的认识,对其中的研究重点和难点进行具体的分析。2)建立一个小规模的问句句法标注语料库(目前国内在该方面还是空白,没有现成的资源可资利用),在此基础上,研究相应算法,派生出句法截断数据库和句法片段数据库,其中基于截断的片段和片段组合抽取算法具有很高的独创性和实用价值。为高效地建立句法标注语料库,设计研发了一个实用的中文句法编辑与分析辅助系统。3)在标注语料库的基础上,根据中文问句在语法语义上的特性,结合现有的语料库理论和方法,应用句法片段技术和语言学中关于句法截断理论,研究出一套基于DOP(Data-OrientedParsing)的问句句法分析算法,实验表明,与其它句法分析技术相比,准确率有较大提高。4)根据中文问句的结构特征,结合文本分类技术中较为成熟的Bayes计算模型等,对问句的归类进行处理,建立一个准确率较高的中文问句分类算法模型。5)在中文句法标注语料库的基础上,对中文问句句型进行统计分析,研究设计出一个问句句型自动识别和获取算法。6)对中文问答系统中的问句形式化处理、形式化扩展、信息搜索、检索结果的分析与筛选等进行具体的分析,并研究相关的实现算法。7)对问与答之间的关系作了初步的探讨,提出了陈述句派生疑问句的假设,并研究了各种不同的派生情况,讨论了基于ontology的复杂问题分解,初步分析了简单中文句式之间转换的技术方法和关键因素。3.学位论文金砚硕中文问答系统中答案提取的研究2008随着互联网的普及,互联网上的信息越来越多,为人们提供了丰富的信息资源。而另一方面,虽然现在互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎还有很多缺点,并不能满足人们方便、快速、准确的获取信息的需要。自动问答系统技术正是为了满足人们的这种愿望而发展起来的。问答系统允许用户输入一个问句,而返回给用户的是一个简短而准确的答案。这样用户就可以通过问答系统方便、快速、准确地获得自己想要的信息。自动问答技术是自然语言处理领域中一个非常热门的研究方向,它综合运用了各种自然语言处理技术。目前,国内外有很多的科研机构参与了英文自动问答技术的研究,但基本没有成型的中文自动问答系统。本文正是对中文自动问答技术研究的一个探索。本文搭建的中文自动问答系统包括三个主要组成部分:问题理解、信息检索和答案提取。详细介绍问答系统的问题理解、信息检索和答案提取,以及分别对每个部分的详细介绍。并应用隐马尔可夫模型构造了问答系统中的分词程序。研究了问答系统中第三部分答案信息提取的几种方法如基于隐马尔可夫模型,基于最大熵,基于最大熵隐马尔可夫模型等及其各种方法的比较,通过实验说明了,这几种方法在答案提取中的适用性的比较,及对于精确度和召回率的比较。并在最后提出了聚类的HMM抽取方法的聚类算法,应用这种方法与原问答系统中的答案提取的隐马尔可夫模型实验表明做比较。通过实验证明了,这种方法在人名等一些方面比用隐马尔可夫模型的准确率和召回率更高。4.期刊论文钱如栏.董云耀.QIANRu-lan.DONGYun-yao中文问答系统中基于SLM的信息检索及其平滑技术研究-计算机工程与科学2010,31(1)为适应中文问答系统中汉语语言的特点,本文对信息检索模块进行了深入分析,相对于传统的主流信息检索模型,找到了一种更有效的检索方法--基于SLM的语言模型的信息检索技术(SLM-IR).同时,研究了N-gram模型的参数N选取及其几种主要的数据平滑技术,并通过对各种数据平滑方法的实验对比,讨论了影响这些数据平滑方法性能的有关因素,如训练集规模等,最终给出了在不同情况下的最优选择方案.5.学位论文胡长生中文问答系统中问题理解和答案抽取的研究2009问答系统是集自然语言处理技术和信息检索技术于一身的新一代智能搜索引擎。与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案。问答系统包括问题理解、查询扩展、文本检索、答案抽取和答案排序,其中,问题理解和答案抽取最为关键。本论文利用自然语言处理技术,研究中文问答系统中的两个关键技术:问题理解和答案抽取。br 问题理解是中文问答系统的基础,只有在正确地分析和理解问题的基础上,才有可能返回给用户以正确的答案。问题理解的核心内容是问题特征的抽取和问题分类。本文在前人研究的基础上做了如下工作:(1)针对中文问句的特点,对问句的疑问词和疑问意向词进行分析和提取,并利用知网对疑问意向词进行扩展;(2)利用“问句统一型”表示问句的句型,提高系统处理多种表达形式问句的能力;(3)对问句进行语义角色标注,建立问句的语义角色框架,加强系统对中文问句的语义理解;(4)对问题分类器进行分析,提出利用改进的贝叶斯模型作为分类器,并利用实验对不同的问题分类器进行比较,实验结果表明本文的分类器方法优于其他模型。br 答案抽取是问答系统中另一个重要的组成部分,其质量直接影响问答系统的性能。本文先对文本进行指代消解预处理,并提出了一种结合问句的关键词位置、问句长度、问句句型、问句语义角色的句子相似度计算方法,对利用该句子相似度计算方法进行答案的抽取。在实验中,将本文的方法与其他句子相似度进行比较,结果表明本文提出的方法取得了较好的结果。br 最后,针对问题理解和答案抽取阶段采用的方法,实现了一个简单的问答系统作为开放式领域问答系统的实验平台。br6.期刊论文张亮.黄河燕.胡春玲.ZhangLiang.HuangHeyan.HuChunling中文问答系统模型研究-情报学报2006,25(2)问答系统是信息检索的高级形式,也是该领域的研究重点和热点.本文较全面地分析了中文问答系统所涉及的关键技术和知识资源平台,提出了一个完整的中文问答系统处理模型,对系统的运行机制和处理流程作了清晰的描述,最后详细讨论了问答系统中的两个关键算法,即形式化扩展算法和答案抽取算法.7.学位论文陈玉基于事实性问题中文问答系统的研究与实现2006随着网络信息的膨胀,网上大量可用信息对于回答用户的各种问题变成了具有吸引力的资源。基于关键字查询的网络搜索引擎,通常会对用户的提问返回成百上千个文档,而用户为了得到与自己需求相关的信息,通常会花费很多精力来进行手工查找。对比传统的依靠输入关键字进行检索的搜索引擎,问答系统允许用户以自然语言方式输入问句进行检索,同时问答系统会对用户的问题给出一个简洁的回答。简言之,目前常见的搜索引擎(如Google)对于用户的问题查询返回的结果比较冗长,相对而言问答系统被认为是比较有潜力的搜索工具。自60年代人工智能的早期发展中,研究者们就对自然语言问答技术产生了研究的兴趣。不过,当时由于自然语言处理的困难度,问答系统的研究一直被局限在特殊领域的专家系统。近几年,随着Web的发展,再加上信息检索技术及自然语言处理技术的提高,这吸引了很多人去开发问答系统,这种系统能够通过检索Web文档库来回答用户以自然语言方式提出的问题。另外这种问答系统可以回答很多领域方面的问题,再加之网络资源的特点,系统资源和网络资源能够保持同步更新。本问答系统是基于网络的,同时本系统主要是针对一些基于事实的问题,如“中华人民共和国是什么时候诞生的?”,又如“太原到北京的距离是多少?”,这些问题可以用简单的事实(例如:日期、位置、人物、组织及尺寸等)来回答。本文主要由五部分构成,这几部分的内容概括如下:第一,问答系统的研究现状;第二,介绍了问答系统的种类及与问答系统相关的研究技术;第三,对本文研究的问答系统作了总体的概括与介绍;第四,这部分是本文的重点部分,这部分包括三个步骤,(1)用户问题处理,该模块主要是将用户所提的问题转化成一组关键词提交给搜索引擎进行处理。(2)信息检索,主要是系统使用现有的搜索引擎来为其服务。(3)答案抽取,答案抽取模块负责从检索到的文档中提取候选答案;第五,实验部分,主要包括问句集,评价标准及实验结果。总之,本文的研究结果不仅有重要的理论意义,对实际应用也有一定的参考价值。8.学位论文张晓孪中文问答系统中问题理解与信息检索的研究与实现2007问答系统是新一代智能搜索引擎,它允许用户以自然语言提问,并能够向用户返回准确的答案。所以,与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案。本文主要利用自然语言处理技术,研究中文问答系统中的两个关键技术:问题理解和信息检索,并实现了一个汉语问答系统CQAS。问题理解是中文问答系统首先进行的工作,此过程的分析结果对后面的处理有重要的影响。本文在前人研究的基础上做了如下的工作:(1)针对本系统主要处理的是事实类的简单问题,提出了基于启发的疑问词和疑问焦点相结合的问题分类方法;(2)建立问句句型库,对问句进行句型分析,提高了系统处理多种表达形式问句的能力;(3)采用机器学习的方法,以最大熵模型作为分类器,进行问句的语义角色标注,并将问句转化为语义框架结构。信息检索是问答系统中承上启下的一个重要的组成部分,其质量直接影响系统的性能。本文提出了一种两策略的检索方法,包括本地知识库检索和网络检索。利用网络上出现的知识共享平台,构建大规模的真实用户问题知识库,实现本地知识库检索。如果本地
三七文档所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
本文标题:中文问答系统中的信息检索模型的研究
链接地址:https://www.777doc.com/doc-4326533 .html