您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > TRS内容管理介绍.
内容管理深化电力行业信息化北京拓尔思信息技术有限公司陈明主要内容内容管理与电力行业资源整合与搜索服务网站和门户建设第一部分:内容管理从数据管理到内容管理曾把信息管理定义为数据管理(DM)和内容管理(CM)两部分的集成“对计算机应用来讲,计算机系统从数据管理发展到内容管理是一大进步,因为它体现了更好的人文精神和更好、更高的一种工作效率。”内容管理的概念内容管理的概念内容生命周期内容管理的应用环境网络环境互联网、内网行业政府、媒体、企业、教育科研应用网站管理、资源整合、发布搜索、知识管理内容管理的几个方面采集、创建:资源整合存储服务标准化内容的来源、采集和创建采集,整合各种现有资源网络历史数据库分散文件其他业务系统人的参与人工的采集、标引加工内容的存储(与关系数据库的共存)内容的特点结构:元数据+对象数据大规模,要求低成本综合成本,包括数据库的硬件运行环境、管理成本等等数据库功能特点:淡化关系运算强调索引和查询加强语言处理分布式和组织结构适应全文数据库SybaseOracleMSSQLServer关系数据库内容服务直接面向人的服务服务内容:数据的挖掘服务形式:服务的个性化•个性化Portal数据的价值体现理解人的需要服务方式:推送内容管理的标准化元数据的标准化行业标准国家标准数据对象格式文件、图片、音视频数据封装XML框架:XinhuaML、CNML、NewsML、资源描述:RDF、METSTRS内容管理的情况2000年首先在国内发布《内容管理白皮书》专注创新,历时六年的发展产品情况全线内容管理软件产品“实现对异构环境下以各类非结构化和半结构化数据为主的内容的全面管理,提供内容采集、创建、加工、存储、传递、组织、服务和反馈等内容全生命周期过程中所需各项功能,以及元数据管理、智能检索和分析、数字版权和内容安全等专项技术,使内容得到高效利用和增值,给内容所有者和消费者带来效益。”内容服务平台内容采集创建网络信息采集信息采集网关多媒体采集数据交换接口内部创作接口电子文档处理内容管理数据存储结构化数据对象数据非结构化数据内容挖掘与知识管理服务自动分类自动摘要自动聚类查重与相似性分析过滤与知识提取本地内容管理本地应用集成本地内容采集本地内容编辑跨媒体发布个性化服务版权保护内容评估站点管理电子商务个人内容桌面内容协作平台内容编审监控统计用户管理工作流引擎协同工作沟通TRS内容管理架构内容采集ContentCapture内容存储ContentRepository内容挖掘ContentMining内容加工ContentProcessing内容服务ContentServicesTRS内容管理主流产品内容服务平台内容采集创建网络信息采集信息采集网关多媒体采集数据交换接口内部创作接口电子文档处理内容管理数据存储结构化数据对象数据非结构化数据内容挖掘与知识管理服务自动分类自动摘要自动聚类查重与相似性分析过滤与知识提取本地内容管理本地应用集成本地内容采集本地内容编辑跨媒体发布个性化服务版权保护内容评估站点管理电子商务个人内容桌面内容协作平台内容编审监控统计用户管理工作流引擎协同工作沟通TRSINFORADARTRSGATEWAYTRSAPITRSDPTRSCKMTRSDBSERVERTRSCDSTRSWCMTRS内容管理产品的发展和延伸论坛系统(TRSBBS)Portal统一身份管理和单点登录(TRSIDS)Web2.0博客系统、播客、wikiTRS内容管理市场情况2000多家企业级用户TRS公司的市场份额销售规模超过主要竞争对手之和•Autonomy,Baidu企业软件,Verity,Interwoven等高端用户市场•国家部委、省市信息中心、高端媒体TRS客户近千家权威政府机构,80%以上的部委和省市信息中心采用TRS产品。国家发改委、国务院办公厅、国家门户、外交部、商务部等数百家媒体和新闻网站采用TRS,市场占有率50%以上新华社、人民日报、中央电视台、新华网、人民网、cctv.com,北京日报,文汇新民报业集团、南方报业集团、深圳报业集团等超过300家图书馆、科研机构和大学采用TRS产品。国家图书馆、上海图书馆、浙江图书馆等一批大型企业用户中石化、中石油、中国银行、上海宝钢、中国网通等在香港、日本等发展了一批客户香港政府、日本佳能、日本索尼、香港华润、星岛日报等TRS内容管理电力行业应用成果国家电网公司国家电网公司办公网国电信息中心资讯网国家电力信息网国电查新网国家电网公司信息报送系统电力研究院东北、天津、河北、河南、内蒙、浙江、福建、安徽国网北京电力建设研究院国网北京经济技术研究院电力公司黑龙江、吉林、华能集团TRS内容管理在电力行业的发展搜索服务垂直搜索和企业搜索网站建设网站门户和内部知识管理——数据的结构化和非结构化第二部分:垂直搜索和企业搜索(搜库)结构化数据非结构化数据相互转换(互联网)搜索引擎搜索引擎企业搜索垂直搜索搜索引擎目前只实现了一般性搜索需求数目/范围(40亿?80亿?)深度类型(网页,博客,论坛…)可搜索的属性(内容,时间,作者,来源,元数据……)排序方式(以pagerank为主的固定的排序算法)搜索无止境——需求的多样化互联网数据内容的复杂性:海量、动态、非结构化关注垂直搜索Google等搜索引擎代表了综合性搜索的成功。Web的海洋中有无数的资源值得挖掘。2.1垂直搜索垂直搜索垂直搜索的应用站内搜索网站群搜索行业搜索(搜房网、酷讯、IT168等都是面向行业应用的垂直搜索引擎)经济/财经、论坛、博客垂直搜索作用实时性更好深度采集分类更细致、准确更加满足特定用户群(专业)的搜索需求搜索引擎和垂直搜索比较网页采集技术网页解析技术索引和检索技术智能化处理网页采集技术按需控制采集目标按需支持深度采集按需支持动态网页采集各种采用脚本(script)动态生成的网页,其复杂性不是因为script本身,而是由于动态发布在逻辑上带来的混乱甚至陷阱,比如“打印此页”、“推荐”、“评论”、“收藏”…网页解析技术按需支持网页内容以及属性的解析按需支持网页元数据的提取比较项目标题、正文解析时间、来源、作者解析其它元数据解析互联网搜索支持不提供不提供垂直搜索支持按需按需索引和检索技术比较项目精确检索结果缓存结果排序互联网搜索否是单一、固定垂直搜索按需按需多样化支持全文检索按需提供精确检索或非精确检索按需提供多种结果排序方式按需支持结构化和非结构化数据集成检索智能化处理技术搜索引擎智能化处理技术的合理运用可提高搜索引擎的服务质量。技术上尚未完全成熟。垂直搜索由于一般有行业背景支持,可能更好地运用智能化处理技术按需提供支持功能,比如自动分类、自动聚类、自动标引、自动排重等垂直搜索本质:网络数据的结构化处理采集分析检索智能化TRS相关技术和产品网页采集技术网页解析技术索引和检索技术智能化处理技术网页采集技术支持用户自定义范围的信息采集支持深度采集内嵌基于网页内容的排重技术确保信息采集的完整性支持多语言网页的采集和自动转码(比如同一转换为UTF-8编码)网页解析技术利用网页结构分析的方法,剔除垃圾信息,获得正文内容,以及相关图片、表格的信息实现了基于模板的内容解析技术:利用链接模板,可以限定采集网页的区域;利用内容模板,可以限定正文获取的区域。实现了基于模板的BBS内容解析技术:利用模板提取BBS贴子中的标题、作者、发贴时间、发贴内容等。贴子标题贴子时间发贴人贴子内容同一主题的跟贴索引和检索技术最优秀的中文全文检索功能——TRSDatabaseServer提供企业级应用的精确检索功能提供多种结果排序方式全文检索与数据库技术完美结合,支持结构化和非结构化数据集成检索支持多语言检索智能化处理技术TRS文本挖掘工具集自动分类自动聚类自动标引(自动抽取关键词、摘要)自动排重褒贬倾向分析TRS搜索引擎支持产品全文检索服务器(TRSServer)全文检索服务器集群(TRSCluster)TRS网络信息雷达TRS论坛采集工具TRS站内检索/网站群检索TRS搜索引擎解决方案TRSCKM(智能化处理)TRS垂直搜索成功案例中央政府网站搜索引擎某部搜索引擎(专网搜索)某国际电子巨擎的行业情报服务众多网站的站内搜索系统千里眼经济情报预警系统2.2企业搜索和搜库应用企业搜索引擎互联网搜索引擎企业级搜索引擎异构资源搜索和整合互联网通信协议企业环境下各种信息采集接口以HTTP传输协议为主获得的HTML和特殊格式文档(DOC、PPT、PDF、MP3、图片等)HTML/XML(HTTP)RDBMS(API/SQL)文件系统(NFS、FTP)Office/LotusOA/InstantCommunicationEnterpriseApplication……数据实时更新更新周期长,静态缓存的索引,周期切换企业信息更新需要即时反映动态更新索引,保证数据一致性准确性相关性不可能查全相关重要性排序以PageRank、Title、Meta为主面临SEO问题和商业性因素更全面精确计算,字、词混合索引;复合元数据查询(结构化特征)更准确、排序更合理安全性公开信息,不存在安全问题访问权限控制非常重要管理、挖掘和应用找到信息后服务完成需要完备整合和管理智能挖掘分析(各种分类、聚类、提取手段)安全开放接口支持其他应用系统面向企业需求,个性化服务TRS企业搜索平台和应用搜库实现对多个数据库进行搜索式查询1.数据合并,通过关系数据库机视图和网关进行2.在TRS数据库的多表联合查询搜库应用主要案例第三部分:网站门户建设网站管理技术的发展历程完全手工页面小规模软件程序发布,动态发布平台化、智能化的网站发布平台上升到内容管理层次模板技术工作流技术编辑器技术网站群技术TR5WCM内容协作平台TRSWCM5.2主要技术特点1-高效管理各种异构内容可接收和管理各种异构内容1.网页(直接采集和自动抓取)2.Word(Word插件抽取)3.RSS(RSS接受器自动抓取)4.Blog(Blog抓取工具自动)5.其它业务数据(定制各种接收Service)TRSWCM5.2主要技术特点2可视化编辑工具TRSWCM5.2主要技术特点3——快速部署、即开即用,提高工作效率自动安装和部署向导式的自动安装,使用于Windows和Unix操作系统主流应用服务器(Websphere/Weblogic)提供自动部署,减少了部署成本和维护成本用户访问通过浏览器使用WCM,无需安装其它客户端软件TRSWCM5.2遵循工作导向设计(Task-Oriented)的原则,定制了适合不同操作、不同角色的界面风格系统的主界面支持自定义,不同的用户体现出不同的关注点系统采用多种视图组织用户操作平台,便于不同角色的用户更快速进行自己的工作个人首页——我的工作台集成了个性化定制的常用操作和最近访问的内容在线编辑的工作流,直观简单的配置界面。在Web上制定工作流程,配置工作节点以及人员,决定流程路径的操作。可以结合邮件、在线即时信息,手机短信等协助提醒。支持串行、条件工作流结合了版本控制、权限控制,可以提供有效的内容安全保护流转情况实时掌握TRSWCM5.2主要技术特点4—以工作流引擎为驱动的内容协作TRSWCM5.2主要技术特点5——内容多站点、多渠道发布针对操作对象提供个性的、多种发布策略完全发布、快速发布、高级发布、更新发布、独立发布、计划发布、撤销发布、定时发布支持多渠道信息发布用户主动访问•Web•移动终端设备系统主动推送•Mail•短信•RSS订阅提供发布监控直接输出XML格式页面模板编辑置标向导设定最终生成的页面为HTML、SHTML、ASP、JSP等模
本文标题:TRS内容管理介绍.
链接地址:https://www.777doc.com/doc-2863754 .html