fjrigjwwe9r0t_Template:TContent
云章科技-出版行业信息化建设最好的合作伙伴-我国出版业信息化建设综述
 
云因公司与平章公司强强整合 全面推进出版行业信息化建设
 
 
 
 
  新闻中心   
 
专家视点 您的位置:网站首页-新闻中心 -专家视点
 云章动态
 行业新闻
 专家视点
 
我国出版业信息化建设综述
作者:黄凯卿 发布时间:2010-01-01 【选择字体:

  1.3 电脑校对技术的发展
  电脑校对是出版社的一项重要的计算机应用项目,它能提高校对速度,减少差错率。目前国内出版部门使用的中英文校对软件主要有中文校对软件“黑马编校2000”、“金山WPS2000”、“工智校对通”等,英文校对软件有“MS WORD 97/2000”、“黑马编校2000(有英文单词校对功能)”等。校对软件比人力校对能力强,而且不存在疲惫与疏忽问题。不过,校对软件在根据上下文意进行差错判断方面就不如人力校对。所以,出版界提倡人脑校对与电脑校对相结合。目前,大多数出版社直接在市场上购买校对软件加以使用,少数技术力量较强的出版社自主开发专业化校对软件(如浙江科学技术出版社开发出 “浙江科学技术出版社校对信息管理系统”)[24]。
  由于汉语的计算机处理起步较晚,而且汉语的处理又比英语困难得多,所以汉语校对系统与英语校对系统很不一样。目前的汉语校对系统大致有三种类型:
  1)同一文本两人分别录入,计算机逐字比对的方法。这种校对方法准确性高,但时效性不强,录入工作量大了一倍,且无法查出原稿中的错误,故一般较少用这种方法。
  2)语言校对方法。先由语音合成系统读出录入的文句,再由录入员或校对员对照原稿进行检查。这种方法能查出录入稿和原稿的异同,减轻校对的工作量,但不能发现同音异体错字,也没有错误提示功能,还查不出原稿中的错误。
  3)采用计算机语言学原理核查录入错误的方法。先建一个输有大批语言材料的词语库,统计并建立词语搭配关系表、语法规则库、相关知识库、资料库等作为校对的依据。校对时先用词语库对校对文稿进行分析,再利用各种表、规则、知识库、资料库将文稿中被怀疑有错之处在显示器上标出供人们判断,并且给出修改建议,提供修改手段。
  很明显,第三种方法是目前最好的校对方法。它能查出作者原稿中的错误、同音字错误、近形字错误、多字、漏字、各种录入误码错误等,还为作者、校对人员、编辑人员提供了许多辅助功能。市售的“工智校对通”、“黑马”、“方正”、“文捷”、“三欧”、“北成”等校对软件都属这类。不过,目前各种校对软件都查不出语义错误,知识性错误、事实性错误、某些单句语法错误和篇章语法错误、大多数标点错误,有时还存在误判问题[15]。
  2 数据输入技术产品的信息化建设
  目前我国的键盘编码汉字输入方法已经比较成熟。近几年一直受到广泛关注的信息非键盘输入技术是1997年正式提出来的,它是指在常规键盘输入技术之外的手写识别、印刷文稿光学字符识别(OCR)以及语音识别技术。非键盘输入领域目前有北京汉王、IBM、清华紫光、Motorola、Microsoft、清华文通、香港金山、Intel、北京大恒、台湾蒙恬等多家公司在互相竞争。经过20多年的研究和发展,中文连续语音识别技术的实用产品已经问世,印刷体汉字OCR技术已相当成熟,手写汉字的OCR技术也有很大的进步,文字信息输入市场已经进入键盘、手写、语音和扫描的混合竞争时代。其中清华文通的手写技术,汉王和清华紫光的汉字OCR技术和产品,IBM的汉语普通话连续语音识别输入技术和ViaVoice语音识别产品,都是主导市场的技术与产品。Microsoft公司也宣布成立Microsoft中国研究院,主攻语音识别、图像技术、自然语言和多媒体输入技术的研究与开发。Intel公司虽然没有推出自己的语音识别技术产品,但却提供了包括信号处理库、识别库、图像处理库和数字核心库等高性能语音函数库,为使计算机具有说话能力打下坚实的基础[14] 。
  2.1 手写板和手写笔输入技术与设备
  手写板和手写笔大多配套使用,所以两者常相互指称。目前有三种手写板:电阻式压力板、电磁式感应板和电容式触控板。电阻式压力板由一层可变形电阻薄膜和一层固定电阻薄膜构成,中间由空气相隔离。当笔或手指书写时对上层电阻加压使之变形而与下层电阻接触,使下层电阻薄膜感应出笔或手指的位置。其原理简单,成本低,价格便宜,但对手指感触不灵敏,使用时压力大小较难掌握,且感应材料使用寿命较短,故已很少采用。目前国内流行的手写输入产品(如汉王笔、紫光笔、大恒笔等)大多是电磁式感应板。当手写板下方的布线电路通电之后,即可在一定空间范围形成电磁场,来感应带线圈的笔尖的书写工作。其性能良好,书写流畅,能感应笔画的粗细,着色的浓淡;不过它对供电有专门的要求,否则电磁板工作就不稳定甚至不能工作;此外它的手写笔笔尖的使用寿命较短,也不能用手指直接书写。针对前两种手写板的缺陷,诞生了智能电容式触控手写板,它通过人体电容来感知手指的位置。当手指接触到触控板的瞬间,板的表面会产生电容;触控板表面附着的传感矩阵与一块特殊芯片一起持续跟踪人的手指电容的“轨迹”,再经过仪器的内部处理,就能精确定位手指的位置(X、Y坐标),并测出手指与板间的距离(压力大小)形成的电容值(确定Z坐标)。这种触感笔无须电源,性能良好,用手指和笔都能操作,使用寿命可达30年,特别适合便携式产品。手写笔是手写输入系统中的一种,早期输入笔的尾部带有一根与手写板相连的电缆,也称有线笔。较先进的输入笔在笔壳内装有电池,或者借助技术而不需任何电源,也称为无线笔。它携带使用方便,故障较少,笔上有两或三个类似鼠标一样的按键,使其能同时发挥手写笔和鼠标的作用[27]。
  2.2 语音输入技术与设备
  语音输入技术最受广大用户的欢迎。我国语音识别技术的研究始于20世纪50年代初的中国社会科学院语言研究所对汉语各种发音的研究。1958年,中科院电子学研究所用电子管做成的带通滤波器只能识别十几个发音,1972年开始利用电子计算机进行语音识别研究,并于1978年研制出国内第一个可识别200多条语音命令的实时语音识别系统。20世纪80年代后,计算机应用逐渐普及,数字信号处理技术进一步得到发展,国内许多单位都具备了研究语音技术的基本条件。与此同时,国外也重新开展语音识别技术的研究并迅速取得进展。这时,中科院声学所和自动化所、清华大学、北方交通大学等进入该研究领域,我国863智能计算机专家组还为语音识别技术专门设立了题为“英汉自然语言翻译系统”(包括汉语语音识别、汉英文本翻译和英语语音合成三部分)的首期科研项目,第二期单独为语音识别研究立项。不仅如此,国家863智能计算机专家组和中国自动化学会、中国计算机学会、中国电子学会、中国声学学会、中国中文信息学会、中国通信学会6个学会的有关机构每年都要召开全国人机语音通信学术会议。1991年以来,每1~2年他们就举办一次全国语音识别系统的评测,并为评测建立了专门的语音数据库。目前,我国语音识别技术的研究已取得令人瞩目的成绩,其基础研究涉及汉语语音学、听觉模型、人工神经网络、小波变换理论和分数维方法等,在识别模型和算法方面取得了下列成果:描述语音过程最好模型的HMM算法;神经网语音识别模型;神经网模型与HMM模型的结合;DTW算法及VQ算法研究;模糊识别方法的应用等。1995年我国首次研制出非特定人、连续语音汉字听写机,1998年测试时汉字正确识别率达到94%。目前,我国语音识别研究已进入大词汇量、非特定人、连续语音识别的高级阶段[26]。不过,目前世界上汉语普通话连续语音识别技术与设备市场的主导技术与产品都是美国IBM公司的ViaVoice技术与产品,我国语音识别装置的核心部件也是采用IBM公司的产品。
上一页 [ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] 下一页
关于云章 | 常见问题 | 资料下载 | 联系我们
版权所有©北京云章科技有限公司

编号: 京ICP备15007995号-4
京公网安备11010802030842
  地址:北京市海淀区苏州街18号院长远天地大厦A1座601、B2座1110
电话:13601051627   15910670880  
邮箱: mail@pzcp.com