立法会资讯科技及广播事务委员会
中文界面
引言
本文件向各委员介绍本港发展中文界面的未来路向。
背景
2.当我们把资料存入电脑时,必须根据某种预先设定的编码方案将有关资料予以
编码。就中文资料而言,现时有多种不同的编码方案。香港大部分中文应用系统
均采用「大五码」编码方案。这种编码方案是以繁体字为基础。內地现时采用的
中文编码标准称为「国标码」,是以简体字为基础,在香港未获普遍采用。以上
两种编码方案均已发展改良版本。举例说,「大五码」的改良版本为「大五扩展
码」;而「国标码」亦已发展一个扩充版,称为「国标扩展码」。
3.「大五码」与「国标码」的中文字库规模各有不足。在目前已知的60,000个中
文字当中,「大五码」收纳了其中13,000个左右。「国标码」原来的版本收纳了
6,763个中文字,而「国标扩展码」则收纳了大约20,000个中文字。上述各个编码
方案有一个共通缺点,就是沒有收纳好些在香港常用的中文字。这些未收纳在上
述编码方案的中文字,其中不少是香港自创的,又或源自广东话。为补不足,电
脑使用者惟有自行为这些中文字编配內码,供自己的电脑系统使用。这种做法对
独立运作的电脑而言,并不构成问题,但当这些独立电脑与电脑网络相连时,这
些用者自造的中文字就会在通讯及资料交換时产生问题。
4.目前,以中文进行电子通讯所面对的主要问题,是编码标准不一,而每种编码
标准又只收纳部分已知的中文字。全球华人社会要在资讯时代和数码网络相连的
世界互通讯息,这个问题必须予以解决。
政府制定的措施
5.政府「数码21新纪元」资讯科技策略的其中一项重要工作,就是制定一套开放
和共通的中文界面,方便社会各界选择以中文为通讯媒介的人士,进行电子交易
。
6.为推动政府內部以电子形式通讯,政府已建立一套中文字库(名为「政府通用字
库」),收纳在本港通用但并未纳入「大五码」內的中文字。现时「政府通用字库
」有大约3,000个中文字,大部分属于香港特有的中文字,例如地址及广东话口语
化用字。自一九九五年以来,在推行政府办公室自动化计划时,我们一直采用「
大五码」,辅以「政府通用字库」。我们亦已将「政府通用字库」放置于政府网
站(http://www.info.gov.hk/gccs),让公众人士随意下载,这套字库因而获越来越多
本地用者使用,互联网用戶每月从政府网站下载该套字库的次数高达约5,000次。
现时,资讯科技署与法定语文事务署正合作更新该套字库,以收纳新造的中文字
。
7.此外,电子传媒及资讯服务协会(由出版界大部分主要出版商组成的非牟利组
织)与香港中文大学讯息网络研究所正携手进行「标准香港字库开发计划」。该
项计划的经费来自工业支援资助计划,目的是制定一套适用于业界的标准广东
话用字,供本地出版商使用,及方便以中文进行电子通讯。现时在该计划下,
出版商、厂家、互联网服务供应商及其它有关团体正合作制定一套标准的广东
话用字,供所有出版商免费使用。此外,该计划亦会发展一套电子过滤软件,
让本地出版商可用以将原来根据其本身字库编制的资料,转換为采用电子传媒
及资讯服务协会所订的标准用字。这套标准亦将会透过互联网及唯读光碟的方
式发送,公诸于世。
8.虽然我们已进行上述的各项工作,但我们最终还是要制定一套编码方案,以
求尽量收纳所有的中文用字。在国际标准组织(ISO)的统筹下,我们正与其他政
府和机构合作发展一套名为ISO 10646的国际编码标准,以单一套通用字集收纳
亚洲各种语文的汉字。目前该套标准已收纳20,902个中文字,新的版本将会收纳
约60,000个中文字。我们在国际标准组织的架构下,正积极爭取把香港常用的中
文字纳入该套国际标准之內。在向国际标准组织提出建议的过程中,我们已广泛
咨询本地团体的意见。我们相信,这套新的ISO 10646标准(预计于二零零零年开
始分期推出)公布后,将会成为包罗所有已知编码方案字库的超级字库,并作为各
编码方案间转換及交換资料的基础。目前电脑在处理中文字上所受到的限制,届
时将可获得纾缓。
市民使用公共服务电子化计划
9.我们现正为推行公共服务电子化计划进行筹备工作,以期透过使用开放及共通
界面的资讯基础设施,以电子方式为市民提供公共服务。第一期计划定于二零零
零年下半年內推出。由于中文是香港大部分市民的母语,因此发展中文界面对公
共服务电子化计划能否成功推行,十分重要。我们需要采用一套通用中文字集,
方便政府部门与市民之间互通资料。此外,我们亦须提供简易工具,让市民在透
过该计划处理各类政府事务时,能够以中文作为沟通媒介。
10.由于香港市民主要使用繁体中文字,因此推行公共服务电子化计划初期,我
们会以繁体中文字作为市民使用该计划的界面。故此,我们拟采用「大五码」字
库,辅以「政府通用字库」的最新版本,作为公共服务电子化计划的中文字集,
以作资料交換之用。至于现时政府部门內并非使用「大五码」的电脑系统,则可
利用转換工具与公共服务电子化系统互通资料。
11.我们亦会要求将来的公共服务电子化计划承办商在其所提供的系统装设具备使
用ISO 10646标准的功能。这样可以保持弹性,容许我们于有需要时,以该计划的
基础设施配合同时使用繁体和简体中文用字,并可尽量减少为应付ISO 10646标准
将来的更新版本而需对公共服务电子化计划下的系统作出改动。
中文输入
12.中文输入法可以分为三类:利用键盘输入字形、利用键盘输入字音,及无需
键盘的输入方式。选择采用某种中文输入法属于个人选择,主要是基于该种输入
法的效率和用者是否得使用而定。使用公共服务电子化计划的人士如有自设的
设施例如个人电脑,可以自由选择适合自己的输入法。而我们在公众地方安装让
市民使用公共服务电子化系统的设施时,将会考虑采用下列输入法:
- 利用键盘输入字形:「仓颉」及「简易」两种输入法,属同类输入法
中最常用者;
- 利用键盘输入字音: 汉语拼音及广东话拼音输入法;及
- 无需键盘的输入方式: 采用笔触式输入法或其它定位接触设备。
13.此外,公共服务电子化计划所提供的界面,会让使用该计划的人士于输入姓
名时采用中文商用电码(即显示于身分证上的电码)。由于在公共服务电子化计划
下许多服务均要求使用人士输入姓名,这种输入方式将可方便用者获取有关服
务。
咨询资讯基建咨询委员会
14.我们已征询资讯基建咨询委员会的意见。该委员会支持我们在本文件所建议
有关发展中文界面的路向。
中文界面
15.透过发展「政府通用字库」、为订定ISO 10646国际编码标准提出建议、支
援本地业界和学术机构就中文用字而筹办的活动、及推行公共服务电子化计划
,我们会致力发展一套标准中文字集和一个通用中文界面,以方便利用中文在
香港以內及与世界各地的华人社会进行电子通讯。在建立这个中文界面时所发
展的标准和技术,有助鼓励私营机构发展中文电子贸易的工具和系统。这些发
展可协助香港发展为一个互联网资讯中心。
资讯科技及广播局
一九九九年一月