網際網路的發達讓各式各樣網站與網域名稱越來越多,身處在以英文為強勢語言的網路世界,民眾需要使用並記憶不熟悉的英文網址,導致順利拜訪目標網站的成功機率普遍不高;而利用瀏覽器鍵入相關字的搜尋網站方式,不但準確度不盡理想,亦耗費更多的時間成本。
有鑑於此,台灣網路資訊中心(以下簡稱TWNIC)於2003年11月宣布「國際標準中文域名註冊與解析服務」正式在台上線。以提升政府e化服務品質為例,今年四月協助財政部推出方便好記的報稅網站中文網址「http://網路報稅.tw」,減少全省民眾從事網路報稅時記憶長串英文網址以及使用上的不便。而泛用型中文域名迄今亦達兩萬多筆註冊量,許多知名企業例如智冠科技(http://智冠.tw)、雄獅旅遊(http://雄獅旅遊.tw)、天下集團(http://天下.tw)等都已加入中文域名行列。
中文域名的演進
國際化域名
國際化域名(Internationalized Domain Name,IDN)的發展一直是全球網民超級關心的議題之一。由於全球80%以上的網民來自非英語系的國家,多年來IDN標準的差異,造成上百萬個IDN網址存在著許多互通性與相容性的問題。長期致力於IDN標準的發展與研究的IETF (Internet Engineering Task Force)為解決這些困擾,於去年(2003年)三月份已完成技術標準的制訂工作。
另外,在亞洲方面,針對用戶的使用習性與語言文字的共通性,分別有中、日、韓文語言專家及技術專家組成之JET (Joint Engineering Team),與針對中文域名技術的「中文域名協調聯合會」(Chinese Domain Name Consortium)等組織,依據各地語言特性,順利訂定相關網址註冊技術、註冊政策、對照字表、以及IDN軟體開發工作等。
泛用型中文域名
泛用型中文網域名稱,係指直接開放申請第二層之中文網域名稱(如:中文.tw),不論企業、組織、個人皆可申請。TWNIC除了推出符合IDN標準之中文域名註冊及解析服務(包含註冊字原型、一筆繁體域名與一筆簡體域名的解析),亦推出支援IDN標準之中文域名解析Client下載程式「中文通」、PUNYCODE轉碼工具以及協助客戶設定DNS或是Web之相關工具等,目的是協助使用者順利設定及應用中文域名。無論您在世界任一角落,只要有一台中文環境之電腦上網,皆可以在全球各地使用中文網域名稱拜訪網站。例如,只要下載「中文通」軟體,在網址列輸入「http://台網中心.tw/」或「台網中心」皆可成功連結至台灣網路資訊中心首頁。
身為域名註冊管理機構,TWNIC自2001年5月起即因應國際域名競爭情勢,先期提供泛用型中文域名註冊服務,並於2001年7月起提供好幫手下載軟體。但因為當時國際技術標準尚未確立,導致中文域名註冊及使用人數較少。IETF在2003年三月份發布IDN標準後, TWNIC除積極提升技術層面準備外,並重視保障註冊人權益,事先避免域名爭議。例如確保「台灣大學.tw」與「臺灣大學.tw」得到相同解析網站,避免被不同人註冊而產生爭議。
此外,Unicode中文字集同一字碼區因為繁、簡體混雜,需要繁簡對照及相關字表,在邀請專家進行密集比對與整理之後,制訂「域名專用繁簡對照表」,作為新一代中文域名註冊作業的依據。經TWNIC網域名稱服務委員會通過後,在2003年11月正式推出符合國際標準的全新泛用型中文域名註冊及解析服務,在第一階段完成註冊者也依最新標準及字表轉換完成。
現今TWNIC推出因應最新IDN國際認可技術標準(詳如 http://中文.tw)之「第二代泛用型中文網域名稱」,與TISNet、亞太線上、中華電信、網路中文、網路家庭、SeedNet及台灣電訊七家.tw受理註冊機構,共同提供全新中文域名註冊與解析服務,在申請中文域名時,TWNIC同時提供一筆繁體域名與一筆簡體域名對照字。
中文域名如何產生
當註冊人註冊一筆中文域名(「原形域名」),註冊系統參照「 中文域名字碼對照表」,查詢產生一筆「繁體對照域名」、「簡體對照域名」,「原形域名」、「繁體對照域名」、「簡體對照域名」這三筆域名之 PUNYCODE 將被設定在DNS zone file,也就是說這三筆域名因此是可以被DNS直接解析的。
TWNIC也提供以「相關字」組成「相關字域名組合」的輔助解析服務,避免「相關域名組合」後續被他人註冊。輔助解析服務是利用TWNIC提供之輔助解析技術架構與方法,讓使用者可以用任何一個「相關字域名」來解析到「原形域名」。例如: 當輸入的中文域名不在「相關字域名」的範圍內,則顯示沒有解析成功的相關訊息給使用者,畫面如下:
若使用者沒有安裝「中文通」,而輸入的中文域名在「相關字域名」的範圍內,則先提醒使用者安裝「中文通」,並顯示出「相關字域名」的「原形域名」、「繁體對照域名」、「簡體對照域名」這三筆域名來讓使用者選擇。
《圖三 輸入『中文.tw』或『中文』皆可的易連功能》 |
|
IDN協定標準簡介
@內文經過IDN Working Group耗時3年多的討論,IETF終於在2003年3月發布IDN標準協定IDNA-NAMEPREP-PUNYCODE,與另一篇較早發布的相關標準RFC STRINPREP,成為國際化域名的技術標準。
IDNA-NAMEPREP-PUNYCODE對IDN的處理
IDNA主要是定義IDN協定以及和原DNS協定之間的關係與架構。包括在解析IDN時,將IDN從輸入、NAMEPREP處理、PUNYCODE處理、輸出IDN的PUNYCODE編碼到DNS協定,在這過程之間所需的各種先期處理以及之間的搭配關係。
NAMEPREP包括Mapping、Normalization、Prohibition三大處理程序,主要是儘可能將IDN經過對照(Mapping)、正規化(Normalization)、禁止檢查(Prohibition)的處理後,得到一個符合標準IDN規格的形式。
PUNYCODE則是將一個經過NAMEPREP處理過之IDN,從一個8位元的編碼形式轉換為7位元編碼的形式。目前Internet DNS一向是7位元ASCII編碼的環境,經過這個PUNYCODE轉碼程序,便將IDN從一個8 位元的IDN轉換為與現有DNS環境相容的編碼。
IDN標準化後之新興域名服務
日本JPRS在IDN標準發布後,立刻宣佈提供符合IDN標準之日文域名註冊服務,並預設一段過渡期,讓原有以RACE編碼設定的日文域名順利轉換為符合IDN標準之PUNYCODE,後續並推出協助Internet使用者將IDN轉為PUNYCODE的client下載程式。
TWNIC也在積極研擬後提供新的符合IDN標準的「第二代泛用型中文網域名稱」註冊及解析服務,以最順利的方式,協助Internet使用者過渡到IDN標準之中文域名服務,得到DNS正確的解析結果。
未來的IDN標準環境
除了各NIC提供新的註冊及解析服務以符合IDN標準之外,Internet DNS環境若要全面提升為IDN標準,須由所有DNS、Web Server管理者配合,將現有的IDN以PUNYCODE來設定才能完成。預期未來作業系統或應用程式廠商亦將提供內定支援IDNA-NAMEPREP-PUNYCODE之IDN標準環境,屆時使用者可不需下載client軟體即可訪問到IDN。
JET IDN Admin Guideline
由於IDN標準是技術協定方面的標準,並未包括中文異體字的需求,為避免開放IDN註冊服務之後,引起異體中文域名間註冊的混淆及爭議,目前TWNIC與CNNIC、JPNIC、KRNIC等JET(Joint Engineering Team)成員已積極共同研擬了IDN Administration Guideline。定義了異體字表的Valid Code Point、Preferred Variant、Character Variant三個欄位,以及異體字表應用在IDN域名註冊管理之處理原則。此Guideline在2004年4月由IETF發布為RFC 3743。(Title: Joint Engineering Team (JET) Guidelines for Internationalized Domain Names (IDN) Registration and Administration for Chinese, Japanese, and Korean。)
CDNC CDN Admin Guideline
由於JET IDN Admin Guideline定義的是一般性的基礎原則, 同屬CDNC成員的TWNIC與CNNIC以JET IDN Admin Guideline為基礎,針對中文域名對異體字對應的需求,共同研擬了CDN Admin Guideline: Registration and Administration Guideline for Chinese Domain Names(http://www.ietf.org/internet-drafts/draft-xdlee-idn-cdnadmin-01.txt),提出在JET IDN Admin Guideline定義之異體字表結構下處理中文域名之原則,並將JET IDN Admin Guideline中之optional process作進一步的說明,預定2004年會有更新版本。
第二代中文域名註冊服務
為遵循國際標準、兼顧中文域名異體字對照之需求,TWNIC經審慎研擬提出「第二代中文域名註冊服務」,採用IDN標準技術協定,除了延續現階段中文域名註冊的買繁送簡政策之外,還額外提供了相關異體字組成之相關域名的輔助解析服務,可事先避免相關域名後續被他人註冊。雖然IDN技術標準未包括中文異體字,但TWNIC「第二代中文域名註冊服務」能避免可能引發的異體中文域名混淆及爭議。
IDN標準的影響與衝擊
IETF制定IDN標準過程中希望能儘可能降低對現有DNS環境之影響,而這同時也是所有Internet服務提供者及使用者最關心的問題。其影響範圍大致以DNS伺服器、Web伺服器設定與IDN使用三個方面來說明。
在DNS伺服器方面,IDN須以PUNYCODE的編碼形式來設定。因為PUNYCODE本身就是一種7位元的編碼,與ASCII編碼完全相容,所以適用於前所有可用的DNS版本,不需為了設定PUNYCODE而重新安裝BIND新版本。但若需要使用DNAME指令來設定資源記錄(Resource Record),就必須先提昇為BIND 9的版本。
在IDN使用方面,在作業系統或應用程式廠商尚未完全推出支援IDN標準產品之前,有一些plug-in形式的client下載軟體可協助Internet使用者順利使用IDN。例如,TWNIC配合第二代中文域名註冊服務,同步推出的新版client下載軟體-「中文通」,它將使用者輸入的IDN依照IDN標準作IDNA-NAMEPREP-PUNYCODE處理,再將IDN的PUNYCODE編碼送到DNS解析。
在Web伺服器方面,由於使用者端輸入的IDN都會先轉換為PUNYCODE編碼的形式,再到Web伺服器訪問,所以Web伺服器方面也需要以PUNYCODE編碼來設定,才能被成功地訪問到。
對TWNIC現行中文域名註冊政策之影響
TWNIC自2001年5月起先期提供泛用型中文域名註冊服務,並於2001年7月起提供好幫手下載軟體。在IETF發布IDN標準之際,TWNIC全面提供符合IDN標準之中文域名服務。這可以從中文域名註冊政策與解析架構兩方面說明。
在註冊政策方面,由於現有的TWNIC中文域名註冊政策已經符合NAMMEPREP的處理規則,所以不會因為提升為IDN標準之中文域名而需有所改變,原中文域名註冊者在權益上與新註冊者沒有差別,皆隨TWNIC全面提昇為符合IDN標準之中文域名。
在中文域名解析架構方面,將全面提升為符合IDNA-NAMEPREP-PUNYCODE之IDN標準,在TWNIC管理之DNS轄區,都採用經NAMEPREP處理過的PUNYCODE來設定,而TWNIC的新版client下載軟體(中文通)也是向DNS送出中文域名的PUNYCODE來請求解析,所以能得到DNS正確的解析結果。
IDN未來展望
TWNIC自2003年11月17日推出第二代中文域名註冊服務後一個月的時間,為轉換到IDN標準的過渡時期,因此2003年12月17日起我國即全面提升為IDN標準環境。目前除了TWNIC提供client下載軟體「中文通」之外,CNNIC提供了用戶端軟體(含通用網址),Verisign則提供了I-Nav Plug-in,其他尚有許多各家提供的下載軟體。在browser方面,Netscape、Mozilla、Opera等也已經提供支援IDN標準的版本,預期未來有更多的作業系統或應用程式廠商會提供內定支援IDNA-NAMEPREP-PUNYCODE之IDN標準環境,使用者不需下載client軟體即能訪問中文域名。相信藉由網際網路的平台,全球性企業將有機會提供在地化的網路服務,台灣品牌亦有更大的機會鳴響國際,拓展網際網路華人世界的新商機。
(作者陳玉萱為TWNIC資深工程師;尹蓓婷為TWNIC管理師)