diff options
author | Chia-liang Kao <clkao@clkao.org> | 2011-06-10 19:31:21 +0800 |
---|---|---|
committer | Leon Brocard <acme@astray.com> | 2011-06-10 14:54:37 +0100 |
commit | d0ce92e704fc0044688d69204915607e1ab65785 (patch) | |
tree | c787876299eef8a4fc3e91d27bba933a79a0df2e /README.tw | |
parent | bb6c6e4b8d10f2e460a7fe48e677d3d998a7f77d (diff) | |
download | perl-d0ce92e704fc0044688d69204915607e1ab65785.tar.gz |
convert README.tw to utf-8
Diffstat (limited to 'README.tw')
-rw-r--r-- | README.tw | 130 |
1 files changed, 65 insertions, 65 deletions
@@ -2,158 +2,158 @@ If you read this file _as_is_, just ignore the funny characters you see. It is written in the POD format (see perlpod manpage) which is specially designed to be readable as is. -The following documentation is written in Big5 encoding. +The following documentation is written in UTF-8 encoding. -如果你用一般的文字編輯器閱覽這份文件, 請忽略文中奇特的註記字符. -這份文件是以 POD (簡明文件格式) 寫成; 這種格式是為了能讓人直接讀取, -而特別設計的. 關於此格式的進一步資訊, 請參考 perlpod 線上文件. +憒雿其祉摮蝺刻摩券梯汗隞賣隞, 隢敹賜交銝剖寧閮餉摮蝚. +隞賣隞嗆臭誑 POD (蝪⊥隞嗆澆) 撖急; 蝔格澆舐箔質鈭箇湔亥, +孵亥身閮. 潭迨澆脖甇亥閮, 隢 perlpod 蝺銝隞. -=encoding big5 +=encoding UTF-8 =head1 NAME -perltw - 正體中文 Perl 指南 +perltw - 甇擃銝剜 Perl =head1 DESCRIPTION -歡迎來到 Perl 的天地! +甇∟靘 Perl 憭拙! -從 5.8.0 版開始, Perl 具備了完善的 Unicode (萬國碼) 支援, -也連帶支援了許多拉丁語系以外的編碼方式; CJK (中日韓) 便是其中的一部份. -Unicode 是國際性的標準, 試圖涵蓋世界上所有的字符: 西方世界, 東方世界, -以及兩者間的一切 (希臘文, 敘利亞文, 阿拉伯文, 希伯來文, 印度文, -印地安文, 等等). 它也容納了多種作業系統與平臺 (如 PC 及麥金塔). +敺 5.8.0 憪, Perl 瑕鈭摰 Unicode (砍蝣) 舀, +銋撣嗆舀港閮勗銝隤蝟颱誑憭蝺函Ⅳ孵; CJK (銝剜仿) 靘踵臬嗡葉銝其遢. +Unicode 臬抒璅皞, 閰血瘨菔銝銝摮蝚: 镼踵嫣, 望嫣, +隞亙抵銝 (撣, 拐, 踵隡舀, 撣隡臭, 啣漲, +啣啣, 蝑蝑). 摰銋摰寧鈭憭蝔桐璆剔頂蝯梯撟唾 (憒 PC 暻仿憛). -Perl 本身以 Unicode 進行操作. 這表示 Perl 內部的字串資料可用 Unicode -表示; Perl 的函式與算符 (例如正規表示式比對) 也能對 Unicode 進行操作. -在輸入及輸出時, 為了處理以 Unicode 之前的編碼方式儲存的資料, Perl -提供了 Encode 這個模組, 可以讓你輕易地讀取及寫入舊有的編碼資料. +Perl 祈澈隞 Unicode 脰雿. 銵函內 Perl 折函摮銝脰舐 Unicode +銵函內; Perl 賢蝞蝚 (靘憒甇閬銵函內撘瘥撠) 銋賢 Unicode 脰雿. +刻撓亙頛詨箸, 箔隞 Unicode 銋蝺函Ⅳ孵脣鞈, Perl +靘鈭 Encode 璅∠, 臭誑霈雿頛啗撖怠亥蝺函Ⅳ鞈. -Encode 延伸模組支援下列正體中文的編碼方式 ('big5' 表示 'big5-eten'): +Encode 撱嗡撓璅∠舀港甇擃銝剜蝺函Ⅳ孵 ('big5' 銵函內 'big5-eten'): - big5-eten Big5 編碼 (含倚天延伸字形) - big5-hkscs Big5 + 香港外字集, 2001 年版 - cp950 字碼頁 950 (Big5 + 微軟添加的字符) + big5-eten Big5 蝺函Ⅳ (怠憭拙辣隡詨敶) + big5-hkscs Big5 + 擐皜臬摮, 2001 撟渡 + cp950 摮蝣潮 950 (Big5 + 敺株瘛餃摮蝚) -舉例來說, 將 Big5 編碼的檔案轉成 Unicode, 祗需鍵入下列指令: +靘靘隤, 撠 Big5 蝺函Ⅳ瑼獢頧 Unicode, 蟡萄乩隞: perl -Mencoding=big5,STDOUT,utf8 -pe1 < file.big5 > file.utf8 -Perl 也內附了 "piconv", 一支完全以 Perl 寫成的字符轉換工具程式, 用法如下: +Perl 銋折鈭 "piconv", 銝臬其誑 Perl 撖急摮蝚西撌亙瑞撘, 冽憒銝: piconv -f big5 -t utf8 < file.big5 > file.utf8 piconv -f utf8 -t big5 < file.utf8 > file.big5 -另外, 利用 encoding 模組, 你可以輕易寫出以字符為單位的程式碼, 如下所示: +血, 拍 encoding 璅∠, 雿臭誑頛撖怠箔誑摮蝚衣箏桐蝔撘蝣, 憒銝蝷: #!/usr/bin/env perl - # 啟動 big5 字串解析; 標準輸出入及標準錯誤都設為 big5 編碼 + # big5 摮銝脰圾; 璅皞頛詨箏亙璅皞航炊質身 big5 蝺函Ⅳ use encoding 'big5', STDIN => 'big5', STDOUT => 'big5'; - print length("駱駝"); # 2 (雙引號表示字符) - print length('駱駝'); # 4 (單引號表示位元組) - print index("諄諄教誨", "彖帢"); # -1 (不包含此子字串) - print index('諄諄教誨', '彖帢'); # 1 (從第二個位元組開始) + print length("擏梢"); # 2 (撘銵函內摮蝚) + print length('擏梢'); # 4 (桀銵函內雿蝯) + print index("隢隢隤", "敶撣"); # -1 (銝急迨摮摮銝) + print index('隢隢隤', '敶撣'); # 1 (敺蝚砌雿蝯憪) -在最後一列例子裡, "諄" 的第二個位元組與 "諄" 的第一個位元組結合成 Big5 -碼的 "彖"; "諄" 的第二個位元組則與 "教" 的第一個位元組結合成 "帢". -這解決了以前 Big5 碼比對處理上常見的問題. +冽敺銝靘摮鋆, "隢" 蝚砌雿蝯 "隢" 蝚砌雿蝯蝯 Big5 +蝣潛 "敶"; "隢" 蝚砌雿蝯 "" 蝚砌雿蝯蝯 "撣". +閫瘙箔隞亙 Big5 蝣潭撠銝撣貉憿. -=head2 額外的中文編碼 +=head2 憿憭銝剜蝺函Ⅳ -如果需要更多的中文編碼, 可以從 CPAN (L<http://www.cpan.org/>) 下載 -Encode::HanExtra 模組. 它目前提供下列編碼方式: +憒閬游銝剜蝺函Ⅳ, 臭誑敺 CPAN (L<http://www.cpan.org/>) 銝頛 +Encode::HanExtra 璅∠. 摰桀靘銝蝺函Ⅳ孵: - cccii 1980 年文建會的中文資訊交換碼 - euc-tw Unix 延伸字符集, 包含 CNS11643 平面 1-7 - big5plus 中文數位化技術推廣基金會的 Big5+ - big5ext 中文數位化技術推廣基金會的 Big5e + cccii 1980 撟湔撱箸銝剜鞈閮鈭斗蝣 + euc-tw Unix 撱嗡撓摮蝚阡, CNS11643 撟喲 1-7 + big5plus 銝剜訾銵典誨粹 Big5+ + big5ext 銝剜訾銵典誨粹 Big5e -另外, Encode::HanConvert 模組則提供了簡繁轉換用的兩種編碼: +血, Encode::HanConvert 璅∠靘鈭蝪∠頧函拍車蝺函Ⅳ: - big5-simp Big5 正體中文與 Unicode 簡體中文互轉 - gbk-trad GBK 簡體中文與 Unicode 正體中文互轉 + big5-simp Big5 甇擃銝剜 Unicode 蝪⊿銝剜鈭頧 + gbk-trad GBK 蝪⊿銝剜 Unicode 甇擃銝剜鈭頧 -若想在 GBK 與 Big5 之間互轉, 請參考該模組內附的 b2g.pl 與 g2b.pl 兩支程式, -或在程式內使用下列寫法: +交喳 GBK Big5 銋鈭頧, 隢閰脫芋蝯折 b2g.pl g2b.pl 拇舐撘, +函撘找蝙其撖急: use Encode::HanConvert; - $euc_cn = big5_to_gb($big5); # 從 Big5 轉為 GBK - $big5 = gb_to_big5($euc_cn); # 從 GBK 轉為 Big5 + $euc_cn = big5_to_gb($big5); # 敺 Big5 頧 GBK + $big5 = gb_to_big5($euc_cn); # 敺 GBK 頧 Big5 -=head2 進一步的資訊 +=head2 脖甇亦鞈閮 -請參考 Perl 內附的大量說明文件 (不幸全是用英文寫的), 來學習更多關於 -Perl 的知識, 以及 Unicode 的使用方式. 不過, 外部的資源相當豐富: +隢 Perl 折憭折隤芣隞 (銝撟詨冽舐刻望撖怎), 靘摮貊游 +Perl 亥, 隞亙 Unicode 雿輻冽孵. 銝, 憭函鞈皞貊嗉撖: -=head2 提供 Perl 資源的網址 +=head2 靘 Perl 鞈皞蝬脣 =over 4 =item L<http://www.perl.com/> -Perl 的首頁 (由歐萊禮公司維護) +Perl 擐 (望蝳桀砍貊雁霅) =item L<http://www.cpan.org/> -Perl 綜合典藏網 (Comprehensive Perl Archive Network) +Perl 蝬貉蝬 (Comprehensive Perl Archive Network) =item L<http://lists.perl.org/> -Perl 郵遞論壇一覽 +Perl 菟隢憯銝閬 =back -=head2 學習 Perl 的網址 +=head2 摮貊 Perl 蝬脣 =over 4 =item L<http://www.oreilly.com.tw/product_perl.php?id=index_perl> -正體中文版的歐萊禮 Perl 書藉 +甇擃銝剜甇蝳 Perl 貉 =item L<http://groups.google.com/groups?q=tw.bbs.comp.lang.perl> -臺灣 Perl 連線討論區 (也就是各大 BBS 的 Perl 連線版) +箇 Perl 蝺閮隢 (銋撠望臬憭 BBS Perl 蝺) =back -=head2 Perl 使用者集會 +=head2 Perl 雿輻刻 =over 4 =item L<http://www.pm.org/groups/asia.html> -臺灣 Perl 推廣組一覽 +箇 Perl 典誨蝯銝閬 =item L<http://irc.elixus.org/> -藝立協線上聊天室 +蝡蝺銝憭拙恕 =back -=head2 Unicode 相關網址 +=head2 Unicode 賊蝬脣 =over 4 =item L<http://www.unicode.org/> -Unicode 學術學會 (Unicode 標準的制定者) +Unicode 摮貉摮豢 (Unicode 璅皞嗅) =item L<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html> -Unix/Linux 上的 UTF-8 及 Unicode 答客問 +Unix/Linux 銝 UTF-8 Unicode 蝑摰W =back -=head2 中文化資訊 +=head2 銝剜鞈閮 =over 4 -=item 中文化軟體聯盟 +=item 銝剜頠擃舐 L<http://www.cpatch.org/> -=item Linux 軟體中文化計劃 +=item Linux 頠擃銝剜閮 L<http://www.linux.org.tw/CLDP/> @@ -167,6 +167,6 @@ L<Encode>, L<Encode::TW>, L<encoding>, L<perluniintro>, L<perlunicode> Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt> -Audrey Tang (唐鳳) E<lt>audreyt@audreyt.orgE<gt> +Audrey Tang (曈) E<lt>audreyt@audreyt.orgE<gt> =cut |