diff options
author | Keedi Kim <keedi@cpan.org> | 2013-07-05 02:11:12 +0900 |
---|---|---|
committer | Father Chrysostomos <sprout@cpan.org> | 2013-07-04 18:32:49 -0700 |
commit | 277d344a7138edb0db4be779195187fb483a21cd (patch) | |
tree | ed7fd8c3c37bf8f689cea6fd248cda684969cb2e /README.ko | |
parent | 247f9b19318882fd9a52fe49aa31fc8d3d3db4f7 (diff) | |
download | perl-277d344a7138edb0db4be779195187fb483a21cd.tar.gz |
Update brand-new README.ko
Diffstat (limited to 'README.ko')
-rw-r--r-- | README.ko | 339 |
1 files changed, 239 insertions, 100 deletions
@@ -1,201 +1,340 @@ =encoding utf8 -이 문서를 perldoc을 써서 보지 않고 직접 보는 경우에는 각 부분의 -역할을 표시하기 위해 쓰인 =head, =item, 'L' 등은 무시하십시오. -이 문서는 따로 perldoc을 쓰지 않고 보더라도 읽는데 별 지장이 -없는 POD 형식으로 짜여 있습니다. 더 자세한 것은 perlpod -매뉴얼을 참고하십시오. +이 파일을 내용 그대로 읽고 있다면 우스꽝스러운 문자는 무시해주세요. +이 문서는 POD로 읽을 수 있도록 POD 형식(F<pod/perlpod.pod> 문서를 +확인하세요)으로 작성되어 있습니다. + =head1 NAME -perlko - Perl과 한국어 인코딩 +perlko - 한국어 Perl 안내서 + =head1 DESCRIPTION -Perl의 세계에 오신 것을 환영합니다 ! +Perl의 세계에 오신 것을 환영합니다! + +Perl은 가끔 B<'Practical Extraction and Report Language'>라고 하기도 합니다만 +다른 널리 알려진 것들 중에서 B<'Pathologically Eclectic Rubbish Lister'>라고 +하기도 합니다. 사실 이것은 끼워 맞춘 것이며 Perl이 이것들의 첫 글자를 +가져와서 이름을 붙인 것은 아닙니다. Perl의 창시자 Larry가 첫 번째 이름을 +먼저 생각했고 널리 알려진 것을 나중에 지었기 때문입니다. 그렇기 때문에 +B<'Perl'>은 모두 대문자가 아닙니다. 널리 알려진 어떤 것을 가지고 논쟁하는 +것은 의미가 없습니다. Larry는 두 개 다 지지합니다. + +가끔 p가 소문자로 작성된 B<'perl'>을 볼 것입니다. P가 대문자로 되어 있는 +B<'Perl'>은 언어를 참조할 때 쓰이며 B<'perl'>처럼 p가 소문자인 경우는 여러분의 +프로그램을 컴파일하고 돌릴 때 사용되는 해석기를 지칭할 때 사용됩니다. + + +=head1 Perl에 관하여 + +Perl은 본래 문자열 생성을 위해 만들졌지만 지금은 시스템 관리와 웹 개발, +네트워크 프로그래밍, GUI 개발 등을 포함한 여러 분야에서 널리 사용되는 +범용 프로그래밍 언어입니다. + +이 언어는 아름다움(아주 작고, 우아하고, 아주 적고)보다 +실용적(사용하기 쉽고, 효율적이며, 가능한 최대한)인 것을 지향하고 있습니다. +사용하기 쉽고, 절차적 프로그래밍과 객체 지향 프로그래밍을 모두 지원하고, +강력한 문자열 처리 기능을 내장하고, 세상에서 가장 인상적인 제 3자의 모듈 +모음처를 가지고 있다는 것은 Perl의 가장 중요한 특징입니다. + +Perl의 언어적 특징은 F<pod/perlintro.pod> 문서에서 소개합니다. + +이번 릴리스에서 가장 중요한 변화는 F<pod/perldelta.pod>에서 논의합니다. + +또한 다양한 출판사가 출판한 많은 Perl 책은 다양한 주제를 다루고 있습니다. +자세한 정보는 F<pod/perlbook.pod> 문서를 확인하세요. + + +=head1 설치 + +여러분이 비교적 현대의 운영체제를 사용하고 있고 현재 버전의 Perl을 +지역적으로 설치하고 싶다면 다음 명령을 실행하세요. + + ./Configure -des -Dprefix=$HOME/localperl + make test + make install + +앞의 명령은 여러분의 플랫폼에 맞게 환경을 설정하고 컴파일을 수행한 후, +회기 테스트를 수행한뒤, 홈 디렉터리 하부의 F<localperl> 디렉터리에 perl을 +설치합니다. + +여러분이 어떠한 문제든 겪게 되거나 사용자 정의 버전 Perl을 설치할 필요가 있다면 +현재 배포판에 들어있는 F<INSTALL> 파일 안의 자세한 설명을 읽어야 합니다. +추가적으로 일반적이지 않은 다양한 플랫폼에서 Perl을 빌드하고 사용하는 +방법에 대한 도움말과 귀띔이 적혀있는 많은 수의 F<README> 파일이 있습니다. +일단 Perl을 설치하고 나면 C<perldoc> 도구를 이용해 풍부한 문서를 사용할 +수 있습니다. 시작하기 위해서 다음 명령을 실행하세요. -Perl은 5.8.0판부터 유니코드/ISO 10646에 대한 광범위한 지원을 합니다. + perldoc perl + + +=head1 실행에 어려움을 겪는다면 + +Perl은 뜨개질에서 부터 로켓 과학까지 모든 분야에서 사용할 수 있는 크고 +복잡한 시스템입니다. 여러분이 어려움에 부딪혔을때 그 문제는 이미 다른 +사람이 해결했을 가능성이 높습니다. 문서를 모두 확인했는데도 버그가 +확실하다면 C<perlbug> 도구를 이용해서 저희에게 버그를 보고해주세요. +C<perlbug>에 대한 더 자세한 정보는 C<perldoc perlbug> 또는 C<perlbug>를 +명령줄에서 실행해서 확인할 수 있습니다. + +Perl을 사용 가능하게 만들었다 하더라도 Perl은 계속해서 진화하기 때문에 +여러분이 맞닥뜨린 버그를 수정했거나 여러분이 유용하다고 생각할법한 +새로운 기능이 추가된 좀 더 최신 버전이 있을 수 있습니다. + +여러분은 항상 최신 버전의 perl을 CPAN (Comprehensive Perl Archive Network) +사이트 L<http://www.cpan.org/src/> 에서 찾을 수 있습니다. + +perl 소스에 간단한 패치를 등록하고 싶다면 F<pod/perlhack.pod> 문서의 +B<"SUPER QUICK PATCH GUIDE">를 살펴보세요. + +그냥 개인적으로 참고하세요. +제가 이것처럼 멋진 물건을 만든다는 것을 여러분이 알기를 바랍니다. +그것은 제 이야기의 B<"저자(Author)">를 기쁘게하기 때문입니다. +이것이 여러분을 귀찮게 한다면 여러분의 B<"저작(Authorship)">에 +대한 생각을 정정해야 할 수도 있습니다. 하지만 어쨌거나 여러분은 +Perl을 사용하는데는 문제가 없답니다. :-) + +- B<"저자">로부터. + + +=head1 인코딩 + +Perl은 5.8.0판부터 유니코드/ISO 10646에 대해 광범위하게 지원합니다. 유니코드 지원의 일환으로 한중일을 비롯한 세계 각국에서 유니코드 이전에 쓰고 있었고 지금도 널리 쓰이고 있는 수많은 인코딩을 -지원합니다. 유니코드는 전 세계에서 쓰이는 모든 언어를 위한 표기 체계 - -유럽의 라틴 알파벳, 키릴 알파벳, 그리스 알파벳, 인도와 동남 아시아의 +지원합니다. 유니코드는 전 세계에서 쓰이는 모든 언어를 위한 +표기 체계(유럽의 라틴 알파벳, 키릴 알파벳, 그리스 알파벳, 인도와 동남 아시아의 브라미 계열 스크립트, 아랍 문자, 히브리 문자, 한중일의 한자, 한국어의 한글, -일본어의 가나, 북미 인디안의 표기 체계 등-를 수용하는 것을 목표로 하고 +일본어의 가나, 북미 인디안의 표기 체계 등)를 수용하는 것을 목표로 하고 있기 때문에 기존에 쓰이던 각 언어 및 국가 그리고 운영 체계에 고유한 문자 집합과 인코딩에 쓸 수 있는 모든 글자는 물론이고 기존 문자 집합에서 지원하고 있지 않던 아주 많은 글자를 포함하고 있습니다. - -Perl은 내부적으로 유니코드를 문자 표현을 위해 사용합니다. 보다 구체적으로 -말하면 Perl 스크립트 안에서 UTF-8 문자열을 쓸 수 있고, +Perl은 내부적으로 유니코드를 문자 표현을 위해 사용합니다. +보다 구체적으로 말하면 Perl 스크립트 안에서 UTF-8 문자열을 쓸 수 있고, 각종 함수와 연산자(예를 들어, 정규식, index, substr)가 바이트 단위 -대신 유니코드 글자 단위로 동작합니다. (더 자세한 것은 -perlunicode 매뉴얼을 참고하십시오.) 유니코드가 널리 보급되기 전에 -널리 쓰이고 있었고, 여전히 널리 쓰이고 있는 각국/각 언어별 인코딩으로 -입출력을 하고 이들 인코딩으로 된 데이터와 문서를 다루는 것을 돕기 위해 -'Encode'가 쓰였습니다. 무엇보다 'Encode'를 써서 수많은 인코딩 사이의 -변환을 쉽게 할 수 있습니다. +대신 유니코드 글자 단위로 동작합니다. +더 자세한 것은 F<pod/perlunicode.pod> 문서를 참고하세요. +유니코드가 널리 보급되기 전에 널리 쓰이고 있었고, 여전히 널리 쓰이고 있는 +각국/각 언어별 인코딩으로 입출력을 하고 이들 인코딩으로 된 데이터와 문서를 +다루는 것을 돕기 위해 L<Encode> 모듈이 쓰이고 있습니다. +무엇보다 L<Encode> 모듈을 사용하면 수많은 인코딩 사이의 변환을 쉽게 할 수 있습니다. + -'Encode'는 다음과 같은 한국어 인코딩을 지원합니다. +=head2 Encode 모듈 + +=head3 지원 인코딩 + +L<Encode> 모듈은 다음과 같은 한국어 인코딩을 지원합니다. =over 4 -=item * euc-kr +=item * C<euc-kr> -US-ASCII와 KS X 1001을 같이 쓰는 멀티바이트 인코딩 (흔히 완성형이라고 -불림.) KS X 2901과 RFC 1557 참고. +US-ASCII와 KS X 1001을 같이 쓰는 멀티바이트 인코딩으로 흔히 +완성형이라고 불림. KS X 2901과 RFC 1557 참고. -=item * cp949 +=item * C<cp949> -MS-Windows 9x/ME에서 쓰이는 확장 완성형. euc-kr에 8,822자의 -한글 음절을 더한 것임. alias는 uhc, windows-949, x-windows-949, +MS-Windows 9x/ME에서 쓰이는 확장 완성형. euc-kr에 8,822자의 +한글 음절을 더한 것임. alias는 uhc, windows-949, x-windows-949, ks_c_5601-1987. 맨 마지막 이름은 적절하지 않은 이름이지만, Microsoft 제품에서 CP949의 의미로 쓰이고 있음. -=item * johab +=item * C<johab> -KS X 1001:1998 부록 3에서 규정한 조합형. 문자 레퍼토리는 cp949와 -마찬가지로 US-ASCII와 KS X 1001에 8,822자의 한글 음절을 더한 것임. -인코딩 방식은 전혀 다름. +KS X 1001:1998 부록 3에서 규정한 조합형. 문자 레퍼토리는 cp949와 마찬가지로 +US-ASCII와 KS X 1001에 8,822자의 한글 음절을 더한 것으로 인코딩 방식은 전혀 다름. -=item * iso-2022-kr +=item * C<iso-2022-kr> RFC 1557에서 규정한 한국어 인터넷 메일 교환용 인코딩으로 US-ASCII와 KS X 1001을 레퍼토리로 하는 점에서 euc-kr과 같지만 인코딩 방식이 다름. 1997-8년 경까지 쓰였으나 더 이상 메일 교환에 쓰이지 않음. -=item * ksc5601-raw +=item * C<ksc5601-raw> -KS X 1001(KS C 5601)을 GL(즉, MSB를 0으로 한 경우) 에 놓았을 때의 -인코딩. US-ASCII와 결합하지 않고 단독으로 쓰이는 일은 X11 등에서 글꼴 -인코딩 (ksc5601.1987-0. '0'은 GL을 의미함.)으로 쓰이는 것을 제외하고는 -거의 없음. KS C 5601은 1997년 KS X 1001로 이름을 바꾸었음. 1998년에는 두 -글자 (유로화 부호와 등록 상표 부호)가 더해졌음. +KS X 1001(KS C 5601)을 GL(즉, MSB를 0으로 한 경우)에 놓았을 때의 인코딩. +US-ASCII와 결합하지 않고 단독으로 쓰이는 일은 X11 등에서 글꼴 +인코딩(ksc5601.1987-0. '0'은 GL을 의미함)으로 쓰이는 것을 제외하고는 +거의 없음. KS C 5601은 1997년 KS X 1001로 이름을 바꾸었음. 1998년에는 두 +글자(유로화 부호와 등록 상표 부호)가 더해졌음. =back -몇 가지 사용 예제를 아래에 보입니다. +=head3 변환 예제 -예를 들어, euc-kr 인코딩으로 된 파일을 UTF-8로 변환하려면 다음과 -같이 하면 됩니다. +예를 들어, euc-kr 인코딩으로 된 파일을 UTF-8로 변환하려면 +명령줄에서 다음처럼 실행합니다. + perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euc-kr > file.utf8 - perl -Mencoding=euc-kr,STDOUT,utf8 -pe1 < file.euckr > file.utf8 +반대로 변환할 경우 다음처럼 실행합니다. -역변환은 다음과 같이 할 수 있습니다. + perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euc-kr - perl -Mencoding=utf8,STDOUT,euc-kr -pe1 < file.utf8 > file.euckr +이런 변환을 좀더 편리하게 할 수 있도록 도와주는 F<piconv>가 Perl에 +기본으로 들어있습니다. 이 유틸리티는 L<Encode> 모듈을 이용한 순수 Perl +유틸리티로 이름에서 알 수 있듯이 Unix의 C<iconv>를 모델로 한 것입니다. +사용법은 다음과 같습니다. -이런 변환을 좀더 편리하게 할 수 있도록 Encode 모듈을 써서 -순수하게 Perl로만 쓰인 piconv가 Perl에 들어 있습니다. -그 이름에서 알 수 있듯이 piconv는 Unix에 있는 iconv를 -모델로 한 것입니다. 그 사용법은 아래와 같습니다. + piconv -f euc-kr -t utf8 < file.euc-kr > file.utf8 + piconv -f utf8 -t euc-kr < file.utf8 > file.euc-kr - piconv -f euc-kr -t utf8 < file.euckr > file.utf8 - piconv -f utf8 -t euc-kr < file.utf8 > file.euckr +=head3 모범 사례 -또, 'PerlIO::encoding' 모듈을 써서 한국어 인코딩을 쓰면서 글자 단위 -(바이트 단위가 아니라) 처리를 쉽게 할 수 있습니다. +Perl은 기본적으로 내부에서 UTF-8을 사용하며 Encode 모듈을 통해 +다양한 인코딩을 지원하지만 항상 다음 규칙을 지킴으로써 인코딩과 +관련한 다양하게 발생할 수 있는 문제의 가능성을 줄이는 것을 추천합니다. - #!/path/to/perl +=over 4 - use encoding 'euc-kr', STDIN => 'euc-kr', - STDOUT-> 'euc-kr', STDERR=>'euc-kr'; +=item * 소스 코드는 항상 UTF-8 인코딩으로 저장 - print length("가나"); # 2 (큰 따옴표는 글자 단위 처리를 지시) - print length('가나'); # 4 (작은 따옴표는 바이트 단위 처리를 지시) - print index("한강, 대동강", "염"); # -1 ('염'이 없음) - print index('한강, 대동강', '염'); # 7 (8번째와 9번째 바이트가 '염'의 - 코드값과 일치함.) +=item * 소스 코드 상단에 C<use utf8;> 프라그마 사용 +=item * 소스 코드, 터미널, 운영체제, 데이터 인코딩을 분리해서 이해 -=head2 더 자세히 알고 싶으면... +=item * 입출력 파일 핸들에 명시적인 인코딩을 사용 -Perl을 설치하면 대단히 자세한 문서가 같이 따라 오며, 이 문서를 통해 -Perl 전반 뿐 아니라 유니코드 지원, Encode의 사용법 등에 많은 것을 -배울 수 있습니다. 아직 이 문서는 현재 모두 영어로 쓰여 있습니다. +=item * 중복(double) 인코딩을 주의 +=back -=head2 Perl 관련 자료 -위에서 언급한 문서 외에도 다음과 같은 자료가 있습니다. 이 목록은 결코 -완전한 것이 아니고 일부 대표적인 것만 모은 것입니다. +=head3 유니코드 및 한국어 인코딩 관련 자료 =over 4 -=item L<http://www.perl.com/> +=item * L<perluniintro> - O'Reilly의 Perl 웹 페이지 +=item * L<perlunicode> -=item L<http://www.cpan.org/> +=item * L<Encode> - Comprehensive Perl Archive Network +=item * L<Encode::KR> -=item L<http://lists.perl.org/> +=item * L<encoding> - Perl 메일링 리스트. 많은 리스트 가운데 - perl-unicode에서 'Encode'에 대해 논의함. +=item * L<http://www.unicode.org/> + +유니코드 컨소시엄 + +=item * L<http://std.dkuug.dk/JTC1/SC2/WG2> + +기본적으로 Unicode와 같은 ISO 표준인 ISO/IEC 10646 UCS(Universal +Character Set)을 만드는 ISO/IEC JTC1/SC2/WG2의 웹 페이지 + +=item * L<http://www.cl.cam.ac.uk/~mgk25/unicode.html> + +유닉스/리눅스 사용자를 위한 UTF-8 및 유니코드 관련 FAQ + +=item * L<http://wiki.kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html> + +유닉스/리눅스 사용자를 위한 UTF-8 및 유니코드 관련 FAQ의 한국어 번역 =back -=head2 Perl을 더 깊게 공부하는데 도움을 줄 수 있는 한국어 관련 사이트 + +=head1 Perl 관련 자료 + +다음은 공식적인 Perl 관련 자료중 일부입니다. =over 4 -=item L<http://www.perl.or.kr/> +=item * L<http://www.perl.org/> + +Perl 공식 홈페이지 + +=item * L<http://www.perl.com/> + +O'Reilly의 Perl 웹 페이지 + +=item * L<http://www.cpan.org/> + +CPAN - Comprehensive Perl Archive Network, 통합적 Perl 파일 보관 네트워크 + +=item * L<http://metacpan.org> + +메타 CPAN - Perl 한국 사용자 모임 +=item * L<http://lists.perl.org/> -=item L<news:han.comp.lang.perl/> +Perl 메일링 리스트 - 한국어 Perl 뉴스 그룹 +=item * L<http://blogs.perl.org/> -=item L<http://www.hanb.co.kr/search/searchResult.html?keyword=perl> +Perl 메타 블로그 - O'Reilly에서 나온 한국어 Perl 서적 목록 +=item * L<http://www.perlmonks.org/> -=item L<http://www.perlschool.net/> +Perl 수도승들을 위한 수도원 - Perl 기초 강좌 및 소스, 최근 동향, 관련 해외 사이트 링크 +=item * L<http://www.pm.org/groups/asia.html> -=item L<http://www.perl.co.kr> +아시아 지역 Perl 몽거스 모임 - Perl에 관련된 CGI, DB, 연동 등에 대한 정보 및 뉴스 제공 +=item * L<http://www.perladvent.org/> -=back +Perl 크리스마스 달력 -=head2 유니코드 및 한국어 인코딩 관련 자료 +=back + + +다음은 Perl을 더 깊게 공부하는데 도움을 줄 수 있는 한국어 관련 사이트입니다. =over 4 -=item L<http://www.unicode.org/> +=item * L<http://perl.kr/> - 유니코드 컨소시엄. +한국 Perl 커뮤니티 공식 포털 -=item L<http://std.dkuug.dk/JTC1/SC2/WG2> +=item * L<http://doc.perl.kr/> -기본적으로 Unicode와 같은 ISO 표준인 ISO/IEC 10646 UCS(Universal -Character Set)을 만드는 ISO/IEC JTC1/SC2/WG2의 웹 페이지. +Perl 문서 한글화 프로젝트 + +=item * L<http://cafe.naver.com/perlstudy.cafe> + +네이버 Perl 카페 + +=item * L<http://www.perl.or.kr/> + +한국 Perl 사용자 모임 + +=item * L<http://advent.perl.kr> -=item L<http://www.cl.cam.ac.uk/~mgk25/unicode.html> +Seoul.pm Perl 크리스마스 달력 (2010 ~ 2012) - 유닉스/리눅스에서 유니코드와 UTF-8 사용에 대한 문답집(FAQ) +=item * L<http://gypark.pe.kr/wiki/Perl> -=item L<http://wiki.kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html> +GYPARK(Geunyoung Park)의 Perl 관련 한글 문서 저장소 - 유닉스/리눅스에서 유니코드와 UTF-8 사용에 대한 문답집(FAQ)의 한국어 번역 +=item * L<http://seoul.pm.org> + +Seoul.pm - 서울 Perl 몽거스 =back -=head1 SEE ALSO -L<Encode>, L<Encode::KR>, L<encoding>, L<perluniintro>, L<perlunicode> +=head1 라이센스 + +F<README> 파일의 B<'LICENSING'> 항목을 참고하세요. =head1 AUTHORS -Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt> -신정식 E<lt>jshin@mailaps.orgE<gt> +=over + +=item * Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt> + +=item * 신정식 E<lt>jshin@mailaps.orgE<gt> + +=item * 김도형 E<lt>keedi@cpan.orgE<gt> + +=back + =cut |