1 命名規則
1.1 文件命名
文件名稱統一用英文字母(大小寫)、數字和下劃線的組合,長度一般不超過20個字符,文件命名體現功能的含義,正式發布版本不能加入作者信息。Perl Scripts 文件的擴展名必須是".pl",Perl Module文件的擴展名必須是".pm"。
正確:
lucent_file_parser.pl
不是:
lucent_file.p
1.2 標識符
采用語法模板來定義標識符的名字,命名必須有一定的實際意義,由英文字母組成,中間可以根據語義的連續性,使用下劃線連接。
1.2.1 變量
局部變量必須由小寫字母和下劃線組成,常量名必須由大寫字母和下劃線組成。由多個單詞組成的名字里,使用下劃線"_"把多個單詞分開。全局變量以’g_’開頭,其余部分的命名規則和局部變量相同。每個全局變量必須有注釋說明其作用。
正確:
my $next_node;
不是:
my $node;
1.2.2 包和類
包、類的命名采用大小寫混合、首字母大寫的方法。
正確:
IO::Controller
1.2.3 標識符縮寫
標識符縮寫時要保留單詞的開始字母,不是輔音字母的簡寫。
正確:
use List::Util qw( max );
DESC:
for my $desc (@orig_strs) {
my $len = length($desc);
next DESC if ($len > $UPPER_LIM);
$max_len = max($max_len, $len);
}
不是:
use List::Util qw( max );
DSCN:
for my $dscn (@rgnl_strgs) {
my $lngh = length $dscn;
next DSCN if $lngh > $UPPR_LMT;
$mx_lngh = max($mx_lngh, $lngh);
}
1.2.4 函數
由小寫字母、下劃線組成。
正確:
sub max
{
……
}
sub get_msc_name
{
……
}
不是:
sub getMscName
{
……
}
1.3 布爾類型
boolean類型的變量,或返回boolean類型的值的函數,在命名時要反映其屬性,必須用is或者has開頭。
正確:
sub is_valid;
sub is_metadata_available_for;
sub has_end_tag;
my $has_loading_finished;
my $has_found_bad_record;
# and later...
if (is_valid($next_record) && !$has_loading_finished) {
METADATA:
while (is_metadata_available_for($next_record)) {
push @metadata, get_metadata_for($next_record);
last METADATA if (has_end_tag($next_record));
}
}
else {
$has_found_bad_record = 1;
}
1.4 數組和哈希
數組類型的變量采用復數,hash類型的變量采用單數。要用undef顯式釋放變量空間。
正確:
my %option;
my %title_of;
my %count_for;
my %is_available;
# and later...
if ($option{'count_all'} && $title_of{$next_book} =~ m/$target/xms) {
$count_for{$next_book}++;
$is_available{$next_book} = 1;
}
my @events;
my @handlers;
my @unknowns;
# and later...
for my $event (@events) {
push @unknowns, grep { ! $_->handle($event) } @handlers;
}
print map { $_->err_msg } @unknowns;
2 注釋
所有注釋可用英文或中文書寫,盡量使用英文注釋。保持注釋和代碼的完全一致,修改程序時,必須修改相應的注釋。注釋的行數一般應在程序總行數的1/5到1/3。禁止出現錯別字。注釋應該語義明確,避免出現二義性。
2.1 文件頭部注釋
每個含有源代碼的文件必須在文件開始有關于該文件的介紹性注釋。其中列出文件名、創建者、創建日期、功能描述、版本信息、版權聲明;如果對文件進行了修改,應該在文件頭中說明修改人、修改日期、修改原因,并變更文件的版本信息,最新版本信息放到最前面。
格式為:
#*********************************************************
# FileName: lucent_file_parser.pl
# Creator: Phonix <phonix@gmail.com.cn>
# Create Time: 2006-01-09
# Description: This is the proof-of-concept code for the
# Windows denial-of-serice attack described by
# the Razor team (NTBugtraq, 19-May-00).
# CopyRight: Copyright ? Bright Ocean Inter-Telecomm,All rights reserved.
# Revision: V1.0.0
# ModifyList:
# Revision: V1.1.1
# Modifier: Phonix
# ModifyTime: 2006-01-17
# ModifyReason: fix the bug of ……
#
# Revision: V1.1.0
# Modifier: Phonix
# ModifyTime: 2006-01-16
# ModifyReason: add mysql&oracle db support
#*********************************************************
不是簡單的:
#========================================
#Created By:Phonix
#Created Time: 2006-01-09
#Modified Time: 2006-01-17
#========================================
2.2 文件中注釋
建議在文件中標識出修改部分的起止位置。
正確:
# add mysql&oracle db support begin
……
# add mysql&oracle db support end
2.3 函數注釋
在每個函數前必須寫描述性注釋。說明這個函數的功能、參數和函數的返回值。
格式為:
#*******************************************************************
# Function Name: calc_time($datetime, $delta)
# Description: This function calculate the new datetime.
# Parameters:
# 1. $datetime is the base time, taking the format of 'yyyy-mm-dd hh:mm:ss'
# 2. $delta is the time which should be add to the $datetime. A positive value increase the time
# while the negative vale decrease the time
# Return:
# A new time string is returned, also taking the format of 'yyyy-mm-dd hh:mm:ss'
#*********************************************************************
不是簡單的:
##########################################
#function name : get_ldap
#desc : get config info from ldap server
##########################################
2.4 程序塊注釋
程序塊注釋用于說明程序中的關鍵算法、使用某種技巧的代碼以及修改、測試、閱讀時必須加以注意的代碼。
格式為:
#*********************************************************************
#注釋內容
#......
#......
#********************************************************************
2.5 語句注釋
用于對特定程序語句進行說明,建議采取在語句行末尾說明的方法,同時注釋換行后也要對齊。格式為:
my @names = (
'Damian', # Primary key
# the key is
'Matthew', # Disambiguator
'Conway', # General class or category
);
3 代碼布局
3.1 括號
建議括號、插入語可以采用兩種方式之一,但是在一個程序里選定那種方式之后,那么要至始至終保持一致。
3.1.1 方式一
采用K&R風格。
格式為:
my @names = (
'Damian', # Primary key
'Matthew', # Disambiguator
'Conway', # General class or category
);
for my $name (@names) {
for my $word ( anagrams_of(lc $name) ) {
print "$word\n";
}
}
3.1.2 方式二
括號對{}對必須位于同一列,獨占一行,并且和{}之外的語句行對齊
my @names =
(
'Damian', # Primary key
'Matthew', # Disambiguator
'Conway', # General class or category
);
for my $name (@names)
{
for my $word (anagrams_of(lc $name))
{
print "$word\n";
}
}
3.2 關鍵字
把關鍵字和其他的內容分開,關鍵字if, while, for,else…后面必須接一個空格。if和while語句必須使用’{‘和’}’括起語句體,即使只有一行代碼。建議不使用單行的if語句。
正確:
for my $result (@results) {
print_sep( );
print $result;
}
while ($min < $max) {
my $try = ($max - $min) / 2;
if ($value[$try] < $target) {
$max = $try;
}
else {
$min = $try;
}
}
if ($condition){
$i++;
}
不是:
for(@results) {
print_sep( );
print;
}
while($min < $max) {
my $try = ($max - $min) / 2;
if($value[$try] < $target) {
$max = $try;
}
else{
$min = $try;
}
}
if($condition) {$i++;}
3.3 子程序和變量
不要把子程序或變量和其后的括號部分分開。
正確:
my @candidates = get_candidates($marker);
CANDIDATE:
for my $i (0..$#candidates) {
next CANDIDATE if open_region($i);
$candidates[$i]
= $incumbent{ $candidates[$i]{region} };
}
不是:
my @candidates = get_candidates ($marker);
CANDIDATE:
for my $i (0..$#candidates) {
next CANDIDATE if open_region ($i);
$candidates [$i]
= $incumbent {$candidates [$i] {region}};
}
3.4 代碼縮排
縮進采用四個空格,或一個TAB(1 TAB 設置成四個空格)。
3.5 代碼塊
不要把兩句話放在一行,每行只能寫一個語句。
正確:
while (my $record = <$inventory_file>) {
chomp $record;
next RECORD if $record eq $EMPTY_STR;
my @fields = split $FIELD_SEPARATOR, $record;
update_sales(\@fields);
$count++;
}
不是:
while (my $record = <$inventory_file>) {
chomp $record; next RECORD if $record eq $EMPTY_STR;
my @fields = split $FIELD_SEPARATOR, $record; update_sales(\@fields);$count++;
}
3.6 代碼長度
每個函數體的語句行不能超過100行(不包括注釋,一個分號算一行)。每行長度不要超過78個字符,超過該長度時,必須考慮換行,從低優先級的操作符處分割長表達式, 在賦值符前斷開長的語句。
正確:
push (@steps, $steps[-1]
+ $radial_velocity * $elapsed_time
+ $orbital_velocity * ($phase + $phase_shift)
- $DRAG_COEFF * $altitude);
$predicted_val = $average + $predicted_change * $fudge_factor;
不是:
push (@steps, $steps[-1] + $radial_velocity
* $elapsed_time + $orbital_velocity
* ($phase + $phase_shift) - $DRAG_COEFF
* $altitude);
$predicted_val = $average
+ $predicted_change * $fudge_factor;
3.7 操作符
二元運算符(算術運算符, 賦值運算符等)的兩邊都要接空格,低級操作符(如:+-)兩邊各有兩個空格,高級操作符(如:*%)兩邊各有一個空格。
在運算符'->'兩邊不要使用空格,在一元操作符和操作數兩邊不要使用空格。
可以使用括號來表示運算的先后順序。
正確:
my $displacement
= $initial_velocity * $time + 0.5 * $acceleration * $time**2;
my $price
= $coupon_paid * $exp_rate + ($face_val + $coupon_paid) * $exp_rate**2;
不是:
my $displacement=$initial_velocity*$time+0.5*$acceleration*$time**2;
my $price=$coupon_paid*$exp_rate+(($face_val+$coupon_val)*$exp_rate**2);
3.8 語句結束符
在每個語句后邊要填加分號。
正確:
while (my $line = <>) {
chomp $line;
if ( $line =~ s{\A (\s*) -- (.*)}{$1#$2}xms ) {
push @comments, $2;
}
print $line;
}
3.9 代碼排列
數組或Hash的賦值采用垂直排列。
正確:
my @months = qw(
January February March
April May June
July August September
October November December
);
my %expansion_of = (
q{it's} => q{it is},
q{we're} => q{we are},
q{didn't} => q{did not},
q{must've} => q{must have},
q{I'll} => q{I will},
);
不是:
my @months = qw(
January February March April May June July August September
October November December
);
my %expansion_of = (
q{it's} => q{it is}, q{we're} => q{we are}, q{didn't} => q{did not},
q{must've} => q{must have}, q{I'll} => q{I will},
);
3.10 非末端表達式
采用中間變量代替長表達式。
正確:
my $next_step = $steps[-1]
+ $radial_velocity * $elapsed_time
+ $orbital_velocity * ($phase + $phase_shift)
- $DRAG_COEFF * $altitude
;
add_step( \@steps, $next_step, $elapsed_time);
不是:
add_step( \@steps, $steps[-1]
+ $radial_velocity * $elapsed_time
+ $orbital_velocity * ($phase + $phase_shift)
- $DRAG_COEFF * $altitude
, $elapsed_time);
3.11 功能塊順序
在每個Perl Scripts中,每個功能塊之間必須有一個空行。主程序為main()函數,功能塊出現順序如下:
use modules;
global variable 定義
main定義
sub routine 定義
4 數值和表達式
4.1 字符串界定符
需要用變量替換的字符串用雙引號,否則用單引號。
正確:
my $spam_name = "$title $first_name $surname";
my $pay_rate = "$minimal for maximal work";
my $spam_name = 'Dr Lawrence Mwalle';
my $pay_rate = '$minimal for maximal work';
4.2 常量
使用字符常量,而不要直接用數值。
正確:
use Readonly;
Readonly my $MOLYBDENUM_ATOMIC_NUMBER => 42;
# and later...
print $count * $MOLYBDENUM_ATOMIC_NUMBER;
不是:
print $count * 42;
4.3 字符串
4.3.1 兩行
對于兩行的字符串,要用“.”進行連接。
正確:
$usage = "Usage: $0 <file> [-full]\n"
. "(Use -full option for full dump)\n";
不是:
$usage = "Usage: $0 <file> [-full]
(Use -full option for full dump)";
4.3.2 多于兩行
對于多于兩行,要采用如下格式:
正確:
$usage = <<"END_USAGE";
Usage: $0 <file> [-full] [-o] [-beans]
Options:
-full : produce a full dump
-o : dump in octal
-beans : source is Java
END_USAGE
不是:
$usage = "Usage: $0 <file> [-full] [-o] [-beans]\n"
. "Options:\n"
. " -full : produce a full dump\n"
. " -o : dump in octal\n"
. " -beans : source is Java\n"
;
4.4 哈希變量
Hash變量的定義采用雙箭頭(=>)方式。
正確:
%default_service_record = (
name=> '<unknown>',
rank=> 'Recruit',
serial=> undef,
unit=> ['Training platoon'],
duty=> ['Basic training'],
);
不是:
%default_service_record = (
'name', '<unknown>',
'rank', 'Recruit',
'serial', undef,
'unit', ['Training platoon'],
'duty', ['Basic training'],
);
5 函數
5.1 調用語法
調用時要使用圓括號,不管是否有參數。
正確:
fix();
coerce($input, $INTEGER, $ROUND_ZERO);
不是:
fix;
5.2 函數返回
在函數中要進行顯式的return返回。
正確:
sub set_terseness {
my ($terseness) = @_;
my $default_terseness = $terseness;
return; # Explicitly return nothing meaningful
}
不是:
sub set_terseness {
my ($terseness) = @_;
my $default_terseness = $terseness;
}
6 編程慣例
6.1 使用use strict
所有Perl Scripts 文件中必須在開始使用“use strict;”,進行嚴格的語法檢查,便于查找錯誤。
6.2 避免使用內部變量名稱
避免使用Perl內部變量。使用“use English;”裝入Perl內部變量的符號名稱。使用my來限定變量的作用域。下面是一些Perl內部變量名稱的對應關系。
$_ $ARG
@_ @ARG
$! $ERRNO
$? $CHILD_ERROR
$$ $PID
$0 $PROGRAM_NAME
$. $INPUT_LINE_NUMBER
$| $OUTPUT_AUTOFLUSH
$@ $EVEL_ERROR
$& $MATCH
$` $PREMATCH
$' $POSTMATCH
$+ $LAST_PAREN_MATCH
$/ $RS
$\ $ORS
$< $UID
$> $EUID
$( $GID
$) $EGID
$] $PERL_VERSION
$? $CHILD_ERROR
6.3 避免使用goto
避免使用goto語句(只有在從多重循環的內部跳出時才可以使用)。除非能夠特別有效的增加程序的效率并且不影響程序良好結構的特殊情況。
6.4 語法檢查(輔助工具)
使用-cw選項檢查Perl程序的語法。
正確:
perl -cw -Mdiagnostics file.pl # check syntax with warnings on
nt; # Perl 5.004_04, define constants
use Env; # instead of $ENV{'HOME'}; Shortens the usage, but do not
# mix normal variables
# with environment variables.
6.5 use Carp; # For modules: 使用標準模塊
盡量使用標準庫函數、公共函數和開發庫中已有的函數和模塊,使用FileHandle模塊來處理文件的讀寫。盡量使用以下的標準Perl模塊:
use strict; # helps you to locate syntax errors or uncertainties.
use integer; # if you don't need floating point math,it will speed Perl up.
use constagives you `carp' and `croak'
use English; # gives symbolic names, like $! ==> $ERRNO
use Getopt::Long; # --posix command line option handling
use Cwd; # platform independent cwd()
use File::Basename; # don't invent your own wheel of this.
use File::Find; # don't use system("find . -name ...")...
use File::copy; # don't use system("cp this that");
use File::patch; # instead of system("mkdir");
use File::stat; # readable: $st = stat($file), $st->mode
use DirHandle; # OO form of `readdir'
use Text::Tabs # un/expand tabs in text
use Text::ParseWords; # Parse text into tokens, understands embedded
# quotes. @a = "ewords("[ +]", 0, $_);
# a+b, "a b" + c
use Socket; # socket handling
use Sys::Hostname; # don't invent your own wheel
use Net::Ping # unix ping, check if host is online
use Time::Local # time manipulations
6.6 其他
1、編碼、測試、注釋,是程序員的三項基本工作,它們是同等重要的。
2、可靠性第一,可讀性第二,效率第三。只有在極個別必須強調效率的部分,可以是可靠性第一,效率第二,可讀性第三。
3、首先是正確,其次是優美。
4、無法證明你的程序沒有錯誤。因此,在新編寫完一段程序后,應該測試通過后再繼續編碼。
5、改正一個錯誤的同時,可能會引起新的錯誤。因此,在修改bug前,首先考慮對其他程序的影響。修改后,應該對程序進行完整的測試,而不是只對修改部分進行測試。
6、避免使用很多個參數的函數。
7、函數應該只有一個出口。
8、循環應該只有一個出口,避免多個出口。
9、盡量避免使用全局變量。
10、在盡可能小的作用域內定義和使用變量。
11、使用括號,表達復雜表達式中的操作符的優先順序。
12、循環、分支不要超過五個層次。
13、循環、分支等語句后,即使只有一行代碼時,也要使用{}將其括起來。
14、禁止else goto和else return。
15、重復使用的、完成相對獨立功能的算法、代碼,應該抽象為公共模塊。