Mar 29, 2009

Python 文字处理

Text Processing in Python

cmp() 比较两个 object,不同类型的 objects 也可以比较。
[].sort(), [].reverse() 并不返回一个新 list,而是在原 list 上操作。

文字处理:
lines = open(file).readlines() 读入每一行
line.split() 将每一行分割成单词

行处理也可以直接采用如下代码:
file=open('name')
for line in file:
    print line

除了 str 成员函数,还有 string module,大部分函数应该都有 str 成员函数。

排序两种方法:
1. [].sort(user defined cmp)
2.
  • 将 line 转换成可以自然排序的 sequence,一般可以用 tuple,比如按照第三个单词排序,则为 (line.split()[3],line)
  • 自然排序 [].sort()
  • 反转换
方法 2 比较好。

同时安装多个 python 版本,这是可以的。
在 windows 下: 安装的时候,不要选 registry,就可以了。不会有冲突。
当然只有一个默认的。
在linux下,同样可以有一个默认的,另一个可以命名为 python30 (针对 python 3.0)。这样可以分别执行。

0 comments: