翻译 | 30个 Python3 的最佳实践,技巧和窍门

1、使用 Python3

如果你关注 Python 的话,应该会知道 Python 2 已经于今年(2020 年)1 月 1 日正式弃用了。这份教程的很多例子都是只支持 Python 3 的,如果你还在用 Python 2.1,那也是时候与时俱进了。

2、检查所需的最低 Python 版本

你可以在代码中先检查一下你的 Python 版本,以免当前用户的 Python 版本与你的脚本不适配。实现的代码很简单:

if not sys.version_info > (2, 7):
   # berate your user for running a 10 year
   # python version
elif not sys.version_info >= (3, 5):
   # Kindly tell your user (s)he needs to upgrade
   # because you're using 3.5 features

3. Use IPython

翻译 | 30个 Python3 的最佳实践,技巧和窍门

IPython 其实就是升级版的 shell,单单是自带的自动补全功能就值得你使用它了。不过它的优势不止这些,它那些如魔法般的内置命令行也让是我爱使用它的原因。这些命令有:

  • %cd—修改当前工作路径
  • %edit—打开编辑器,并在关闭时执行你刚刚输入的代码
  • %env—显示当前环境变量
  • %pip install [pkgs]—在不离开 Shell 的情况下安装包
  • %time and %timeit—为 Python 代码计时

如果你想了解更多的命令,可以参考这个网站:

https://ipython.readthedocs.io/en/stable/interactive/magics.html。

还有一个有用的功能就是调取之前的命令输出,这里的输入和输出其实都是对象。例如,你可以用 Out[3] 来调取第三条命令的输出。

你可以用下面这条命令安装 IPython:

pip3 install ipython

4、列表表达式

有了列表表达式,你就不再需要用 for loop 来生成一个 list 了。其基本语法是这样的:

[ expression for item in list if conditional ]

这就是一个生成包含一串数字的 list 的简单例子。

mylist = [i for i in range(10)]
print(mylist)
# 0 1 2 3 4 5 6 7 8 9 

在这条命令里还可以使用表达式(expression),所以也可以做一些数学运算:

squares = [x**2 for x in range(10)]
print(squares)
# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

你甚至可以调用一个外部函数:

def some_function(a):
    return (a + 5) / 2
    
my_formula = [some_function(i) for i in range(10)]
print(my_formula)
# [2.5, 3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0]

最后,你也可以在生成 list 时用 if 语句进行筛选。下面这个例子中,我们只保留了能被 2 整除的值:

filtered = [i for i in range(20) if i%2==0]
print(filtered)
# [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

5、检查你的对象占用了多少内存

你可以使用 sys.getsizeof() 来查看你创建的对象占用的内存大小:

import sys

mylist = range(0, 10000)
print(sys.getsizeof(mylist))
# 48

哇,等一下,为什么这么大的 list 只有 48 字节?

这是因为 range 函数只返回了一个类似 list 的类。由此可见,相较于直接使用 list,使用 range 能节省很多空间:

import sys

myreallist = [x for x in range(0, 10000)]
print(sys.getsizeof(myreallist))
# 87632

6、返回多个值

Python 的函数可以同时返回多个值,也并不需要使用 dictionary,list 或是类这样的数据结构。它的工作机制是这样的

def get_uset(id):
    # 从数据库中获取用户
    # ...
    return name,birthdate

name,birthdate = get_user(4)

这种方式在返回值的数量很少时是可以的,但是如果返回值超过 3 个,那它们就该被放到一个(数据)类中了。

7、使用 数据类

Python 从 3.7 开始提供数据类功能。这种功能与常规的类以及其他类似的功能(返回多个值的函数以及 dictionary)相比较,有以下优势:

  • 数据类型有最低代码量要求
  • 因为数据类已经自带了__eq__功能,故而你可以直接进行数据类的对比
  • 数据类自带__repr__,你也可以直接在 debug 时打印出一个数据类
  • 数据类型需要你输入提示,这样 bug 量会大大减少

下面展示了一个实用的数据类例子:

from dataclasses import dataclass

@dataclass
class Card:
    rank: str
    suit: str
    
card = Card("Q", "hearts")

print(card == card)
# True

print(card.rank)
# 'Q'

print(card)
Card(rank='Q', suit='hearts')

想更深入的了解数据类,可以参考:https://realpython.com/python-data-classes/

8、在位置不变的情况下交换变量

一个小技巧就可以减少很多行代码:

a = 1
b = 2
a, b = b, a
print(a)
# 2
print(b)
# 1

9、合并 dictionary(Python 3.5+)

从 Python 3.5 开始,dictionary 的合并变得更容易了:

dict1 = { 'a': 1, 'b': 2 }
dict2 = { 'b': 3, 'c': 4 }
merged = { **dict1, **dict2 }
print (merged)
# {'a': 1, 'b': 3, 'c': 4}

如果有重复的 key,那么第一个词典的这个 key 对应的值会被覆盖掉。

10、把字符串变成标题形式

这只是 Python 中的宝藏之一:

mystring = "10 awesome python tricks"
print(mystring.title())
'10 Awesome Python Tricks'

11、把字符串分割成 list

你可以把一个字符串分割成一个 list 的字符串。下面的例子中,我们是按照空格分割字符串的:

mystring = "The quick brown fox"
mylist = mystring.split(' ')
print(mylist)
# ['The', 'quick', 'brown', 'fox']

12、将一个字符串列表变成字符串

把上一个小技巧反过来,我们也可以把一个 list 变成一个字符串,并在每个词中间插入空格:

mylist = ['The', 'quick', 'brown', 'fox']
mystring = " ".join(mylist)
print(mystring)
# 'The quick brown fox'

你可能在想为什么不用

mylist.join(" ")

好问题!

这是因为 String.join() 可以连接任何可迭代对象,不只是列表。在 String 中用这个函数可以防止这些操作发生在我们不想他发生的地方。

13、Emoji

这个功能有些人喜欢,有些人则很抗拒,因人而异。严格来说,这个功能主要好处就是在分析社交数据时可以更加方便。

首先,你要安装 emoji 模块:

pip install emoji

安装完后,你可以像下面这样使用这个模块:

import emoji
result = emoji.emojize('Python is :thumbs_up:')
print(result)
# 'Python is '

# You can also reverse this:
result = emoji.demojize('Python is ')
print(result)
# 'Python is :thumbs_up:'

想要更深入的了解 emoji 模块,可以参考:https://pypi.org/project/emoji/。

14、list 切片 (重要)

list 切片的基本使用形式如下:

a[start:stop:step]

Start, Stop 和 Step 都是可选参数。如果你没有定义,它们就会按照如下规则分配默认值:

  • start = 0
  • end = 方括号里面字符串的最后一个字符
  • step = 1
# 我们可以轻松地从创建新列表
# 列表的前两个元素:
first_two = [1, 2, 3, 4, 5][0:2]
print(first_two)
# [1, 2]

# 如果我们使用 step 值为2,
# 我们可以跳过第二个数字
# like this:
steps = [1, 2, 3, 4, 5][0:5:2]
print(steps)
# [1, 3, 5]

# 这也适用于字符串。 在Python中,
# 您可以将字符串视为
# letters:
mystring = "abcdefdn nimt"[::2]
print(mystring)
# 'aced it'

15、翻转字符串和 list

你可以用刚刚提到的切片操作来翻转字符串和 list。把 step 设置成-1,就成完成翻转操作:

revstring = "abcdefg"[::-1]
print(revstring)
# 'gfedcba'

revarray = [1, 2, 3, 4, 5][::-1]
print(revarray)
# [5, 4, 3, 2, 1]

16、展示小猫的图片

我终于还是发现了一个可以在我文章中提到小猫的机会!当然,你也可能是用这个功能来展示其他的图。首先,你要安装 Pillow,这是 Python Image 库的一个分支:

pip3 install Pillow

现在把这个图像下载下来并命名为 kittens.jpg:

翻译 | 30个 Python3 的最佳实践,技巧和窍门

你可用下面这段 python 代码来显示图像。

from PIL import Image

im = Image.open("kittens.jpg")
im.show()
print(im.format, im.size, im.mode)
# JPEG (1920, 1357) RGB

或者你可以直接在 IPython 上做这件事。

翻译 | 30个 Python3 的最佳实践,技巧和窍门

Pillow 能做的可不止这些。它可以对图片进行分析、裁剪、过滤、增强、变形等等。如果想要更深入的了解,可以去看一下它的文档:

https://pillow.readthedocs.io/en/stable/

17、使用  map()

Python 的内置函数之一就是 map()。map() 的语法如下:

所以你可以给它一个函数让其执行,然后还要传给它对应的参数。这个参数可以使任何可迭代对象。下面的例子里我用了 list:

def upper(s):
    return s.upper()
    
mylist = list(map(upper, ['sentence', 'fragment']))
print(mylist)
# ['SENTENCE', 'FRAGMENT']

# 转换的字符串表示形式
# 整数列表中的数字。
list_of_ints = list(map(int, "1234567")))
print(list_of_ints)
# [1, 2, 3, 4, 5, 6, 7]

快去看看你的代码,是不是有的地方可以用 map() 而不是 loop!

18、从 list 或是 string 中获取 unique 元素

你可以用 set() 来获取 list 或是类似于 list 的对象的 unique 元素,结果返回为一个 set。

mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
print (set(mylist))
# {1, 2, 3, 4, 5, 6}

# 由于字符串可以被视为
# 字母列表,您还可以通过以下方式从字符串中获取唯一字母:
print (set("aaabbbcccdddeeefff"))
# {'a', 'b', 'c', 'd', 'e', 'f'}

19、找到高频值

test = [1, 2, 3, 4, 2, 2, 3, 1, 4, 4, 4]
print(max(set(test), key = test.count))
# 4

在 list 或字符创中获取高频值:

  • max() 会返回 list 中的最高值。而 key 可以利用一个输入(如本例中的 test.count)来确定你要排序的方式。这个函数会应用于前面可迭代对象的每一项。
  • test.count 是 list 的内置函数。我们给它一个输入,它会统计那个输入的出现次数。test.count(1) 就会返回 2,test.count(4) 就会返回 4。
  • set(test) 会返回 unique 值,也就是 {1, 2, 3, 4}

所以这一行代码所做的事就是先找到所有的 unique 值({1, 2, 3, 4}),然后 max 就会对这四个值分别进行 list.count 操作,并返回最大值。

20、创建进度条

你可以创建你自己的进度条,也是很有意思的。但是直接使用 progress 包会快很多:

pip3 install progress

现在你可以毫不费力的创建一个进度条了:

from progress.bar import Bar

bar = Bar('Processing', max=20)
for i in range(20):
    # Do some work
    bar.next()
bar.finish()

翻译 | 30个 Python3 的最佳实践,技巧和窍门

21、在交互 shell 中使用「_」

你可以用下划线来获得上一条命令的输入,在 IPython 中是这样的:

In [1]: 3 * 3
Out[1]: 9
In [2]: _ + 3
Out[2]: 12

Python shell 中这条命令也可以用。IPython shell 中你也可以用 Out[n] 来获得 In[n] 的输出。比如说,在上面的例子中,Out[1] 就会返回 9。

22、快速创建一个网页服务器

你可以快速创建一个网页服务器,并将当前的路径作为内容:

python3 -m http.server

如果你想跟你的同事分享一些东西,或者测试一些简单的 HTML 网站,那这条命令就很有用了。

23、多行字符串

尽管你可以在代码中用三重引号(“ “ “ ” ” ”)来存储多行字符串,但这并不是理想的方法。你在三重引号间的所有内容都变成了字符串,如下图所示,连格式符都变成了字符串。

我比较倾向于使用第二种方式。这种方式可以把很多行合并到一起,同时你的代码格式也会很好。这个方法唯一的缺点就是你要明确定义换行的位置。

s1 = """Multi line strings can be put
        between triple quotes. It's not ideal
        when formatting your code though"""

print (s1)
# Multi line strings can be put
#         between triple quotes. It's not ideal
#         when formatting your code though
        
s2 = ("You can also concatenate multiple\n" +
        "strings this way, but you'll have to\n"
        "explicitly put in the newlines")

print(s2)
# You can also concatenate multiple
# strings this way, but you'll have to
# explicitly put in the newlines

24、条件赋值的三元运算符

这是那些让你代码在保证可读性的情况下更简洁的方法之一:

[on_true] if [expression] else [on_false]

实例如下:

x = "Success!" if (y == 2) else "Failed!"

25、统计出现数

你可以使用 collection 库来获得 list 中各个 unique 值的计数,并返回成一个 dictionary:

from collections import Counter

mylist = [1, 1, 2, 3, 4, 5, 5, 5, 6, 6]
c = Counter(mylist)
print(c)
# Counter({1: 2, 2: 1, 3: 1, 4: 1, 5: 3, 6: 2})

# 它也适用于字符串:
print(Counter("aaaaabbbbbccccc"))
# Counter({'a': 5, 'b': 5, 'c': 5})

26、比较符链(chaining of comparison operators)

Python 里,你可以把比较符连接成一条链,这样代码会更有可读性,而且更简洁。

x = 10

# 代替:
if x > 5 and x < 15:
    print("Yes")
# yes

# You can also write:
if 5 < x < 15:
    print("Yes")
# Yes

27、加一些色彩

Colorama 中 Jonathan Hartley 的截屏

from colorama import Fore, Back, Style

print(Fore.RED + 'some red text')
print(Back.GREEN + 'and with a green background')
print(Style.DIM + 'and in dim text')
print(Style.RESET_ALL)
print('back to normal now')

28、日期计算

python-dateutil 模块对标准的 datatime 模块做了很大的扩充。先下载一下这个模块:

pip3 install python-dateutil

你可以用这个库做很多很酷的事情。我只会给你们介绍我发现的很有用的一个例子:日志文件中日期的模糊解析等。

from dateutil.parser import parse

logline = 'INFO 2020-01-01T00:00:01 Happy new year, human.'
timestamp = parse(logline, fuzzy=True)
print(timestamp)
# 2020-01-01 00:00:01

记住一点:基本的 Python 日期函数对一些问题束手无策的时候,这时 python-deteutil 就能发挥作用。

29、整除

Python 2 中,除号(/)默认为整除,除非其中一个被操作数是浮点数。所以你会得到这样的结果:

# Python 2
5 / 2 = 2
5 / 2.0 = 2.5

在 Python 3 中,除号的结果默认为浮点数,而//则成为了整除的符号,所以这个时候结果变成了:

Python 3
5 / 2 = 2.5
5 // 2 = 2

如果想要深入了解这一改变,请参考:https://www.python.org/dev/peps/pep-0238/。

30、使用 chardet 检测 Charset

你可以使用 chardet 模块来检测一个文件的 charset。当你在分析大量的文本时,这个模块就会变得很有用。你可以用下面这条命令下载它:

pip install chardet

你现在会有一个命令行工具——chardetect,这个工具的使用方式是:

chardetect somefile.txt
somefile.txt: ascii with confidence 1.0

你可以以在程序中使用这个库,详见:

https://chardet.readthedocs.io/en/latest/usage.html

这就是 30 Python Best Practices, Tips, And Tricks 的全部翻译啦!希望大家喜欢这些技巧!

另外翻译不易,可以的话棒博主点个赞吧,提前感谢!!

发表评论

评论已关闭。

相关文章