python 3中的快速异或字节[重复]
问题内容:
这个问题已经在这里有了答案 :
简单的Python挑战:对数据缓冲区进行最快的按位异或 (11个答案)
6年前关闭。
我需要异或2个字节的对象。我使用以下代码:
def bxor(b1, b2): # use xor for bytes
result = b""
for b1, b2 in zip(b1, b2):
result += bytes([b1 ^ b2])
return result
当字节对象较小时,它可以正常工作,但是如果对大型对象(几个MB)进行异或运算,则将花费很长时间(几个小时)。我怎样才能使其更快?
问题答案:
当bytes
对每个具有一百万个元素的对象进行XOR运算时,此循环将创建大约一百万个临时bytes
对象,并将 每个 字节平均从一个临时对象复制到下
一个
字节大约50万次bytes
。请注意,字符串存在完全相同的问题(也存在许多其他语言)。弦乐解决方案是创建弦乐部件列表,并''.join
在最后使用它来有效地连接它们。您可以对字节执行相同的操作:
def bxor(b1, b2): # use xor for bytes
parts = []
for b1, b2 in zip(b1, b2):
parts.append(bytes([b1 ^ b2]))
return b''.join(parts)
或者,您可以使用bytearray
可变的a ,因此可以避免此问题。它还允许您不必bytes
在每次迭代中分配新对象,您只需追加byte
/即可int
。
def bxor(b1, b2): # use xor for bytes
result = bytearray()
for b1, b2 in zip(b1, b2):
result.append(b1 ^ b2)
return result
return bytes(result)
如果您想要/需要一个bytes
对象,也可以选择。