用Python读写二进制文件

问题内容：

以下代码似乎无法正确读取/写入二进制形式。它应该读取一个二进制文件，对数据按位进行XOR，然后将其写回到文件中。没有任何语法错误，但是数据无法验证，我已经通过另一工具测试了源数据以确认xor键。

更新：根据评论中的反馈，这很可能是由于我正在测试的系统的字节顺序造成的。

def four_byte_xor(buf, key):
    out = ''
    for i in range(0,len(buf)/4):
        c = struct.unpack("=I", buf[(i*4):(i*4)+4])[0]
        c ^= key
        out += struct.pack("=I", c)
    return out

调用xortools.py：

from xortools import four_byte_xor
in_buf = open('infile.bin','rb').read()
out_buf = open('outfile.bin','wb')
out_buf.write(four_byte_xor(in_buf, 0x01010101))
out_buf.close()

看来我需要每个答案读取字节。当上面的函数处理多个字节时，上面的函数将如何并入以下内容？还是没关系？我需要使用struct吗？

with open("myfile", "rb") as f:
    byte = f.read(1)
    while byte:
        # Do stuff with byte.
        byte = f.read(1)

例如，以下文件具有4个重复字节01020304：

异或之前

使用键01020304对数据进行XOR运算，该键将原始字节清零：

异或后

这是原始功能的尝试，在这种情况下05010501是不正确的结果：

错误的XOR尝试

问题答案：

试试这个功能：

def four_byte_xor(buf, key):
    outl = []
    for i in range(0, len(buf), 4):
        chunk = buf[i:i+4]
        v = struct.unpack(b"=I", chunk)[0]
        v ^= key
        outl.append(struct.pack(b"=I", v))
    return b"".join(outl)

我不确定您是否实际将输入减少了4个字节，但是我没有尝试解密它。假设您的输入可被4整除。

编辑，基于新输入的新功能：

def four_byte_xor(buf, key):
    key = struct.pack(b">I", key)
    buf = bytearray(buf)
    for offset in range(0, len(buf), 4):
        for i, byte in enumerate(key):
            buf[offset + i] = chr(buf[offset + i] ^ ord(byte))
    return str(buf)

这可能会得到改善，但是确实提供了正确的输出。

用Python读写二进制文件

微信关注