用Python读写二进制文件
问题内容:
以下代码似乎无法正确读取/写入二进制形式。它应该读取一个二进制文件,对数据按位进行XOR,然后将其写回到文件中。没有任何语法错误,但是数据无法验证,我已经通过另一工具测试了源数据以确认xor键。
更新 :根据评论中的反馈,这很可能是由于我正在测试的系统的字节顺序造成的。
def four_byte_xor(buf, key):
out = ''
for i in range(0,len(buf)/4):
c = struct.unpack("=I", buf[(i*4):(i*4)+4])[0]
c ^= key
out += struct.pack("=I", c)
return out
调用xortools.py:
from xortools import four_byte_xor
in_buf = open('infile.bin','rb').read()
out_buf = open('outfile.bin','wb')
out_buf.write(four_byte_xor(in_buf, 0x01010101))
out_buf.close()
看来我需要每个答案读取字节。当上面的函数处理多个字节时,上面的函数将如何并入以下内容?还是没关系?我需要使用struct吗?
with open("myfile", "rb") as f:
byte = f.read(1)
while byte:
# Do stuff with byte.
byte = f.read(1)
例如,以下文件具有4个重复字节01020304:
使用键01020304对数据进行XOR运算,该键将原始字节清零:
这是原始功能的尝试,在这种情况下05010501是不正确的结果:
问题答案:
试试这个功能:
def four_byte_xor(buf, key):
outl = []
for i in range(0, len(buf), 4):
chunk = buf[i:i+4]
v = struct.unpack(b"=I", chunk)[0]
v ^= key
outl.append(struct.pack(b"=I", v))
return b"".join(outl)
我不确定您是否实际将输入减少了4个字节,但是我没有尝试解密它。假设您的输入可被4整除。
编辑,基于新输入的新功能:
def four_byte_xor(buf, key):
key = struct.pack(b">I", key)
buf = bytearray(buf)
for offset in range(0, len(buf), 4):
for i, byte in enumerate(key):
buf[offset + i] = chr(buf[offset + i] ^ ord(byte))
return str(buf)
这可能会得到改善,但是确实提供了正确的输出。