在计算机世界里只有二进制。唯有人类才会对数据进行类型与价值判断。例如,认为某些文件是文本文件、是WORD/EXCEL文件或者是图片。对于加密算法来说也是一样的,加解密算法处理的只是字节流,根本不关心所谓的文件类型。对于文件来说,存在以下基本操作:
◆ open
◆ close
◆ read
◆ write
◆ delete
在Unix世界中,更是将文件这一概念发挥到极致,认为万物都是文件,都可以用基本类似的方式来打开,也就是所谓的原语。python也不例外,提供了内置的文件操作函数。下面的代码就演示了如何将word文档进行加密。假设我们用WORD文档写了一段文字,内容如下图所示。
这当然是一首曹操的名诗,我们使用AES算法来加解密。AES是一种十分成熟、安全、国际通用的对称密码的加密解密算法,供AES加密解密的重要参数就是密钥。这个密钥只是一个随机字符串,通常是128位或256位字长。AES加密解密所用的密钥与其它密码算法没有任何区别。废话不说,直接上代码。
import os import struct from Crypto.Cipher import AES from Crypto.Util.Padding import pad, unpad defaultsize = 64*1024 def encrypt_file(key, in_filename, out_filename=None, chunksize=defaultsize): """ 对文件进行加密 Args: key (str): 16字节密钥 in_filename (str): 待加密文件 out_filename (str, optional): 加密后输出的文件 chunksize (int, optional): 块大小,缺省64k """ if not out_filename: out_filename = in_filename + '.enc' iv = os.urandom(16) encryptor = AES.new(key, AES.MODE_CBC, iv) filesize = os.path.getsize(in_filename) with open(in_filename, 'rb') as infile: with open(out_filename, 'wb') as outfile: outfile.write(struct.pack('<Q', filesize)) outfile.write(iv) pos = 0 while pos < filesize: chunk = infile.read(chunksize) pos += len(chunk) if pos == filesize: chunk = pad(chunk, AES.block_size) outfile.write(encryptor.encrypt(chunk)) def decrypt_file(key, in_filename, out_filename=None, chunksize=defaultsize): """ 解密文件 Args: key (str): 16字节密钥 in_filename (str): 待解密文件 out_filename (str, optional): 解密后输出的文件 chunksize (int, optional): 块大小,缺省64K """ if not out_filename: out_filename = in_filename + '.dec' with open(in_filename, 'rb') as infile: filesize = struct.unpack('<Q', infile.read(8))[0] iv = infile.read(16) encryptor = AES.new(key, AES.MODE_CBC, iv) with open(out_filename, 'wb') as outfile: encrypted_filesize = os.path.getsize(in_filename) pos = 8 + 16 # the filesize and IV. while pos < encrypted_filesize: chunk = infile.read(chunksize) pos += len(chunk) chunk = encryptor.decrypt(chunk) if pos == encrypted_filesize: chunk = unpad(chunk, AES.block_size) outfile.write(chunk) # 密钥,随便写,使用时只使用前16字节 key = 'stayhungrystayfoolish' def test_enc(): sourcefilename=r'../resources/神龟虽寿.docx' encrypt_file(key[:16].encode('utf-8'), sourcefilename) def test_dec(): sourcefilename=r'../resources/神龟虽寿.docx.enc' targetfilename=r'../resources/decrypt.docx' decrypt_file(key[:16].encode('utf-8'), sourcefilename,out_filename=targetfilename) if __name__ == '__main__': test_enc() test_dec()
我们这里使用128位密钥进行加解密,加密后的文件微软的WORD也打不开,内部结构已经完全改变,而解密后文件与原文档没有区别。从代码可以看出,本文提供的对文件的加解密与文件类型没有关系,完全可以用此算法对音乐、视频等进行加解密,如果再配合使用QT等开发工具,可以进一步升级为易于使用的GUI界面的文件加解密器。补充一点,上述的加解密算法库需要安装对应的包,使用以下命令即可。
pip install PyCryptodome