SSL套接字上带有部分recv()的python select()的行为
问题内容:
我创建了一个SSL套接字(服务器端),并将该套接字放入select()队列中。当套接字“准备好”可读取时,select()正确返回。
然后,我recv(1024)个字节。在某些情况下,这将获取所有数据,而在其他情况下,则可能不会。
但是,如果套接字缓冲区中仍然有数据(因为我没有全部接收recv()),并且我再次将该同一个套接字传递给select(),即使即使读取,它也 不会
返回为“准备就绪”我知道那里有数据。
我想我的问题是真的要从select()的角度确认什么是“待读”的真正含义,以及解决该问题的最佳方法是什么。鉴于我使用的是select(),继续执行recv()直到EWOULDBLOCK看起来有点破烂。
我在想这个吗?我意识到我可以使用更大的recv缓冲区,但是总有可能读取的内容比recv可以读取的更多-那么处理select()的“正确”方法是什么?
提前致谢。
编辑:正如评论中所述,我忽略了提及这是一个SSL服务器,并且在使用包装套接字时,显然select()的行为有所不同。
问题答案:
select
从OS内核的角度来看,它只关心套接字的准备情况。那就是检查一个套接字是否准备好recv
使用select仅检查套接字缓冲区中是否有数据。但是与SSL有所不同,因为涉及用户空间缓冲。
即使您仅从SSL套接字读取了几个字节,它也需要读取包含加密数据的完整SSL记录,解密完整记录,然后它可以返回您请求的几个字节。其余数据将在用户空间中缓冲,以备下次读取。但是,完整的SSL记录将从OS套接字缓冲区中删除,这意味着select
可能无法向您显示仍然有可用数据。
有两种方法可以解决此问题。一种方法是使用暂挂方法从用户空间中找出仍然有缓冲的数据。另一种方法是始终recv
以大块存储,这样就不会在用户空间中缓冲任何数据。由于SSL记录的最大大小为16k,并且每个记录recv
仅处理一个SSL记录(openssl
SSL_read中的实现细节),因此始终可以调用recv
大小至少为16384的文件。