SSL套接字上带有部分recv()的python select()的行为


问题内容

我创建了一个SSL套接字(服务器端),并将该套接字放入select()队列中。当套接字“准备好”可读取时,select()正确返回。

然后,我recv(1024)个字节。在某些情况下,这将获取所有数据,而在其他情况下,则可能不会。

但是,如果套接字缓冲区中仍然有数据(因为我没有全部接收recv()),并且我再次将该同一个套接字传递给select(),即使即使读取,它也 不会
返回为“准备就绪”我知道那里有数据。

我想我的问题是真的要从select()的角度确认什么是“待读”的真正含义,以及解决该问题的最佳方法是什么。鉴于我使用的是select(),继续执行recv()直到EWOULDBLOCK看起来有点破烂。

我在想这个吗?我意识到我可以使用更大的recv缓冲区,但是总有可能读取的内容比recv可以读取的更多-那么处理select()的“正确”方法是什么?

提前致谢。

编辑:正如评论中所述,我忽略了提及这是一个SSL服务器,并且在使用包装套接字时,显然select()的行为有所不同。


问题答案:

select从OS内核的角度来看,它只关心套接字的准备情况。那就是检查一个套接字是否准备好recv使用select仅检查套接字缓冲区中是否有数据。但是与SSL有所不同,因为涉及用户空间缓冲。

即使您仅从SSL套接字读取了几个字节,它也需要读取包含加密数据的完整SSL记录,解密完整记录,然后它可以返回您请求的几个字节。其余数据将在用户空间中缓冲,以备下次读取。但是,完整的SSL记录将从OS套接字缓冲区中删除,这意味着select可能无法向您显示仍然有可用数据。

有两种方法可以解决此问题。一种方法是使用暂挂方法从用户空间中找出仍然有缓冲的数据。另一种方法是始终recv以大块存储,这样就不会在用户空间中缓冲任何数据。由于SSL记录的最大大小为16k,并且每个记录recv仅处理一个SSL记录(openssl
SSL_read中的实现细节),因此始终可以调用recv大小至少为16384的文件。