这篇文章主要是从原理 手册和源码分析在PHP中查询MySQL返回大量结果时 内存占用的问题 同时对使用MySQL C API也有涉及.
昨天 有同事在PHP讨论群里提到 他做的一个项目由于MySQL查询返回的结果太多(达10万条) 从而导致PHP内存不够用. 所以 他问 在执行下面的代码遍历返回的MySQL结果之前 数据是否已经在内存中了? -
在查看PHP和MySQL的源码之前 我注意到PHP手册里有两个功能相近的函数:
两个函数的字面意思和说明证实了我的想法 前一个函数执行时 会把所有的结果集从Server端读到Client端的缓冲区中 而后一个则没有 这就是”unbuffered(未缓冲)”的意思.
那就是说 如果用mysql_unbuffered_query()执行了一条返回大量结果集的SQL语句 在遍历结果之前 PHP的内存是没有被结果集占用的. 而用mysql_query()来执行同样的语句的话 函数返回时 PHP的内存占用便会急剧增加 立即耗光内存.
如果阅读PHP的相关代码 可以看到这两个函数的实现上的异同:
mysql_use_result()和mysql_store_result()是MySQL的C API函数 这两个C API函数的区别就是后者把结果集从MySQL Server端全部读取到了Client端 前者只是读取了结果集的元信息.
回到PHP 使用mysql_unbuffered_query() 可以避免内存的立即占用. 如果在遍历的过程不对结果进行”PHP缓存”(如放到某数组中) 则整个执行过程虽然操作了十万条或者百万条或者更多的数据 但PHP占用的内存始终是非常小的.
