- 前言:
很多时候,因为数据统计,我们需要将数据库的数据导出到Excel等文件中,以供数据人员进行查看,如果数据集不大,其实很容易;但是如果对于大数集的导出,将要考虑各种性能的问题,这里以导出数据库一百万条数据为例,导出时间不过20秒,值得学习的一种大数据导出方式。
2.导出思路
需要考虑服务器内存
需要考虑程序运行的最大时间
缺少BOM头导致乱码的处理
如果导出数量过大,推荐使用循环导出,每次循环这里以导出一万条为例,循环100次即可全部导出
3.导出源码
下面源码将数据库信息修改成自己的即可使用
亲测导出一百万条数据,3个字段,不过20秒
如果服务器硬件不支持一次读取一万条数据,可将循环次数提高,导出数量降低
//让程序一直运行
set_time_limit(0);
//设置程序运行内存
ini_set('memory_limit', '128M');
$fileName = '测试导出数据';
header('Content-Encoding: UTF-8');
header("Content-type:application/vnd.ms-excel;charset=UTF-8");
header('Content-Disposition: attachment;filename="' . $fileName . '.csv"');
//打开php标准输出流
$fp = fopen('php://output', 'a');
//添加BOM头,以UTF8编码导出CSV文件,如果文件头未添加BOM头,打开会出现乱码。
fwrite($fp, chr(0xEF).chr(0xBB).chr(0xBF));
//添加导出标题
fputcsv($fp, ['姓名', '年龄', '地区']);
//链接数据库
//$dsn = "mysql:host=127.0.0.1;port=3306;dbname=db_www;charset=utf8";
//$pdo = new \PDO($dsn, 'root', '');
$step = 100; //循环次数
$nums = 10000; //每次导出数量
$result = [];
for ($i=0;$i <= $nums;$i++){
$r=[];
$r['uname']=rand_code(4);
$r['age']=mt_rand(18,60);
$r['city']=rand_code(4);
$result[]=$r;
}
for($i = 0; $i < $step; $i++) {
//$start = $i * 10000;
//$sql = "SELECT uname,age,city FROM `hd_test` ORDER BY `id` LIMIT {$start},{$nums}";
//$pdostatement = $pdo->query($sql);
//$result = $pdostatement->fetchAll(\PDO::FETCH_ASSOC);
foreach ($result as $item) {
fputcsv($fp, $item);
}
//每1万条数据就刷新缓冲区
ob_flush();
flush();
}
4.快速生成百万条测试数据
这里推荐数据库的蠕虫复制命令
先建好表后,插2条测试数据后,执行几次下列命令,即可指数增长
INSERT INTO hd_test (uname,age,city) SELECT uname,age,city FROM hd_test;