[PHP] Spout을 이용한 엑셀 파일 데이터 읽기
그간 엑셀파일의 데이터을 읽어 처리하기 위해 PHPExcel을 사용했는데, PHPExcel 의 경우 용량이 큰 파일의 경우 처리가 되지 않거나 속도가 느린 점이 있어 Spout 를 사용해보게 됐다. 일단 사용 결과는 대 만족이다. PHPExcel 에서는 처리되지 않던 파일도 무난하게 처리가 됐고 속도도 엄청 향상됐다. 더구나 PHPExcel 은 개발이 중단된 상태이기도 하다.
개발환경이 PHP 5.6.x 버전이라서 최신 버전의 Spout를 사용할 수는 없었고 5.4 버전 이상부터 지원하는 2.7.3 버전을 사용했다. 설치를 위해 프로젝트의 composer.json
파일에 아래 내용을 추가 후 설치를 진행했다.
"box/spout": "2.7.3"
실제 엑셀파일의 데이터를 읽어들이는 코드는 아래와 같다.
<?php
ini_set('memory_limit', '-1');
ini_set('max_execution_time', '0');
$file = __DIR__.'/patent.xlsx';
use Box\Spout\Reader\ReaderFactory;
use Box\Spout\Common\Type;
$reader = ReaderFactory::create(Type::XLSX);
$reader->open($file);
foreach ($reader->getSheetIterator() as $sheet) {
//if ($sheet->getIndex() > 0)
// break;
foreach ($sheet->getRowIterator() as $row) {
print_r($row);
}
}
$reader->close();
만약 composer 를 사용하지 않고 직접 Spout 를 설치해서 사용하는 경우 아래와 같이 Autoload 관련 파일을 로드하는 코드를 추가해줘야 한다.
require_once '[PATH/TO]/src/Spout/Autoloader/autoload.php';
데이터를 DB에 입력하는 등의 처리는 print_r($row);
대신 해당 처리 코드를 추가해주면 된다. 만약 엑셀파일에 여러 개의 sheet 가 있을 때 첫 번째 sheet 만 처리하는 경우 예시 코드 중 아래 코드의 주석을 해제해주면 된다.
//if ($sheet->getIndex() > 0)
// break;
Spout 는 PHPExcel 에 비해 제공되는 API 등이 많지 않기 때문에 불편할 수도 있으나 큰 파일의 엑셀 파일을 처리해야할 경우는 꼭 사용할 수 밖에 없을 것으로 생각된다.