
С периодичностью раз в два-три года сталкиваюсь с проектами, в которых опять нужно работать с Excel файлами.
Наверно это у меня что-то кармическое…
Сейчас, в очередной раз приходиться реализовать полуавтоматический разбор сотен excel-файлов с прайсами.
В прошлых своих проектах использовал JExcelApi.
Ничего плохого про эту библиотеку сказать не могу, но хочется какого-то разнообразия в жизни поэтому в этот раз с товарищем решили попробовать Apache POI.
Apache POI поддерживает как формат для обычных *.xls файлов (HSSF) так и *.xlsx файлы (XSSF).
Кстати, формат для *.xls файлы в Apache POI они обзывают «HSSF — Horrible SpreadSheet Format», то есть «Вселяющий ужас формат для электронных таблиц».
Для того, чтобы приступить к работе, как обычно прописываем зависимости в pom.xml:
org.apache.poi
poi
3.7
Для примера, приведу очень простой файл — список ФИО, сумма + Итог:

Если нужно просто вытащить текст, можно использовать «класс-извелкатель»: ExcelExtractor (далее…)