pandas-dev · mroeschke · Sep 5, 2019 · Aug 30, 2019 · Aug 30, 2019 · Aug 30, 2019
diff --git a/asv_bench/asv.conf.json b/asv_bench/asv.conf.json
@@ -50,6 +50,7 @@
         "xlsxwriter": [],
         "xlrd": [],
         "xlwt": [],
+        "pip+odfpy": [],
         "pytest": [],
         // If using Windows with python 2.7 and want to build using the
         // mingw toolchain (rather than MSVC), uncomment the following line.

diff --git a/asv_bench/benchmarks/io/excel.py b/asv_bench/benchmarks/io/excel.py
@@ -2,30 +2,30 @@
 import numpy as np
 from pandas import DataFrame, date_range, ExcelWriter, read_excel
 import pandas.util.testing as tm
+from odf.opendocument import OpenDocumentSpreadsheet
+from odf.text import P
+from odf.table import Table, TableRow, TableCell
 
 
-class Excel:
+def _generate_dataframe():
+    N = 2000
+    C = 5
+    df = DataFrame(
+        np.random.randn(N, C),
+        columns=["float{}".format(i) for i in range(C)],
+        index=date_range("20000101", periods=N, freq="H"),
+    )
+    df["object"] = tm.makeStringIndex(N)
+    return df
+
+
+class WriteExcel:
 
     params = ["openpyxl", "xlsxwriter", "xlwt"]
     param_names = ["engine"]
 
     def setup(self, engine):
-        N = 2000
-        C = 5
-        self.df = DataFrame(
-            np.random.randn(N, C),
-            columns=["float{}".format(i) for i in range(C)],
-            index=date_range("20000101", periods=N, freq="H"),
-        )
-        self.df["object"] = tm.makeStringIndex(N)
-        self.bio_read = BytesIO()
-        self.writer_read = ExcelWriter(self.bio_read, engine=engine)
-        self.df.to_excel(self.writer_read, sheet_name="Sheet1")
-        self.writer_read.save()
-        self.bio_read.seek(0)
-
-    def time_read_excel(self, engine):
-        read_excel(self.bio_read)
+        self.df = _generate_dataframe()
 
     def time_write_excel(self, engine):
         bio_write = BytesIO()
@@ -35,4 +35,43 @@ def time_write_excel(self, engine):
         writer_write.save()
 
 
+class ReadExcel:
+
+    params = ["xlrd", "openpyxl", "odf"]
+    param_names = ["engine"]
+
+    def _generate_odf(self):
+        doc = OpenDocumentSpreadsheet()
+        table = Table(name="Table1")
+        for row in self.df.values:
+            tr = TableRow()
+            for val in row:
+                tc = TableCell(valuetype='string')
+                tc.addElement(P(text=val))
+                tr.addElement(tc)
+            table.addElement(tr)
+
+        doc.spreadsheet.addElement(table)
+
+        return doc
+
+    def setup(self, engine):
+        self.df = _generate_dataframe()
+
+        self.bio_read = BytesIO()
+        self.writer_read = ExcelWriter(self.bio_read)
+        self.df.to_excel(self.writer_read, sheet_name="Sheet1")
+        self.writer_read.save()
+        self.bio_read.seek(0)
+
+        self.bio_read_odf = BytesIO()
+        odf_doc = self._generate_odf()
+        odf_doc.write(self.bio_read_odf)
+        self.bio_read_odf.seek(0)
+
+    def time_read_excel(self, engine):
+        bio = self.bio_read_odf if engine == "odf" else self.bio_read
+        read_excel(bio, engine=engine)
+
+
 from ..pandas_vb_common import setup  # noqa: F401
diff --git a/doc/source/whatsnew/v0.25.2.rst b/doc/source/whatsnew/v0.25.2.rst
@@ -99,7 +99,7 @@ Other
 ^^^^^
 
 - Compatibility with Python 3.8 in :meth:`DataFrame.query` (:issue:`27261`)
--
+- Improved asv benchmark for reading excel files, it now runs for all supported engines 
 
 .. _whatsnew_0.252.contributors:
 

diff --git a/environment.yml b/environment.yml
@@ -80,4 +80,5 @@ dependencies:
   - xlrd  # pandas.read_excel, DataFrame.to_excel, pandas.ExcelWriter, pandas.ExcelFile
   - xlsxwriter  # pandas.read_excel, DataFrame.to_excel, pandas.ExcelWriter, pandas.ExcelFile
   - xlwt  # pandas.read_excel, DataFrame.to_excel, pandas.ExcelWriter, pandas.ExcelFile
+  - odfpy
   - pyreadstat  # pandas.read_spss
-Original file line number
+Diff line change
@@ Expand Up / @@ -99,7 +99,7 @@ Other @@
     ^^^^^
     - Compatibility with Python 3.8 in :meth:`DataFrame.query` (:issue:`27261`)
-    -
+    - Improved asv benchmark for reading excel files, it now runs for all supported engines
     .. _whatsnew_0.252.contributors:
@@ Expand Down @@