由于pandas库改了,没有read_parq这个函数了
所以parq读取的方法变成了:
(1)用conda或者pip安装pyarrow包
pip install pyarrow
(2)导入pyarrow包
import pyarrow as paimport pyarrow.parquet as pq
(3)读取
df = pq.read_table(u'parq文件的路径').to_pandas()
最后df就是以前pandas情况下读到的parq文件(Dataframe格式)