每个文件都是有编码格式的

假设现在有一个几百兆的文件

假设现在有一个几百兆的文件，你想了解一下这个文件里有哪些数据，那么这个时候你就没必要把全部数据都导入，你只要看到前面几行即可，因此只要设置 nrows参数即可。

每个文件都是有编码格式的，常用的编码格式有utf-8和gbk等。有的时候两个文件看起来一样，它们的文件名一样，格式也一样，但如果它们的编码格式不一样，也是不一样的文件，比如当你把一个Excel文件另存为保存时会出现两个选项，虽然都是.csv文件，但是这两种格式代表两种不同的文件

Python用得比较多的两种编码格式是UTF-8和gbk，默认编码格式是UTF-8。我们要根据导入文件本身的编码格式进行设置，通过设置参数encoding来设置导入的编码格式。

如果我们不指定encoding参数默认是使用utf-8编码格式。

如果是CSV(逗号分隔) (*.csv)格式的文件，那么在导入的时候就需要把编码格式更改为gbk，如果使用UTF-8就会报错。

因为我们的表格中有中文，中文占用的字符和英文、数字占用的字符不一样，因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的，Jupyter 会自动渲染出一个表格，则无需这个设置。