statsmodels.datasets.get_rdataset

statsmodels.datasets.get_rdataset(dataname, package='datasets', cache=False)[source]

下载并返回 R 数据集

参数:
datanamestr

您要下载的数据集的名称

packagestr

包含数据集的包。默认情况下是核心“datasets”包。

cachebool or str

如果为 True,则将此数据下载到 STATSMODELS_DATA 文件夹。默认位置是用户主文件夹中名为 statsmodels_data 的文件夹。否则,您可以指定要用于缓存数据的文件夹的路径。如果为 False,则不会缓存数据。

返回值:
datasetDataset

一个 statsmodels.data.utils.Dataset 实例。此对象具有以下属性:

  • data - 包含数据的 pandas DataFrame

  • title - 数据集标题

  • package - 数据来源的包

  • from_cache - 是否检索了缓存数据

  • __doc__ - R 文档的逐字内容。

备注

如果 R 数据集具有整数索引。这将重置为以零为基准。否则,将保留索引。缓存功能很笨拙。也就是说,不会检查任何下载日期、e 标记或其他识别信息以查看是否应再次下载数据。如果数据集在缓存中,则会使用它。


最后更新:2024 年 10 月 3 日