青岛中联优谷

如何使用Python(二)

2018-09-26

青岛网站建设
现在您已经拥有了一组Python工具,下一步是学习如何使用它们。您可能会花费大量时间与Pandas和SciKit-Learn合作,但这取决于您的具体需求。SciKit-Learn具有用于分类,回归,聚类,预处理和评估机器学习模型的机器学习包。如果您不熟悉机器学习,那么该文档包含教程和示例数据以帮助您。此外,SciKit-Learn提供了一系列广泛的类和方法,可以在相当高的水平上工作。
Pandas允许开发人员和分析人员使用表格或关系数据。数据帧结构是用于存储表格数据的基本构建块。它具有处理常见任务的功能,例如导入,合并,对齐和过滤数据。它还包括处理缺失数据的有用方法。
如果您需要在Python环境中使用统计测试和度量,您应该查看Statsmodel包。它包括对线性回归,离散选择模型,非参数估计器和其他统计函数的代码的支持。还支持与NumPy和Pandas共享文件。
设置完Python开发环境后,请确保将配置保存为Amazon Machine Image或AMI,以便重复使用。随着数据集的增长,您可能希望利用AWS EC2资源并在群集上运行应用程序。幸运的是,iPython旨在支持并行处理。