在Python 机器学习的开发环境搭建(numpy,scipy,matplotlib)一文中,介绍了使用python进行数据分析的工具安装,环境配置。下面分享具体使用
一、numpy
1、安装:pip install numpy命令
2、数据分析
import numpy as np np_height=np.array(height) np_height array([1.72,1.68,1.72]) np_weight=np.array(weight) np_weight array([55.1,65.0,55.9]) #要求array里都是同一类型数组 bmi=np_weight/np_height**2 bmi[] #可选取某个索引的计算结果 array([output]) bmi[bmi>23] #可选取计算结果大于某值 array([output])
可用于计算身高、体重两个数组的关系,并对计算结果进行筛选查看。处理数组的强大工具包。
3、注意
使用numpy要求array里的每一个元素都是同一数据类型,例如都为int 或者float才可进行处理。
二、matplotlib
1、安装
cd python/scripts安装路径,执行命令pip install matplotlib命令。
2、编写
import matplotlib.pyplot as plt year=[1991,1992,1993,1994] pop=[0.1,0.22,0.3,0.45] #折线图 plt.plot(year,pop) plt.show() #散点图 plt.scatter(year,pop) plt.show() #直方图 values=[0,0.1,0,0.9,0.8,0.6] plt.hist(values,bins=3) #设置图表信息 plt.xlable('年') plt.ylable('人口数量') plt.title('人口分布图') plt.yticks([0,2,4,6,8])