刻意练习9:《谁说菜鸟不会数据分析python篇》第3章编程基础总计46页学习笔记

原创 数据小兵  2019-08-10 19:20  阅读 80 次
视频课程《SPSS统计分析:从入门到实践提高》

学习计划MyPlan9

主题:《谁说菜鸟不会数据分析python篇》第3章节 编程基础,总计46页。

时间:7.15-7.21

周内完成 各位星友们,在这个星球里每个人都要逼迫自己学习未知的领域或知识点,每天进步一点点,积累的时间久了 ,菜鸟也能起飞。

完成情况

模块
后缀.py的文件,称为模块。例如,abc.py。
同R语言中的R包,package。

import math
math.pi
math.sqrt(4)

不同模块中可能存在相同名称的函数,因此要加模块名。

数据类型

常用数据类型有三种:

数值型numeric
字符型character
逻辑型logical

x=1
y=2
x+y

x='数据小兵学Python'

字符串截取
'13800138000'[0:3]

赋值

Python使用等号来赋值,

r=123*321
r
print(r)

数据结构

逻辑型、字符型、数值型,都是独立的,现实中,许多数据是以集合形式出现,数据集的形式。
一种或多种特定关系的数据元素的集合,称之为数据结构。

常用数据结构:

列表list
字典dictionary
序列series
数据框dataframe

数据框是pandas模块中的数据结构。

列表list

age=[21,22,23,24,25]
name=['ken','joh','jim']

age[0:2]
age[0]
name[2]

字典dictionary

字典由键key和值value成对组成。

空字典
data={}
data

data={
'name':['ken','joh','jim'],
'age':[21,22,23]
}
data
​​

字典的访问

data['name']
['ken', 'joh', 'jim']

查看字典所有的键值
data.keys()
结果:
dict_keys(['name', 'age'])

数据框dataframe

Excel和SPSS中应用最多的就是数据框类型。
在Python中,数据框有索引列,每一行都有对应的索引,默认索引从0开始。

通过pandas模块dataframe函数定义数据框。

import pandas

dataframe=pandas.DataFrame(
data={
'name':['ken','joh','jim'],
'age':[21,22,23]
}
)

直接执行dataframe即可查看数据框数据。

向量运算

import pandas

data=pandas.DataFrame(
data={'A':[1,3,5,7,9]}
)

data['B']=data.A.pow(2)

本文地址:http://www.datasoldier.net/archives/1391
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!