大概就是用R来搞经济学,用Python玩爬虫,用SAS处理数据?
终于蹭上了我想要的编程课,顺便把一元和多元回归学精!
用Python来搞计量经济学的配套书。迷,我先看看理论吧。
Using Python for Introductory Econometrics
UPfIE
捯饬半天找好资料之后被数据集卡住,下载的本地数据集我把Variable Name和Data file分装两个文件,我不会合并路♂️,最后成功用包导入, perfect!
如何在Stata/Python/R中简单快速读地取伍德里奇《计量经济学导论》中的数据集? - 知乎
1、调用module:library(wooldridge)
2、导入数据
> df_wage1 <- wooldridge::wage1
> View(df_wage1)
3.导入数据后还需要看要分析哪个表就attach()
Q1
attach(wage1) #绑定数据 wage1> mean(educ) #求均值[1] 12.56274> min(educ) #求最小值[1] 0> max(educ) #求最大值[1] 18> summary(educ) #一次性得以上描述性统计量 Min、1st Qu、 Median Mean 3rd Qu、 Max、 0.00 12.00 12.00 12.56 14.00 18.00 > 184/56.9* mean(wage) #用2003年美元度x平均小时工资[1] 19.06648> sum(female)[1] 252> length(female)-sum(female) #length() indicates the number of indicators[1] 274
#R和Python对大小写都这么严格 view 不给我看.
Q2
#I think it is unnecessarymd.pattern(bwght) #我们发现缺失值 多 且缺失值分在的不同变 中 我们 用一种更方便的方法审 缺失值。mice包中的md.pattern()函数 够轻松实现 一功 。 参 《R 实战》第一版320页 。 回的结果告 我们在fatheduc变 上有缺失值的 测有196个 在motheduc上有缺失值的 测有1个。> length(fatheduc) [1] 1388# 由于 数据 中的 测是妇女的宝宝的情况 所以一个 测对应着一名妇女。我们只 意取一个变 测 其 测值数 即可。值得一提的是 缺失值仍然会 算为一个 测。例如fatheduc中有196个缺失值 faminc中没有缺失值 但length(fatheduc)> table(cigs) cigs 0 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 46 50 1176 3 4 7 9 19 6 4 5 1 55 5 19 62 5 6 1 1 #1388-1176=212 cigrates smokers#Frequency Table!!!> a<-bwght[cigs>0]> length(a)[1] 212#Method 2> mean(fatheduc)[1] NA> mean(fatheduc,na.rm = TRUE) #由于fatheduc存在缺失值。我们直接在mean()中定义na.rm = TRUE来计算排除缺失值的平均值。[1] 13.18624
确实糟糕,这个CFA II里面的讲法完全不同樂
把非线性因素加入线性方程:所以看到指数对数这些东西。