Anthony计量经济学导论-学习笔记+R语言

时间：2023-08-18

大概就是用R来搞经济学，用Python玩爬虫，用SAS处理数据？

终于蹭上了我想要的编程课，顺便把一元和多元回归学精！

用Python来搞计量经济学的配套书。迷，我先看看理论吧。

Using Python for Introductory Econometrics

UPfIE

捯饬半天找好资料之后被数据集卡住，下载的本地数据集我把Variable Name和Data file分装两个文件，我不会合并路‍♂️，最后成功用包导入， perfect！

如何在Stata/Python/R中简单快速读地取伍德里奇《计量经济学导论》中的数据集？ - 知乎

1、调用module：library(wooldridge)

2、导入数据

> df_wage1 <- wooldridge::wage1
> View(df_wage1)

3.导入数据后还需要看要分析哪个表就attach()

attach(wage1) #绑定数据 wage1> mean(educ) #求均值[1] 12.56274> min(educ) #求最小值[1] 0> max(educ) #求最大值[1] 18> summary(educ) #一次性得以上描述性统计量 Min、1st Qu、 Median Mean 3rd Qu、 Max、 0.00 12.00 12.00 12.56 14.00 18.00 > 184/56.9* mean(wage) #用2003年美元度x平均小时工资[1] 19.06648> sum(female)[1] 252> length(female)-sum(female) #length() indicates the number of indicators[1] 274

#R和Python对大小写都这么严格 view 不给我看.

#I think it is unnecessarymd.pattern(bwght) #我们发现缺失值多且缺失值分在的不同变中我们用一种更方便的方法审缺失值。mice包中的md.pattern()函数够轻松实现一功。参《R 实战》第一版320页。回的结果告我们在fatheduc变上有缺失值的测有196个在motheduc上有缺失值的测有1个。> length(fatheduc) [1] 1388# 由于数据中的测是妇女的宝宝的情况所以一个测对应着一名妇女。我们只意取一个变测其测值数即可。值得一提的是缺失值仍然会算为一个测。例如fatheduc中有196个缺失值 faminc中没有缺失值但length(fatheduc)> table(cigs) cigs 0 1 2 3 4 5 6 7 8 9 10 12 15 20 30 40 46 50 1176 3 4 7 9 19 6 4 5 1 55 5 19 62 5 6 1 1 #1388-1176=212 cigrates smokers#Frequency Table!!!> a<-bwght[cigs>0]> length(a)[1] 212#Method 2> mean(fatheduc)[1] NA> mean(fatheduc,na.rm = TRUE) #由于fatheduc存在缺失值。我们直接在mean()中定义na.rm = TRUE来计算排除缺失值的平均值。[1] 13.18624

确实糟糕，这个CFA II里面的讲法完全不同樂

把非线性因素加入线性方程：所以看到指数对数这些东西。

上一篇：从零开始线性回归

下一篇：第5章、字典