服务一览
我的
1. 帖子
2. 收藏
3. 好友
4. 我的空间
5. 关注的人
6. 关注的贴
7. 找人
8. 文库
9. 任务
10. 道具
11. 勋章
12. 网站地图

全部分类 > 统计与数据分析

【数据整理难题】如何用stata或R处理dat数据格式

统计 ; R stata; 人口; 数据;

melodyhome |浏览4103次

2017/11/19 00:40

我有一个dat格式的数据，关于国外人口数据。已经确定该dat格式与GAUSS的dat格式无关。

查询谷歌，发现这类dat格式可能是压缩过的文本数据，用文本软件Notepad打开，果然如此，但遇到以下难题：

1、

上图的意思是，每一行代表一个观测值的全部数据，不同列代表不同的变量属性，如第1-7列代表id，第8-9代表社区代码，第10代表家庭人数，第11-14代表家庭类型，直到第128列。

由于原始数据如图所示，没有包含变量名（有个codebook文档，仅标注第几列属于哪个变量，各个数值代表哪些变量选项内容），也没有按变量分开各列（不过每一行都是128列，没有错位），观测值总量即样本有近80万。

请问，如何用stata或R高效地将这样的数据处理成常用的数据格式，即满足：按变量名及其所占列宽去分开各列数据，并转化为第一行全部是变量名，下面是各观测值内容。形式参见CHIP或CFPS数据集。

向各位大神求救！！！！

全部回答(2)

dongpin

回答于 2017/11/27 13:06

请登录后查看
评论(0)
- 加载中...
jiangbe

回答于 2017/11/19 19:23

请登录后查看
评论(0)
- 加载中...

相关已解决

0人关注该问题

JG学术专题课

1、空间计量专题丨空间面板数据模型 2、空间计量专题丨空间权重矩阵 3、空间计量专题丨第四代空间计量模型:共同因子与空间相关 4、空间计量专题丨ArcGIS操作与空间数据分析 5、SSCI专题丨发表SSCI/SCI的七大疑问 6、SSCI专题丨SEM在SSCI/SCI发表之必要条件 7、SSCI专题丨PLS在SSCI/SCI发表的实例操作 8、Python专题丨Python可视化的学术应用 9、Python专题丨Python爬虫 10、Python专题丨Python文本挖掘 11、DSGE专题丨DSGE中如何进行福利分析 12、DSGE专题丨金融摩擦之抵押融资约束 13、计量专题丨零基础掌握Panel Data 14、计量专题丨计量理论如何指导实证分析专题 15、计量专题丨做实证研究为何要学习计量经济理论 16、计量专题丨交互项 17、机器学习专题丨机器学习如何应用于时间序列预测 18、更多

为做大做强论坛，本站接受风险投资商咨询，请联系（010-62719935）

联系QQ：75102711 邮箱：service@pinggu.org

合作咨询电话：(010)62719935 广告合作电话：13661292478（刘老师）

投诉电话：(010)68466864 不良信息处理电话：(010)68466864

京ICP备16021002-2号京B2-20170662号京公网安备11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

加载中...