1、Epi-DataEpi-Data数据库建立与录入数据库建立与录入宝山区疾控中心宝山区疾控中心2013年年8月月主要内容主要内容EpiData基本情况基本情况EpiData使用流程使用流程建立调查表(创建建立调查表(创建QES文件)文件)生成数据文件(生成生成数据文件(生成REC文件)文件)添加字段控制(创建添加字段控制(创建CHK文件)文件)输入数据和产生数据文件资料输入数据和产生数据文件资料数据文件修改和数据转出数据文件修改和数据转出选项设置和程序参数选项设置和程序参数EpiData基本情况基本情况能快速建立数据库,可满足数据的校验录入、双份比能快速建立数据库,可满足数据的校验录入、双份比较
2、较;建立的数据库可转变成建立的数据库可转变成dBase、Excel、SAS、SPSS和和Stata统计分析软件的数据格式统计分析软件的数据格式;为数据管理软件,暂不具有统计分析功能为数据管理软件,暂不具有统计分析功能n QES文件文件(调查表文件调查表文件):建立调查表格,定义调查表的结构:建立调查表格,定义调查表的结构;n REC文件文件(数据文件数据文件):录入和存放数据;:录入和存放数据;n CHK文件文件(核查文件核查文件):定义了数据输入时字段的有效性规则。:定义了数据输入时字段的有效性规则。EpiData的三种文件类型的三种文件类型建立调查表(创建建立调查表(创建QES文件)文件)
3、QES文件字段定义文件字段定义n字符型:用下划线字符型:用下划线_n数字型:用数字型:用#号,每位一号,每位一#,#.#n逻辑型:用逻辑型:用Y或或N,、n日期型:日期型:n n字段名框在字段名框在 之中之中QES文件字段定义举例文件字段定义举例病例个案基本信息调查表姓名:name _性别:1.男 2 女 sex#年龄:year#出生年月:birthday 是否结婚:1.是 0 否 生成字段名设置选项生成字段名设置选项生成字段名生成字段名-几条规则几条规则优先选择用花括号优先选择用花括号括进的文本;括进的文本;通用常见单词不作为字段名组成部分;通用常见单词不作为字段名组成部分;字段前为空,字段
4、名就取前一个字段名再加上一个数字段前为空,字段名就取前一个字段名再加上一个数字。如果不存在前一个字段名则使用隐含字段名字。如果不存在前一个字段名则使用隐含字段名FIELD1首字符为数字,则在首字符前插首字符为数字,则在首字符前插N一般情况下,均用一般情况下,均用,定义好自己的字段名。,定义好自己的字段名。数据文件生成数据文件生成-建立建立REC文件文件在在EpiDataEpiData表现为生成表现为生成RECREC文件文件本文件基于本文件基于QESQES文件而生成文件而生成产生产生RECREC文件前可提问输入文件标记文件前可提问输入文件标记添加字段控制添加字段控制-生成生成CHK文件文件添加输
5、入控制的指令以文件形式单独保存,即添加输入控制的指令以文件形式单独保存,即CHK文文件件;程序运行时,自动寻找与扩展名程序运行时,自动寻找与扩展名REC相同文件的相同文件的CHK文件文件;标签:给出各数字对应的描述性文本标签:给出各数字对应的描述性文本 限定特定值(数值范围,合法值)限定特定值(数值范围,合法值)指定输入的顺序(跳转)指定输入的顺序(跳转)某些字段不得缺项,必须输入某些字段不得缺项,必须输入 重复上一条记录的某字段值重复上一条记录的某字段值 添加字段控制添加字段控制-生成生成CHK文件文件命令解释命令解释Range,Legal 定义允许输入的数据定义允许输入的数据Jumps 在
6、输入数据后决定是否跳转(本例数据为在输入数据后决定是否跳转(本例数据为1 时时 跳跳转到转到 v10题目去)题目去)Must enter 必须给出数值必须给出数值Repeat 重复上个记录的数据,即如果不改变,仍然维持重复上个记录的数据,即如果不改变,仍然维持前一个记录的数值,但这个数据也是可以改变的前一个记录的数值,但这个数据也是可以改变的Value label 对于分类变量,可以给他进行数据定义,如:对于分类变量,可以给他进行数据定义,如:1=男,男,2=女女数据库录入数据库录入 选中选中“输入数据输入数据”,给定数据文件,即显示数据录入界面,给定数据文件,即显示数据录入界面注意事项注意事
7、项 无键入内容,仅按回车,以缺失值论无键入内容,仅按回车,以缺失值论 字段填满,光标自动跳到下一个字段字段填满,光标自动跳到下一个字段 任何时候要退出录入,按任何时候要退出录入,按F10键即可键即可 双份录入和对比核查双份录入和对比核查n 两位录入员将同样的调查表输入到两份数据文件中两位录入员将同样的调查表输入到两份数据文件中n “对两个数据文件进行有效性检查对两个数据文件进行有效性检查”原理原理-两两个个录录入入员员在在同同样样的的字字段段犯犯同同样样输输入入错错误误的的概概率率很很小小,一一旦旦发发现现输输入入不不一致,则必然有一位出错一致,则必然有一位出错 数据库的追加与合并数据库的追加
8、与合并追加:两个数据结构完全一样的数据库连接起来,即端对追加:两个数据结构完全一样的数据库连接起来,即端对端连接。端连接。例如,一项调查问卷,共例如,一项调查问卷,共400份问卷,其中份问卷,其中200份由张三录入,另外份由张三录入,另外200份由份由李四录入,王五要分析整个数据,得把两个人整合起来。李四录入,王五要分析整个数据,得把两个人整合起来。ABC数据库的追加与合并数据库的追加与合并合并:两个数据结构不同,但有合并:两个数据结构不同,但有1-3个相同变量(如个相同变量(如序号,姓名等)的数据库合并,即边对边连接。序号,姓名等)的数据库合并,即边对边连接。例如,一项调查问卷,共例如,一项
9、调查问卷,共400份问卷,张三只录入份问卷,张三只录入400份问卷的前面病份问卷的前面病例的基本情况。李四只录入例的基本情况。李四只录入400份问卷临床症状和体征,王五要分析整份问卷临床症状和体征,王五要分析整个数据,得把两个人整合起来。个数据,得把两个人整合起来。ABC数据导出数据导出 EpiData软软件件产产生生的的数数据据文文件件以以“REC”作作为为扩扩展展名名,一一般般不不能能被被其其它它软软件件程序所调用程序所调用,故要数据导出,故要数据导出n 数据备份数据备份 n 转出为文本文件转出为文本文件 n 数据转成数据转成dBase III格式格式 n 数据转成数据转成Excel格式格式 n 转出成转出成Stata、SPSS、SAS所用的数据所用的数据