经常问的问题

分析希尔达调查数据

  • 我如何通过所有与希尔达提供的文档的浏览?

    希尔达调查用户手册 是开始,因为它回答了有关使用数据无数问题的最佳场所。

    该手册涵盖了各种主题,包括:

    • 丢失的数据公约
    • 衍生变量
    • 匹配波形数据文件,以创建纵向文件
    • 收入和支出的归集
    • 行业和职业变量
    • 澳大利亚和派生国际编码方案
    • 使用加权变量,并且
    • 数据质量问题。

    用户手册还提供了数据文档的概述和由希尔达调查中使用的设计和数据采集程序的摘要。

  • 什么文件的zip文件是什么?

    文档zip文件包含:

    • 编码的所有变量框架(PDF格式文件)
    • 编码框架的纵向权重和主文件
    • 的横波指数
    • 标记的问卷调查,以及
    • showcards(PDF格式文件)显示相关的变量名称不包括衍生和历史变量。

    文档zip文件还包含每个波的频率。字符串变量(ID和时间戳)通常从这些频率中排除。

    快速定位变量名中, 希尔达调查用户手册 应与交叉波指数,其是由问题号,关键字或变量名(不包括第一个字符波标识符)搜索的结合使用。

    横波指数表示各波特定变量的可用性,以及作为源问卷(或历史,对导出的变量)。

  • 什么是“自己的企业员工”和“雇主/个体户”之间的区别?

    希尔达调查一般采用的统计(ABS)澳大利亚统计局定义的标准劳动力市场变数。

    但是,我们不舒服的腹肌个体户的定义。

    腹肌 定义雇员

    谁的作品为公共或私人雇主和他们的雇主收到的工资,薪金报酬,预聘费佣金基础上开展工作,而一个人,技巧,计件工资或实物支付;或者谁用或不用雇佣员工经营自己的企业法人的人。

    换句话说,他们的员工的定义包括所有者经理谁经营自己的企业股份有限公司(即,他们被视为“自己的企业员工”)。

    与此相反,谁经营自己的非公司的人被视为“自己的账户工作者”(即,它们是自雇人士)。

    我们认为,这种区别会误导许多研究的目的,所以在我们公布的数据,我们提供所有必要的信息,研究人员构建自己的雇员和自雇人士的定义。

    如果您希望通过“雇员”的定义腹肌,你应该采取变量 _esempst 并结合两组“雇员”(1)和“自己的企业员工”(2)。

    另外,您也可以使用变量 _es ,这是再现的就业状况的ABS定义派生的变量。

    你是否为一组取决于你的研究问题相结合“自己的企业员工”和“雇主/个体户”。

    如果你想以符合ABS的定义,应该结合“员工”和“自己的企业员工”。

    在标记木的劳动力市场行为本身的研究,例如,他几乎都是丢弃的ABS定义和联合“自己的企业员工”与“老板/个体户”组。

  • 我应该使用哪个重?

    权重来从样本人口进行推断。

    您使用的重量取决于你所回答的问题。希尔达调查用户手册提供了一些指导其重量用在哪些情况。

  • 我应该重量不平衡面板?

    也许。当你构建的非平衡面板 响应者,你把所有从每一波的响应者和它们堆叠成具有每波人一个记录很长的文件。

    可能被用于加权该样品的重量是从每一个波的横截面响应人的重量。即,在其波1的观察,该人将可以通过波1的横截面响应人重加权,其波2的观察将通过波2的横截面响应人重进行加权,并依此类推。

    同样,如果您正在构建的非平衡面板 列举人,那么你可以使用横截面列举人的重量。

    如果你集中,也就是说,数据的五浪在一起,权重的总和将约为100万美元(也就是2001年和2005年之间的平均人口规模的五倍)。因此,可能希望通过您已包括在不平衡面板的波的数目的总除以重新缩放权重。

    加权样品中这样的决定取决于你正在开展不平衡面板上分析的类型。例如:

    • 如果你的分析是罕见的事件,你是有效采取合并样本,那么上述建议的加权策略应该罚款。
    • 另外,如果您的分析要求对同一个体至少有两个意见,那么你将下降那些谁是唯一一次接受采访的人。横截面的权重,因此,将不适合(也不会对纵向权重)。
  • 我应该使用什么样的重量,如果我池中的波的样本?

    当你分析一个罕见的事件(例如,离婚),可以跨池中的波样品。此示例,然而,是受摩擦,是不是随机的,所以它需要进行加权。

    如果你已经汇集响应跨越波的人,你应该使用截响应人的重量从该案件已作出贡献的浪潮。

  • 我如何匹配跨越波的人吗?

    使用交叉波标识符 xwaveid ,来匹配波人。

  • 我如何匹配户内的人吗?

    同一家庭内的人有一样的家庭标识符 _hhrhid*。

    标识符将从波改变家庭波。用一个人的跨波标识符 xwaveid 随着时间的推移它们匹配。

    *与用于波,其中“a”对应于波1相应的字母替换下划线,“B”对应于波2,依此类推。

  • 我怎么搭配情侣在一起?

    谁是已婚或事实上的关系,人们可以匹配通过他们的合作伙伴:

    • _hhpxid,伙伴的跨波标识符,或者
    • _hhprtrid中,合伙人的两位数人数,其可以被附加到家庭标识符的端 _hhrhid 创建合作伙伴的该波IDENTIFER。

    合作伙伴标识仅适用于生活在同一家庭的合作伙伴。同性夫妇有一个合作伙伴标识。

    注:替换与用于波,其中“a”对应于波1相应的字母下划线,“B”对应于波2,依此类推。

  • 我如何搭配孩子父母?

    一个孩子可以匹配通过他们的母亲或父亲:

    • _hhmxid_hhfxid 中,交叉波对母亲和父亲的标识符;要么
    • _hhmid_hhfid ,对于母亲和父亲的两位数人数,其可以被附加到家庭标识符的端 _hhrhid 创造了母亲和父亲的识别特定波。

    母亲和父亲的标识符仅适用于谁住在同一家庭的父母或父母的人。

    注:替换与用于波,其中“a”对应于波1相应的字母下划线,“B”对应于波2,依此类推。

  • 为什么有些受访者为零的权重?

    零个权重的受访者可能会出现有两个原因。

    生活在机构(如医院和其他医疗机构,军队和警察设施,教养和刑事机构,修道院和寺院)波1排斥的人及其他非私人住宅(如酒店和汽车旅馆)希尔达样品。

    其结果是,希尔达样品不能代表生活在非私人住宅的人。

    人们搬入这些住宅波1后给出零剖权重和零个纵向权重从它们开始生活在一个非私人住宅的波开始均衡面板。

    希尔达样本也被排除在外居住在偏远和人口稀少地区的人们。一些这些区域被排除在统计人口基准,它们在加权处理中使用的澳大利亚局。

    对于发布1至4中,仅基准在北方领土排除边远和人口稀少地区。下面的第4版,但是,ABS修订方面考虑偏远和人口稀少,包括新南威尔士州非常偏远的地区,昆士兰,南澳大利亚,澳大利亚西部和北方领土。

    这些区域由偏远区域分类确定,并具有一个值大于在10.53 澳大利亚的无障碍/偏僻指数。作为结果,从释放5,生活在这些地区样本成员少数给出零剖权重和零个纵向权重。

  • 我如何引用希尔达?

    下面的段落必须出现在任何研究使用希尔达调查数据显示:

    本文从家庭,收入和劳动动态澳大利亚(希尔达)调查使用单位记录数据。希尔达项目启动,由社会服务(DSS)澳大利亚政府部门提供资金,由应用经济和社会研究(现金网app下载)的现金网app下载的管理。调查结果和在本文中提到的观点,然而,是那些作者的,不应该归咎于任何DSS或现金网app下载。

    包括上述声明许可或保密契约的契约,你签获得希尔达调查数据的要求。

    如果你想参考希尔达的设计下面还参考建议:

    沃森,正,和木,米。 (2012年),“希尔达调查:一个成功的家庭面板研究的设计和开发的案例研究”, 纵向和生命过程的研究卷。 3,没有。 3,第369-381。

  • 如何计算,如果有人在浪4退休了吗?

    在波4退休状态是有问题的。有是导致中所含波2人继续调查没有恢复退休状态的问题了波4制备过程中的监督。

    这些问题在波3被拆除,因为一个更全面的退休有关问题包括作为退休模块的一部分。

    取消对波4本引退模块应该一直伴随着原来的退休问题的恢复,但这种被忽略,而不是纠正,直到5浪。

    您可以定义仅基于年龄和劳动力状况退休状态,但要跨越,你需要在所有波采用同样的标准电波是一致的。

    另一种方法是排除波4完全。

  • 如何找到住户参考人的家庭吗?

    一个家庭参考人未在希尔达的数据集提供。研究人员将有他们可能希望应用来定义一个家庭参考人有不同的定义。这可能取决于其特定的研究课题或他们如何想这个定义时应用了作为家庭的范围内变动的情况下(例如,如果相对收入水平随着时间的推移有所不同,如果关系随时间变化,或者当有人移出或等)。一些变量,你可能会发现在界定家庭参考人有用的是在家庭(_hhrih)的关系,收入(_tifefp和_tifefn),所有者(_hsoid1到_hsoid18,但这些都只是在某些年份可用)和年龄(_hgage)。

    请注意,个人数字(_hhpno)表示该行的家庭形式,该人是上市。在第一波的顺序是简单的受访者提到了人们在家庭中给面试官的顺序。在以后的波浪,加入者加入和毕业生被删除,人们打乱了下一个浪潮。

  • 我要如何连接的家庭随着时间的推移?

    我们不提供纵向户ID为不同的用户将有意味着什么,是一个纵向的家庭的一部分,不同的定义。没有出生或死亡的改变家庭吗?如果在或出人的动作?这很重要,他们是谁,或者他们是如何与家庭中的“核心”的人吗?如果一对夫妇离婚,离婚后谁做家务属于哪一种?或者,如果一个成年的儿子移回到家发生了什么 - 是同一个家庭或一个不同?这很重要,如果成年的儿子是25或60?你需要通过人,生活中他们随着时间的推移链接户。

    最好的文件来使用做,这是主文件,因为它包含谁是有史以来枚举家庭的一部分,所有的人的摘要信息。这包括xwaveid,并且对于每个波,家庭ID和结果状态。你需要做什么构成持续的家庭或一个新的家庭为你的目的,一些决定。

    同时也请您考虑,如果你实际上需要考虑你的研究问题的纵向家居概念的条款。有可能将它重新定义会发生什么谁一段时间生活在某些特定类型的家庭的人。家庭不会随着时间的推移一个明确的概念(如研究人员将有不同的定义取决于其特定的研究问题),而个体。

  • 我应该使用在希尔达调查数据的估算值?

    当完整的答复无法从受访者的希尔达调查数据的一些变量估算。例如,许多收入变量包含估算值。希尔达调查队提供的信息的用户哪些值估算。例如,对于“家庭财政年可支配总收入”(_hifditp / _hifditn)有插补标志,_hifditf。横跨希尔达调查的前16个波,用于在家庭一级这个变量的值的大约25%被估算。这个变量是众多收入部分的总和,它只能在较低的水平需要一个缺失值这个整体总失踪。

    用户可能会尝试把这些意见作为离它们不包含从参与者的实际反应。用户可能会担心他们的分析是通过使用是正在使用由希尔达调查小组的一些型号的产品,这些估算值的影响。

    首先,用户应该知道,大部分归集是相对无害的。通常情况下,受访者将在一年内都留下了一个项目的空白,这是很容易从其他年份的相同的受访者以及其他受访者很好的猜测为这个项目工作了。

    最重要的,然而,就是扔掉估算观测将相对于包括归因值估计产生了大量的偏见。虽然可能有通过插补程序引入一些错误,这些错误引入通过排除与插补值观测将大得多。这是由于“选择偏差。”其值已经被估算的观察比对,其归集还没有进行系统的不同。通过排除这些意见,用户风险引入大量的选择偏倚到他们的估计。

    有在经验的社会科学文献和统计文献普遍认为,这是远远优于包括与估算值的观察。还建议以包括插补指示符(虚拟)变量作为你的回归的说明变量。例如,如果您估计与“家庭财务年度可支配总收入”的典范,你应该包括_hifditf指标作为附加的解释变量。这将有助于“吸收”任何可能已被归集过程中引入的误差。 (见弗里克和grabka(2007年),“项目不答复,并在小组调查年度劳动收入的归集从跨国家的角度。” DIW讨论文件736)

    这个答案是由教授罗伯特BREUNIG,澳大利亚国立大学提供。