1、SaTS can软件目的SaTS can是一个自由软件,分析了空间,时间和空间的数据使用的空间,时间,或时空扫描统计。它是专为以下任何相关用途:执行地理疾病监测,检测空间或时空疾病集群,看看他们是否有统计学意义。测试是否是随机分布在空间,时间,或在空间和时间。评估的统计意义的疾病集束警报器。进行前瞻性实时或定期监测疾病的早期发现疾病暴发。该软件还可以用于类似的问题在其他领域诸如考古学,天文学,犯罪学,生态学,经济学,工程学,遗传,地理,地质,历史,或生态。数据类型和方法SaTS can可用于离散和连续扫描数据。离散扫描统计数据的地理位置在观察是随机和固定的用户。这些地点可能是实际位置的意见,如
2、房屋,学校或蚁巢,或者它可能是一个中央位置代表一个较大的地区,如地理或人口加权形心邮政区,县或省。连续扫描的统计,该地点的意见是随机的和可能发生的任何地方在一个预定义的研究领域由用户定义,如矩形。离散扫描统计,SaTS can使用离散泊松模型,其中一些事件在一个位置是泊松分布,根据已知的潜在风险人口;伯努利模型,与0 / 1事件数据,如案件和控制;时空置换模式,只使用情况的数据;多项式模型的分类数据;一个序模型,分类数据;指数模型的生存时间数据或不删失变量;正常模式为其他类型的连续数据;或空间变化的时间趋势模型,寻找地理区域异常高或低temportal趋势。一个共同特点,所有这些离散扫描统计,
3、地理位置在数据可以看出是随机和固定的用户。对于离散扫描统计,数据可以是聚集在普查道,邮编,县或其他地理水平,或可能有独特的坐标为每个观察。SaTS can调整的基本均匀的背景人口。它也可以适应任何数量的绝对变量由用户提供,以及时间的趋势,称为时空集群和数据丢失。它可以扫描多个数据集的同时寻找集群发生在一个或更多的人。连续扫描统计,SaTS can采用连续泊松模型。开发商和投资者该软件是由SaTS can库尔多夫,与信息管理服务有限公司的财政支持,SaTS can已收到下列机构:国家癌症研究所,司的癌症预防,生物科 1.0,2,2.1 国家癌症研究所,司的癌症控制和人口科学,统计研究和应用分公司
4、 3(部分),新(部分),8(部分),v9.0(部分)艾尔弗雷德史隆基金会通过拨款,为纽约医学专科学院(法扎德mostashari,皮) 3(部分),3.1,4,5,5.1 疾病预防和控制中心,通过协会的美国医学院校合作协议奖多项mm-0870大师,6.1(部分)。全国儿童健康与发展,通过给予# ro1hd048852 7,8,9(部分)国家癌症研究所,司的癌症流行病学和遗传学 v9.0(部分)国立综合医学科学研究所,通过建模传染病剂的研究补助金# u01gm076672 v9.0(部分)他们的经济支持是极大的赞赏。内容SaTS can是发展商的责任和不一定反映官方意见的资助相关主题:统计方法
5、SaTS can书目相关主题:统计方法SaTS can书目下载和安装检查SaTS can软件更新,到SaTS can网址:http:/www.satscan.org安装一个更新版本,选择SaTS can下载链接。下载后SaTS can安装可执行文件到你的电脑,点击它的图标和安装软件后,一步一步的指示。相关主题:新版本测试运行在使用自己的数据,我们建议在一个样本数据集提供的软件。使用这些得到主意如何运行SaTS can。执行测试:1。应用程序图标上点击SaTS can。2。点击“打开保存的会话。3。选择一个参数文件,例如“纳米带”(宝。泊松模型,时空和空间变化的时间趋势:脑肿瘤的发病率在新墨西哥
6、案例档案:nm.cas格式: = 1县 年龄组性别人口:nm.pop格式: 年龄组性别nm.geo坐标文件:格式: 研究期间:1973至1991年聚集:32县精密案件倍:年直角坐标:# 1变量,年龄组:1 = 0 - 4年,2 = 5 - 9年,18 = 85 +年# 2变量,性别:男1,女2 =人口:1973,1982,1991年数据来源:新墨西哥季节能效比肿瘤登记处这是一个浓缩版的更完整的数据集的人口为每年1973至1991,和种族的三分之一个变量。完整的数据集可以发现在:www.satscan.org/datasets/伯努利模型,纯粹的空间:儿童白血病和淋巴瘤的发病率在亨伯赛德案例档案
7、:nhumberside.cas格式: #位置编号控制文件:nhumberside.ctl格式: nhumberside.geo坐标文件:格式: 研究期间:1974-1986控制:随机选择从出生登记聚集:191邮政编码(最多只有一个单一的个体)精度的情况和控制时间:无直角坐标:变量:没有数据来源:雷卡特莱特和弗里达亚力山大博士。报告由J .库兹克和爱德华兹,英国皇家统计学会,73-104乙:52,1990这和其他数据集可以被发现:www.satscan组织/数据/。时空置换模式:医院的急诊室住院因发烧在纽约市医院案例档案:nycfever.cas格式: nycfever.geo坐标文件:格式:
8、 拉链纬度经度研究期间:2001年11月1日2001年11月24日聚集:邮编地区例:天倍精度坐标:纬度/经度变量:没有数据来源:纽约市卫生局这和其他数据集可以被发现:www.satscan.org/datasets/序模型,纯粹的空间正规教育水平在马里兰案例档案:marylandeducation.cas格式: 类# #个人marylandeducation.geo坐标文件:格式: 定位标识纬度经度研究期间:2000聚集:24各县、县级精度的情况:无坐标:纬度/经度变量:没有类别:1 = 9年的学校,2 = 9 +年而不是高中,3 = 4 =高中或同等学历,本科或以上学历数据来源:美国人口普查
9、局:教育信息来自于长期普查2000表格,填写的1 / 6户。这和其他数据集可以被发现:www.satscan.org/datasets/注意:只有人25岁及以上被列入数据。对于每一个县,人口普查提供信息的人的百分不同层次的正规教育。一些个人的报告不同的教育水平在每一个县估计这一比例倍的总人口年龄25 +六分反映1 / 6采样率的长期普查表。指数模型,时空:人为的生存数据案例档案:survivalfake.cas格式: 生存时间检查survivalfake.geo坐标文件:格式: 研究期间:2000 - 2005聚集:5个地点精度的诊断:一年的时间精密的生存/审查时间:一天直角坐标:变量:没有数
10、据来源:人为制造的数据。相关主题:测试运行,输入数据。正常模式,纯粹的空间:人为制造的连续数据案例档案:normalfake.cas格式: #个人体重增加normalfake.geo坐标文件:格式: 研究期间:2006聚集:26个地点直角坐标:变量:没有数据来源:人为制造的数据伯努利模型与伯努利模型,有案件和非案件所代表的0 / 1变。这些变量可能代表人或无病,或人与不同类型的疾病,如早期和晚期乳腺癌。它们可能反映和控制的情况下一个大的人口,或他们可能构成人口作为一个整体。无论什么情况可能是,这些变量将被命名为例,控制整个用户指南,和他们的总人口将被命名为。伯努利的数据可以分析与纯粹的时间,纯
11、粹的空间或时空扫描统计。例如:为伯努利模型,案件可能是新生儿的出生缺陷,而控制所有新生儿无出生缺陷。伯努利模型需要的信息的位置,设置和控制的情况下,提供SaTS can使用情况,控制和协调文件。不同的地点可能被指定为每一个案件和控制,或可能是数据汇总为国家,省,县,区,人口普查传单,邮政编码区,学校,家庭,等等,与多个案件和控制每个数据的位置。做一个时间或时空分析,它必须有一个时间为每一个案件和控制以及。相关主题:案件档案控制文件坐标文件似然比检验分析表概率模型的比较方法的论文分享到 翻译结果重试抱歉,系统响应超时,请稍后再试 支持中英、中日在线互译 支持网页翻译,在输入框输入网页地址即可 提
12、供一键清空、复制功能、支持双语对照查看,使您体验更加流畅离散泊松模型与离散泊松模型,案件的数量在每个位置是泊松分布。零假设下,当有任何变量,预期的案件数量在各地区的人口比例大小,或在该地区的人。泊松数据可以分析与纯粹的时间,纯粹的空间,时空扫描和空间变化的时间趋势统计。例如:为离散泊松模型,案件可能是中风的发生,而人口是结合一些人来住,计算“1”,有人居住在该地区的整个时间段,和“1 / 2”垂死的人或移动在中间的一段时间。离散泊松模型需要情况和人口数为一组数据的位置,如县,教区,人口普查传单,或邮政编码地区,以及地理坐标为每个这些地点。这些需要提供SaTS can使用情况,人口和坐标文件。人
13、口数据不需要指定持续时间,但只在一个或多个具体的普查时间。倍之间,SaTS can做线性插值的基础上的人口在普查时立即出发,后立即。时代前的第一次人口普查时,人口规模是相当于人口规模在普查时间,和时间后,最近一次人口普查时,相当于做。获得人口大小为特定地点和时间内,人口规模,上述定义,是综合性的时间期限问题。相关主题:分析表案件档案连续泊松模型坐标文件似然比检验人口档案概率模型的比较方法的论文时空置换模式时空置换模型只需要数据的情况下,信息的空间位置和时间为每一个案件,没有信息需要控制或背景的人口处于危险。观察到的一些案件中的一组比本来预计如果空间和时间地点,所有病例均相互独立,因此没有时空互
14、动。这是,有一组在一个地理区域,在某一特定时间内,该地区有较高比例的情况下,在这段时间比其他地区。这意味着,如果,在一个特定的一周,所有的地理区域有两倍的案件数量比正常,并没有对这些地区构成一个群。另一方面,如果在这一周,一个地理区域的两倍数量的情况下比较正常,而其他地区正常数量的情况下,会有一组在第一区。时空置换模型自动调整为纯粹的空间和纯粹颞集群。因此,不存在纯粹的时间或空间版本的这一模式。例如:在时空置换模型,案件可能是每天发生的救护车派遣中风患者。重要的是要认识到,时空置换群可能是由于要么增加疾病的风险,或对不同地理种群分布在不同的时间,例如,在一些地区的人口增长速度比其他。这通常不是
15、一个问题,如果总时间不超过一年。然而,建议用户非常小心,当使用这种方法的数据跨越几年。如果背景人口的增加或下降速度比在另一些地区,有风险的人口变化的偏见,这可能产生偏见的P -值在研究期间长于几年。例如,如果一个新的大型社区的发展,会增加情况下,仅仅是因为人口的增加,并且只使用数据的情况下,时空置换模型不能区分增加由于当地人口的增加与增加的疾病的风险。如同所有的时空互动方法,这主要是关注在研究期间长于几年(曼特尔,癌症研究,27:209-2201967;库尔多夫和hjalmars,生物识别技术,9:621-6301999,P 10)。如果人口的增加(或减少)是相同的整个研究区域,这是好的,并不
16、会导致偏见的结果。分享到 翻译结果重试抱歉,系统响应超时,请稍后再试 支持中英、中日在线互译 支持网页翻译,在输入框输入网页地址即可 提供一键清空、复制功能、支持双语对照查看,使您体验更加流畅多项式模型用多项式模型,每个观察是一个案例,每个案例属于几个类别之一。多项式的扫描统计评估是否有任何集群的分布情况是不同的从其他地区的研究。例如,可能有更高比例的案件类型1和2和较低的比例例3型,比例的情况下,4型是相同的群集外的。如果只有2大类,序的模式是相同的伯努利模型,其中一个范畴的案件和其他类别的控制。案件中的多项式模型可能是一个样本,从更大的人口也可能构成一套完整的意见。多项数据可以分析与纯粹的
17、时间,纯粹的空间或时空扫描统计。例如:为多项式模型,数据可以由每个人患有脑膜炎,与五个不同的类别,代表五个不同的无性系物的疾病。多项式的扫描统计将同时寻找高或低集群的任何的克隆物,或一组照片,调整整体的地理分布的疾病。多重比较中所固有的许多种类占计算的P -值。多项式模型需要的信息的位置,分别在每个类别。一个独特的位置可能被指定为每一个案件,或可能是数据汇总为国家,省,县,区,人口普查传单,邮政编码区,学校,家庭,等等,与多个案件在同一地点。做一个时间或时空分析,它必须有一个时间为每一个案件等。用多项式模型,这是没有必要指定一个搜索为高或低的集群,由于没有层次的类别,但在输出显示什么类型更突出
18、的集群内。该命令或索引的类别并不影响分析中的聚类发现,但它可能影响随机用来计算p -值。Ordinal Model With the ordinal model, each observation is a case, and each case belongs to one of several ordinal categories. If there are only two categories, the ordinal model is identical to the Bernoulli model, where one category represents the cases a
19、nd the other category represent the controls in the Bernoulli model. The cases in the ordinal model may be a sample from a larger population or they may constitute a complete set of observations. Ordinal data can be analyzed with the purely temporal, the purely spatial or the space-time scan statist
20、ics. Example: For the ordinal model, the data may consist of everyone diagnosed with breast cancer during a ten-year period, with three different categories representing early, medium and late stage cancer at the time of diagnosis. The ordinal model requires information about the location of each ca
21、se in each category. Separate locations may be specified for each case, or the data may be aggregated for states, provinces, counties, parishes, census tracts, postal code areas, school districts, households, etc, with multiple cases in the same or different categories at each data location. To do a
22、 temporal or space-time analysis, it is necessary to have a time for each case as well. With the ordinal model it is possible to search for high clusters, with an excess of cases in the high-valued categories, for low clusters with an excess of cases in the low-valued categories, or simultaneously f
23、or both types of clusters. Reversing the order of the categories has the same effect as changing the analysis from high to low and vice versa. 序模型与序模型,每个观察是一个案例,每个案例属于一个序数类。如果只有2大类,序的模式是相同的伯努利模型,其中一个范畴的案件和其他类别的控制的伯努利模型。案件的序模型可能是一个样本,从更大的人口也可能构成一套完整的意见。序数数据可以分析与纯粹的时间,纯粹的空间或时空扫描统计。例如:为序模型,数据可以由每个人诊断出患
24、有乳腺癌,在10年期间,有三个不同类别的代表早期,中期和晚期癌症的诊断时间。序模型需要的信息的位置,分别在每个类别。不同的地点可能被指定为每一个案件,或可能是数据汇总为国家,省,县,区,人口普查传单,邮政编码区,学校,家庭,等等,多例相同或不同的类别,每个数据的位置。做一个时间或时空分析,它必须有一个时间为每一个案件等。与序模型,有可能寻求高集群,一个多余的情况下在高价值,低集群与多余的情况下在低价值的类别,或同时有两种类型的集群。扭转秩序的类别有相同效果的分析从高到低,反之亦然。Exponential Model The exponential model is designed for s
25、urvival time data, although it could be used for other continuous type data as well. Each observation is a case, and each case has one continuous variable attribute as well as a 0/1 censoring designation. For survival data, the continuous variable is the time between diagnosis and death or depending
26、 on the application, between two other types of events. If some of the data is censored, due to loss of follow-up, the continuous variable is then instead the time between diagnosis and time of censoring. The 0/1 censoring variable is used to distinguish between censored and non-censored observation
27、s. Example: For the exponential model, the data may consist of everyone diagnosed with prostate cancer during a ten-year period, with information about either the length of time from diagnosis until death or from diagnosis until a time of censoring after which survival is unknown. When using the tem
28、poral or space-time exponential model for survival times, it is important to realize that there are two very different time variables involved. The first is the time the case was diagnosed, and that is the time that the temporal and space-time scanning window is scanning over. The second is the surv
29、ival time, that is, time between diagnosis and death or for censored data the time between diagnosis and censoring. This is an attribute of each case, and there is no scanning done over this variable. Rather, we are interested in whether the scanning window includes exceptionally many cases with a s
30、mall or large value of this attribute. It is important to note, that while the exponential model uses a likelihood function based on the exponential distribution, the true survival time distribution must not be exponential and the statistical inference (p-value) is valid for other survival time dist
31、ributions as well. The reason for this is that the randomization is not done by generating observations from the exponential distribution, but rather, by permuting the space-time locations and the survival time/censoring attributes of the observations. 指数模型该模型的目的是为生存时间数据,虽然也可以用其他连续型数据以及。每个观察是一个案例,每个
32、案例都有一个连续变量的属性,以及0 / 1审查指定。生存数据,连续变量是时间之间的诊断和死亡或根据应用的不同,两国之间的其他类型的事件。如果一些数据审查,由于损失的后续行动,连续变量则相反,时间之间的诊断和审查时。0 / 1审查变数是用来区分审查,审查意见。例如:为指数模型,数据可以由每个人患有前列腺癌在10年期间,与有关信息的时间长度从诊断,直至死亡或从诊断到时间审查后,生存是未知的。当使用时间或时空指数模型的生存时间,重要的是要认识到,有一个非常不同的时间变量。首先是时间的情况下被诊断,这是时间,时间和空间的扫描窗口的扫描。二是生存时间,即,时间之间的诊断和死亡或删失数据的时间之间的诊断和
33、审查。这是一个属性的每一个案件,并有没有完成这个变量。相反,我们感兴趣的是扫描窗口,包括异常的许多情况下,大型或小型的属性的值。需要注意的是,虽然指数模型使用似然函数的指数分布,真实的生存时间分布不能指数和统计推断(P值)是有效的其他生存时间分布以及。这是因为,不是随机产生所做的观测,指数分布,而是通过置换,时空位置和生存时间/审查属性的意见。Normal Model The normal model is designed for continuous data. For each individual or for each observation, called a case, ther
34、e is a single continuous attribute that may be either negative or positive. The model can also be used for ordinal data when there are many categories. That is, different cases are allowed to have the same attribute value. Example: For the normal model, the data may consist of the birth weight and r
35、esidential census tract for all newborns, with an interest in finding clusters with lower birth weight. One individual is then a case. Alternatively, the data may consist of the average birth weight in each census tract. It is then the census tract that is the case, and it is important to use the we
36、ighted normal model, since each average will have a different variance due to a different number of births in each tract. It is important to note that while the normal model uses a likelihood function based on the normal distribution, the true distribution of the continuous attribute must not be nor
37、mal. The statistical inference (p-value) is valid for any continuous distribution. The reason for this is that the randomization is not done by generating simulated data from the normal distribution, but rather, by permuting the space-time locations and the continuous attribute (e.g. birth weight) o
38、f the observations. While still being formally valid, the results can be greatly influenced by extreme outliers, so it may be wise to truncate such observations before doing the analysis. In the standard normal model, it is assumed that each observation is measured with the same variance. That may n
39、ot always be the case. For example, if an observation is based on a larger sample in one location and a smaller sample in another, then the variance of the uncertainty in the estimates will be larger for the smaller sample. If the reliability of the estimates differs, one should instead use the weig
40、hted normal scan statistic that takes these unequal variances into account. The weighted version is obtained in SaTScan by simply specifying a weight for each observation as an extra column in the input file. This weight may for example be proportional to the sample size used for each estimate or it
41、 may be the inverse of the variance of the observation. If all values are multiplied with or added to the same constant, the statistical inference will not change, meaning that the same clusters with the same log likelihoods and p-values will be found. Only the estimated means and variances will dif
42、fer. If the weight is the same for all observations, then the weighted normal scan statistic will produce the same results as the standard normal version. If all the weights are multiplied by the same constant, the results will not change. 正常模式正常模式是用于连续数据。每个人或每个观察,称为例,有一个单一的连续属性可以是正的或负的。该模型还可以用来序的数据
43、时,有许多类别。这是不同的情况下,允许具有相同的属性值。例如:为正常模式,数据可能包括出生体重及住宅普查道的所有新生儿,有兴趣的调查组的低出生体重。一个人是一个情况。另外,数据可能包括平均出生体重在每个普查道。它是那么的普查道,“事件”,而且重要的是使用加权正常模式,因为每个平均会有不同的差异,由于不同数量的出生在每个道。值得注意的是,虽然正常模型使用似然函数的正态分布,真实分布的连续属性必须是不正常的。统计推断(P值)是有效的任何连续分布。这是因为,不是随机产生所做的模拟数据的正态分布,但相反,排样的时空位置和连续属性(例如出生体重)的意见。同时还被正式有效,结果可以大大影响极端离群,所以它
44、可能是明智的截断,这样的意见之前做分析。在标准模型中,假定每个观察是相同的测量方差。这可能并非总是如此。例如,如果一个观察的基础上更大的样本在一个位置和一个较小的样本在另一个,然后方差的不确定性的估计将是更大的小样本。如果可靠性估计不同,应使用加权正常的扫描统计,考虑到这些不平等的差异。加权版本获得SaTS can通过简单地指定一个体重为每个观察作为一个额外的列中输入文件。这个重量,例如可能是成正比的样本大小用于每一个估计,也可以是逆差额观察。如果所有的值乘以或添加到同一常数,统计推断是不会改变的,即同一簇具有相同的日志可能性和P -值会被发现。只有估计均值和方差将不同。如果重量是相同的所有意
45、见,然后加权正常扫描统计会产生相同的结果的标准版本。如果所有的重量乘以同一常数,结果不会改变。分享到 翻译结果重试抱歉,系统响应超时,请稍后再试 支持中英、中日在线互译 支持网页翻译,在输入框输入网页地址即可 提供一键清空、复制功能、支持双语对照查看,使您体验更加流畅Continuous Poisson Model All the models described above are based on data observed at discrete locations that are considered to be non-random, as defined by a regular
46、 or irregular lattice of location points. That is, the locations of the observations are considered to be fixed, and we evaluate the spatial randomness of the observation conditioning on the lattice. Hence, those are all versions of what are called discrete scan statistics. In a continuous scan stat
47、istics, observations may be located anywhere within a study area, such as a square or rectangle. The stochastic aspect of the data consists of these random spatial locations, and we are interested to see if there are any clusters that are unlikely to occur if the observations where independently and randomly distributed across the study area. Under the null hypothesis, the observations follow a homogeneous spatial Poisson process with constant intensity throughout the study area, wi