GB-T《統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX) 第1部分:框架》_第1頁
GB-T《統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX) 第1部分:框架》_第2頁
GB-T《統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX) 第1部分:框架》_第3頁
GB-T《統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX) 第1部分:框架》_第4頁
GB-T《統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX) 第1部分:框架》_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

ICS03.120.30

L70

中華人民共和國國家標準

GB/TXXXXX.1—XXXX

統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX)

第1部分:框架

Statisticaldataandmetadataexchangepart1:framework

(SDMXStandardsSection1:2011Version2.1,MOD)

(征求意見稿)

本稿完成日期:

XXXX-XX-XX發(fā)布XXXX-XX-XX實施

GB/TXXXXX—XXXX

目??次

前言.................................................................................II

1范圍...............................................................................1

2規(guī)范性引用文件.....................................................................1

3術(shù)語和定義.........................................................................1

4過程和業(yè)務(wù)范圍.....................................................................5

4.1過程模式.........................................................................5

4.2SDMX和過程自動化.................................................................6

4.3統(tǒng)計數(shù)據(jù)和元數(shù)據(jù).................................................................8

4.4統(tǒng)計交換的SDMX視圖..............................................................8

4.5SDMX注冊服務(wù)....................................................................11

4.6Web服務(wù).........................................................................11

5SDMX信息模型......................................................................12

6SDMX-EDI..........................................................................12

7SDMX-ML...........................................................................13

8符合性............................................................................14

9與SDMX面向內(nèi)容指南之間的依賴關(guān)系.................................................14

9.1概述............................................................................14

9.2跨領(lǐng)域概念......................................................................14

9.3元數(shù)據(jù)通用詞匯表................................................................14

9.4統(tǒng)計主題域......................................................................14

I

GB/TXXXXX—XXXX

統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX)第1部分:框架

1范圍

GB/TXXXX-XXXX規(guī)定了統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換(SDMX)的定義、結(jié)構(gòu)化方法、SDMX交換模式等,還

描述了統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)信息模型的建模方法、SDMX視圖、SDMX注冊服務(wù)、WEB服務(wù)、SDMX兩種交換格

式(SDMX-EDI、SDMX-ML)、SDMX符合性等方面的內(nèi)容。

本部分適用于統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)的交換和傳播等領(lǐng)域。

2規(guī)范性引用文件

下列文件對于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅所注日期的版本適用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。

GB/T18391-2009信息技術(shù)元數(shù)據(jù)注冊系統(tǒng)(MDR)

3術(shù)語和定義

下列術(shù)語和定義適用于GB/TXXXX-XXXX的本部分。

3.1

屬性attribute

一個對象或?qū)嶓w的特征。

[GB/T18391.1-2009,定義3.1.1]

3.2

類class

具有相同屬性、操作、方法、關(guān)系和語義的對象集合的描述。

[GB/T18391.1-2009,定義3.1.2]

3.3

標識符identifier

在一個規(guī)定的語境中,能夠用來唯一標識與其相關(guān)聯(lián)的事物的字符序列。

[GB/T18391.1-2009,定義3.1.3]

3.4

關(guān)系relationship

模型元素之間的關(guān)系。

[GB/T18391.1-2009,定義]

1

GB/TXXXXX—XXXX

3.5

元數(shù)據(jù)Metadata

定義和描述其他數(shù)據(jù)的數(shù)據(jù)

[GB/T18391.1-2009定義3.2.16]

注:在SDMX中,元數(shù)據(jù)包含結(jié)構(gòu)化元數(shù)據(jù)和引用元數(shù)據(jù)

3.6

統(tǒng)計數(shù)據(jù)StatisticalData

通常是與時間相關(guān)聯(lián)的觀測數(shù)值的集合,同時還與表示特定概念的一系列元數(shù)據(jù)值相關(guān)聯(lián),它通常

是以數(shù)據(jù)結(jié)構(gòu)定義(DSD)的形式來進行結(jié)構(gòu)化的。

3.7

引用元數(shù)據(jù)ReferenceMetadata

獨立于統(tǒng)計數(shù)據(jù)的附加的解釋性元數(shù)據(jù),它通常以文字的形式來描述統(tǒng)計數(shù)據(jù)的概念、統(tǒng)計數(shù)據(jù)的

獲取方法以及統(tǒng)計數(shù)據(jù)的質(zhì)量等有關(guān)方面的信息。

3.8

結(jié)構(gòu)化元數(shù)據(jù)StructuralMetadata

與數(shù)據(jù)相關(guān)聯(lián)的,且對數(shù)據(jù)進行描述、標識和檢索的元數(shù)據(jù),如統(tǒng)計數(shù)據(jù)立方體中維度和變量的名

稱。

3.9

數(shù)據(jù)結(jié)構(gòu)定義Datastructuredefinition;DSD

通過多個描述符概念對數(shù)據(jù)集中所包含的所有結(jié)構(gòu)化元數(shù)據(jù)進行描述,包括描述符概念是如何與數(shù)

據(jù)“立方體”的度量、維度和屬性相關(guān)聯(lián)的信息,同時也包括描述符概念與數(shù)據(jù)和標識性、描述性(結(jié)

構(gòu)性)的元數(shù)據(jù)的表示法都相關(guān)的信息。

3.10

數(shù)據(jù)集DataSet

以離散集合形式所組成的,并且共享著同一結(jié)構(gòu),同時涵蓋某一確定時間周期的相似數(shù)據(jù)的集合,

它包含了按照數(shù)據(jù)結(jié)構(gòu)定義所規(guī)范的數(shù)據(jù)和相關(guān)元數(shù)據(jù)的集合。

3.11

引用元數(shù)據(jù)集Referencemetadataset

引用元數(shù)據(jù)的集合,它可以描述數(shù)據(jù)或數(shù)據(jù)結(jié)構(gòu)定義的維護者;也可以描述發(fā)布數(shù)據(jù)的時間表;也

可以描述單一類型的、隨時間流動的數(shù)據(jù);還可以描述數(shù)據(jù)的質(zhì)量等。

注:引用元數(shù)據(jù)的創(chuàng)建者可以使用他們所關(guān)心的任意概念,但是應(yīng)給出包含這些概念相關(guān)信息的引用元數(shù)據(jù)集。

3.12

2

GB/TXXXXX—XXXX

雙方交換BilateralExchange

統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換的三類基本過程模式之一,該類交換過程的各個方面在交換雙方之間進行商

定,包括數(shù)據(jù)和元數(shù)據(jù)的交換機制、交換格式、交換頻度或交換時間表以及交換時通信所使用的模式等。

3.13

網(wǎng)關(guān)交換Gatewayexchange

統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換的三類基本過程模式之一,交換多方達成統(tǒng)一協(xié)議(即多方商定以一種單一

格式和單一過程)進行數(shù)據(jù)交換的過程。

3.14

數(shù)據(jù)共享交換Data-sharingExchange

任何組織或個人之間都可通過標準的、開放的、可以自由獲得的數(shù)據(jù)格式和過程模式進行數(shù)據(jù)和元

數(shù)據(jù)交換的方式。

注:該模式不要求雙方簽署協(xié)議,而只要求數(shù)據(jù)和元數(shù)據(jù)提供方和使用方遵守該標準。

3.15

約束Constraint

定義數(shù)據(jù)的完整性以及數(shù)據(jù)層級等的相關(guān)規(guī)則。

注:可以限制在數(shù)據(jù)或元數(shù)據(jù)流層面或供應(yīng)協(xié)議層面的數(shù)據(jù)交換,可以與數(shù)據(jù)結(jié)構(gòu)定義、供應(yīng)協(xié)議、數(shù)據(jù)流、元數(shù)

據(jù)流、數(shù)據(jù)提供方相互關(guān)聯(lián)。

3.16

供應(yīng)協(xié)議Provisionagreement

數(shù)據(jù)提供方提供數(shù)據(jù)集和元數(shù)據(jù)集方式的信息集。

3.17

機構(gòu)方案OrganisationScheme

維護機構(gòu)、數(shù)據(jù)提供方、數(shù)據(jù)使用方和組織單位都擁有特定的機構(gòu)方案,并可以在機構(gòu)方案內(nèi)對機

構(gòu)和機構(gòu)結(jié)構(gòu)進行定義。

3.18

分類方案Categoryscheme

根據(jù)對象具有的共同的特征將對象進行排列或分組的描述性信息.

[GB/T18391.1-2009]

注:在SDMX中,分類方案可以包括對數(shù)據(jù)和元數(shù)據(jù)進行組織的任意類型。分類可將某一類型與某一可標識的對象相

關(guān)聯(lián)。通過這種方式可以給對象集進行分類。統(tǒng)計主題域方案在SDMX中作為分類方案來實施。

3.19

分類Categorisation

3

GB/TXXXXX—XXXX

分類操作可將某一類型別與某一可標識識別的對象相關(guān)聯(lián)起來。通過這種方式可以給對象集合進行

分類。

3.20

結(jié)構(gòu)集structureset

提供了結(jié)構(gòu)化元數(shù)據(jù)的組織機制,該機制對特定的數(shù)據(jù)集和元數(shù)據(jù)集之間的關(guān)系進行了完整的描

述。

注:結(jié)構(gòu)集可用于對維度和屬性與其他維度和屬性進行相互映射,以及對概念進行映射、對代碼表進行映射和對分

類方案進行映射。在同一數(shù)據(jù)“立方體”中,即使數(shù)據(jù)沒有在同一維度,結(jié)構(gòu)集也可用于描述數(shù)據(jù)“立方體”。

3.21

報告分類法reportingtaxonomy

將許多數(shù)據(jù)立方體或數(shù)據(jù)流定義關(guān)聯(lián)起來,形成完整的數(shù)據(jù)或元數(shù)據(jù)報告。

注:報告分類法支持通常由多個不同種類的數(shù)據(jù)立方體所構(gòu)成的主要報告,但也可以支持其它的采集和報告功能。

根據(jù)包含在出版物中的數(shù)據(jù)或元數(shù)據(jù),報告分類法還可以支持諸如年鑒之類的出版物的規(guī)范。

3.22

數(shù)據(jù)立方體cubeofdata

一種豐富且多維度的數(shù)據(jù)結(jié)構(gòu).

注:在國際標準英文版中,cube一詞,都加以引號來表示,本標準只采用cube的立方體概念,但其含義不限于三維。

3.23

過程process

在統(tǒng)計過程建模中,使相互關(guān)聯(lián)的過程步驟成為一個集合的方法。

3.24

元數(shù)據(jù)通用詞匯表metadatacommonvocabulary

統(tǒng)計數(shù)據(jù)與元數(shù)據(jù)交換(SDMX)的術(shù)語定義的指南.

3.25

統(tǒng)計主題域statisticalsubject-matterdomains

在變量、概念和方法等方面具有共同特征的統(tǒng)計活動,旨在組織廣泛的統(tǒng)計交換和分類工作。

3.26

橫截面數(shù)據(jù)Cross-sectionalData

橫截面數(shù)據(jù)是指在某一時點收集的不同對象的數(shù)據(jù)。它對應(yīng)同一時點上不同空間(對象)所組成的一

維數(shù)據(jù)集合。

3.27

4

GB/TXXXXX—XXXX

時間序列數(shù)據(jù)Time-seriesdata

在不同時間點上收集到的數(shù)據(jù),這類數(shù)據(jù)反映了某一事物、現(xiàn)象等隨時間的變化狀態(tài)或程度。

3.28

數(shù)據(jù)流Dataflow

由維護機構(gòu)來維護,不受時間限制并可持續(xù)發(fā)布的數(shù)據(jù)集。

3.29

元數(shù)據(jù)流Metadataflow

由維護機構(gòu)來維護,不受時間限制并可持續(xù)發(fā)布的元數(shù)據(jù)集。

3.30

數(shù)據(jù)流定義DataflowDefinition

用于標識數(shù)據(jù)結(jié)構(gòu)定義,并且可以通過分類與一個或多個主題域相關(guān)聯(lián)。數(shù)據(jù)集按照數(shù)據(jù)流定義進

行報告或傳播。

3.31

元數(shù)據(jù)流定義MetadataflowDefinition

用于標識元數(shù)據(jù)結(jié)構(gòu)定義,并且可以通過分類與一個或多個主題域相關(guān)聯(lián)。元數(shù)據(jù)集按照元數(shù)據(jù)流

定義進行報告或傳播。

注:元數(shù)據(jù)流定義與數(shù)據(jù)流定義非常類似,但是它用于對元數(shù)據(jù)集進行描述、分類和約束。

4過程和業(yè)務(wù)范圍

4.1過程模式

SDMX確立了統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換的三類基本過程模式。這三類模式描述如下:

a)雙方交換:此類交換過程的各個方面都已在雙方之間進行商定,包括數(shù)據(jù)和元數(shù)據(jù)的交換機制、

交換格式、交換頻度或交換時間表以及交換時通信所使用的模式。此類模式也許是最為常用的過程模式。

b)網(wǎng)關(guān)交換:網(wǎng)關(guān)交換是一種有組織的雙方交換集合。通過該類交換,若干個數(shù)據(jù)和元數(shù)據(jù)采集

組織或個人同意相互之間采用已知的單一格式并且依照已知的單一過程來交換所采集的信息。該模式的

作用在于減輕了共享組織/個人之間(在數(shù)據(jù)和元數(shù)據(jù)采集領(lǐng)域)管理多個雙方交換行為所帶來的負擔。

該模式也是統(tǒng)計領(lǐng)域非常常見的一種過程模式。在該模式中,各機構(gòu)在其職責范圍內(nèi)確定了提高效率的

交換方式。

c)數(shù)據(jù)共享交換:該模式是已經(jīng)的、標準化的,并且是開放、可以自由使用的數(shù)據(jù)格式和過程模

式。因此,任何組織或個人都可以使用任何一方的數(shù)據(jù)和元數(shù)據(jù)(假如這些組織或個人已獲得訪問許可

權(quán))。該模式不要求雙方簽署協(xié)議,而只要求數(shù)據(jù)和元數(shù)據(jù)提供方和使用方遵守該標準。

本部分規(guī)定了基于以上任一過程模式進行交換的SDMX標準,并闡述了SDMX在各種情況下是如何體現(xiàn)

其優(yōu)勢的。經(jīng)雙方同意,既可以使用某種標準格式(例如SDMX-EDI或SDMX-ML);也可以采用網(wǎng)關(guān)過程

模式的數(shù)據(jù)發(fā)送方可以采用某種標準格式與對方進行數(shù)據(jù)交換或與采用同一標準格式的數(shù)據(jù)供應(yīng)方之

5

GB/TXXXXX—XXXX

間進行數(shù)據(jù)交換;同時還可以商定使用SDMX全部標準以支持常用的數(shù)據(jù)共享交換過程模式,而不論其是

否基于符合SDMX的注冊中心還是其他體系架構(gòu)。

本標準明確規(guī)定了支持基于使用了注冊服務(wù)中心的數(shù)據(jù)共享過程的模式。注冊服務(wù)為統(tǒng)計領(lǐng)域中的

數(shù)據(jù)和元數(shù)據(jù)提供了可視性,并通過提供一系列用于自動化處理的觸發(fā)器以支持訪問和使用這些數(shù)據(jù)和

元數(shù)據(jù)。而數(shù)據(jù)或元數(shù)據(jù)本身并不存儲在注冊中心——這些服務(wù)僅提供了一系列與位于已知位置的數(shù)據(jù)

(以及其它元數(shù)據(jù))相關(guān)的實用元數(shù)據(jù)集,以便用戶/應(yīng)用程序可以輕松地找到和獲得所注冊的任何數(shù)

據(jù)和/或元數(shù)據(jù)。該標準對于所有數(shù)據(jù)、元數(shù)據(jù)和注冊服務(wù)本身的應(yīng)用是普遍適用的,從而使數(shù)據(jù)共享

機構(gòu)達到高水平自動化程度。

應(yīng)當指出的是,這些不同的過程模式并不是相互排斥的——符合SDMX格式的、可以表達數(shù)據(jù)和元數(shù)

據(jù)的單一系統(tǒng)就可以全部支持這3種場景。不同的標準可能適用于不同的過程(例如,許多注冊服務(wù)接

口僅用于數(shù)據(jù)共享場景中),但是,所有標準都是以共享信息模型為共同的基礎(chǔ)。

除了考慮數(shù)據(jù)采集和報告以外,還需重點考慮到數(shù)據(jù)的傳播。數(shù)據(jù)和元數(shù)據(jù)——不論在其形成和創(chuàng)

建過程中是如何在各方之間進行交換的——最后都是提供給某種類型的終端用戶。這通常是通過機構(gòu)內(nèi)

部的專用應(yīng)用程序軟件來實現(xiàn)。但是,數(shù)據(jù)和元數(shù)據(jù)也越來越頻繁地以各種格式發(fā)布在網(wǎng)絡(luò)上。數(shù)據(jù)及

其伴隨的元數(shù)據(jù)在網(wǎng)絡(luò)上的傳播正是SDMX標準的焦點。統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)標準能夠在數(shù)據(jù)發(fā)布領(lǐng)域?qū)崿F(xiàn)

改進—一旦獲得了數(shù)據(jù),以某種標準格式處理數(shù)據(jù)就會變得更加容易。而且,數(shù)據(jù)和元數(shù)據(jù)鏈接在一起,

使得對數(shù)據(jù)的理解和進一步處理變得更加容易。

討論統(tǒng)計數(shù)據(jù)時,統(tǒng)計數(shù)據(jù)傳播中的許多方面(諸如數(shù)據(jù)發(fā)現(xiàn)、易用性和適時性)都影響到數(shù)據(jù)質(zhì)

量。SDMX標準為數(shù)據(jù)傳播的這些方面提供了全面支持。標準數(shù)據(jù)格式促進了易用性并提供了與相關(guān)元數(shù)

據(jù)之間的鏈接。注冊服務(wù)的概念意味著可以更容易地發(fā)現(xiàn)數(shù)據(jù)和元數(shù)據(jù)。適時性在數(shù)據(jù)整個生命周期內(nèi)

通過效率的提高而得到了改進,并經(jīng)由元數(shù)據(jù)的可用性和易用性而得到加強。

需重點指出的是,SDMX主要集中于統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)的交換和傳播領(lǐng)域。但是,在與組織和用戶之

間進行交換無關(guān)的數(shù)據(jù)內(nèi)部處理的環(huán)境之中,本標準所規(guī)定的標準模型和格式也可能擁有多種用途。為

了數(shù)據(jù)交換和傳播之目的而對數(shù)據(jù)和元數(shù)據(jù)進行標準格式化,這可能方便了組織和用戶所進行的內(nèi)部處

理工作,但這并不是本標準的重點所在。

4.2SDMX和過程自動化

各種統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)的交換采用了許多不同的自動化過程,其中一些更能夠引起人們的普遍關(guān)

注。采用了一些當今信息系統(tǒng)中幾乎無處不在的常用信息技術(shù)。SDMX旨在為自動化過程和技術(shù)提供最有

用的標準。

這些過程簡要描述如下:

——數(shù)據(jù)和元數(shù)據(jù)的批量交換:在各方之間傳輸整個或部分數(shù)據(jù)庫,包括逐漸增多的更新數(shù)據(jù)和元

數(shù)據(jù);

——在因特網(wǎng)上提供數(shù)據(jù)和元數(shù)據(jù):因特網(wǎng)技術(shù)——包括其在專用或半專用TCP/IP網(wǎng)絡(luò)上的應(yīng)用—

—是極為常見的。這些技術(shù)包括XML和Web服務(wù)作為自動化進行數(shù)據(jù)和元數(shù)據(jù)供應(yīng)的主要機制,還包括了

傳統(tǒng)的靜態(tài)HTML和數(shù)據(jù)庫驅(qū)動類型的發(fā)布;

——通用過程:盡管有許多應(yīng)用程序和過程是專門用于某些數(shù)據(jù)和元數(shù)據(jù)集,但其它類型的自動化

服務(wù)和過程用來處理任何類型的統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)。當可在因特網(wǎng)進行門戶網(wǎng)站和數(shù)據(jù)輸入時,這一點

特別適用;

——數(shù)據(jù)表示和轉(zhuǎn)換:為了讓數(shù)據(jù)和元數(shù)據(jù)可為使用者所使用,則應(yīng)支持可以將數(shù)據(jù)和元數(shù)據(jù)轉(zhuǎn)換

為特定應(yīng)用程序能夠進行處理的格式或其它標準格式或表義格式的自動化過程。盡管這種類型的自動化

過程在嚴格意義上并不屬于交換,但是在雙方之間進行的信息交換能夠自動進行時,這種類型的自動化

過程則表示為應(yīng)被支持的一系列需求。

6

GB/TXXXXX—XXXX

SDMX標準可用于支持上述所有這些自動化過程和技術(shù)的需求。

4.3統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)

本標準所規(guī)定的SDMX格式旨在避免“數(shù)據(jù)”和“元數(shù)據(jù)”之間的混淆,并且還給出了范圍。統(tǒng)計數(shù)

據(jù)通常是與時間相關(guān)聯(lián)的數(shù)字的集合,這些數(shù)據(jù)與一系列元數(shù)據(jù)值相關(guān)聯(lián),這些元數(shù)據(jù)值表示特定的概

念,這些概念用作數(shù)據(jù)的標識符和描述符。這些元數(shù)據(jù)值和概念可以理解為一個多維坐標系統(tǒng)的具體指

定的某一個維度,該系統(tǒng)通常用于描述數(shù)據(jù)“立方體”。

SDMX確定了對這種多維“立方體”結(jié)構(gòu)的數(shù)據(jù)進行建模、表達和理解的一種標準技術(shù),并且允許對

各種不同來源的數(shù)據(jù)進行自動化處理。這種方法可廣泛應(yīng)用于各種類型的數(shù)據(jù),同時該方法還試圖提供

最簡單和最容易理解的技術(shù),這些技術(shù)將支持大量的數(shù)據(jù)和相關(guān)元數(shù)據(jù)集的交換。

“元數(shù)據(jù)”術(shù)語含義非常廣泛。在“結(jié)構(gòu)化”元數(shù)據(jù)與“參考”元數(shù)據(jù)之間可以做出明確的區(qū)分。

其中,“結(jié)構(gòu)化”元數(shù)據(jù)是用于描述和標識統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)的概念;而“參考”元數(shù)據(jù)是通常用于描

述和限定統(tǒng)計數(shù)據(jù)集和處理的概念,并且通常不與數(shù)據(jù)的特定觀測或序列相關(guān)聯(lián),但與數(shù)據(jù)的整體采集

相關(guān)聯(lián),甚至與數(shù)據(jù)的提供機構(gòu)相關(guān)聯(lián)。

術(shù)語“元數(shù)據(jù)”所指的范圍很廣泛,這里主要分為兩部分:結(jié)構(gòu)化元數(shù)據(jù)和引用元數(shù)據(jù)?!霸獢?shù)據(jù)”

術(shù)語含義非常廣泛。在“結(jié)構(gòu)化”元數(shù)據(jù)與“參考”元數(shù)據(jù)之間可以做出明確的區(qū)分。其中,“結(jié)構(gòu)化”

元數(shù)據(jù)是用于描述和標識統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)的概念;而“參考”元數(shù)據(jù)是通常用于描述和限定統(tǒng)計數(shù)據(jù)

集和處理的概念,并且通常不與數(shù)據(jù)的特定觀測或序列相關(guān)聯(lián),但卻與數(shù)據(jù)的整體采集相關(guān)聯(lián),甚至與

數(shù)據(jù)的提供機構(gòu)相關(guān)聯(lián)。

SDMX信息模型不僅規(guī)定了數(shù)據(jù)的結(jié)構(gòu)化方法,而且還規(guī)定了“參考”元數(shù)據(jù)的結(jié)構(gòu)化方法。盡管引

用元數(shù)據(jù)的結(jié)構(gòu)獨立于這些數(shù)據(jù)及其結(jié)構(gòu)化元數(shù)據(jù),但它們的結(jié)構(gòu)通常是相互關(guān)聯(lián)的。SDMX信息模型給

出了引用元數(shù)據(jù)與數(shù)據(jù)或結(jié)構(gòu)化元數(shù)據(jù)的任意部分的關(guān)聯(lián)關(guān)系,還給出了這些引用元數(shù)據(jù)及其結(jié)構(gòu)化描

述的報告和交換。SDMX標準支持數(shù)據(jù)質(zhì)量的諸多方面,其中對質(zhì)量相關(guān)的元數(shù)據(jù)的支持是SDMX支持數(shù)據(jù)

質(zhì)量的主要內(nèi)容。

元數(shù)據(jù)不僅與數(shù)據(jù)相關(guān)聯(lián),而且還與提供和管理數(shù)據(jù)流的過程相關(guān)聯(lián)。SDMX信息模型規(guī)定了一系列

與“數(shù)據(jù)供應(yīng)”相關(guān)的元數(shù)據(jù)集——這些元數(shù)據(jù)對于需要理解數(shù)據(jù)提供方所輸出的內(nèi)容和格式的人群

甚為有用。每個數(shù)據(jù)提供方都可以在自己生產(chǎn)的數(shù)據(jù)和元數(shù)據(jù)集內(nèi)以標準方式描述它們之間的內(nèi)容和依

賴關(guān)系,并給出提供這些數(shù)據(jù)和元數(shù)據(jù)的時間表和機制相關(guān)的信息。這樣就可以實現(xiàn)校驗和控制功能的

自動化,并支持數(shù)據(jù)報告的管理。

SDMX也認為分類方案在組織和管理數(shù)據(jù)和元數(shù)據(jù)交換和傳播中的重要性。SDMX中可以表達有關(guān)分類

方案和領(lǐng)域分類方面的信息,同時也表達其與數(shù)據(jù)和元數(shù)據(jù)集之間的關(guān)系,還可以在模型中對其它對象

進行分類。

SDMX標準給出了通用模型和語法選擇;對XML而言,它提供了支持上述所定義的任意類型的統(tǒng)計數(shù)據(jù)

進行交換的數(shù)據(jù)格式的選擇;在SDMX-ML中,針對每類實現(xiàn)中的具體需求而規(guī)定了幾種最優(yōu)化的格式。

圖1是信息模型中對象的簡單描述,其詳細內(nèi)容將在本標準的其它部分進行規(guī)定。

7

GB/TXXXXX—XXXX

圖1SDMX信息模型中的主要產(chǎn)物的高階示意圖

4.4統(tǒng)計交換的SDMX視圖

統(tǒng)計數(shù)據(jù)交換中“數(shù)據(jù)流”這個概念支持不間斷地進行數(shù)據(jù)報告或傳播?!皵?shù)據(jù)流”可以理解為不

受時間限制的數(shù)據(jù)集。數(shù)據(jù)結(jié)構(gòu)由機構(gòu)所擁有和維護,數(shù)據(jù)流也以類似的方式由維護機構(gòu)所擁有。

本標準中允許對統(tǒng)計數(shù)據(jù)(以及相關(guān)的結(jié)構(gòu)化元數(shù)據(jù))進行發(fā)布,同時還給出了引用元數(shù)據(jù)格式化

的表示法。引用元數(shù)據(jù)并非數(shù)據(jù)集的一個不可分割部分,它獨立于統(tǒng)計數(shù)據(jù)。SDMX給出了參考“元數(shù)據(jù)

集”、“元數(shù)據(jù)結(jié)構(gòu)定義”和“元數(shù)據(jù)流”。這些概念與數(shù)據(jù)集、數(shù)據(jù)結(jié)構(gòu)定義和數(shù)據(jù)流非常相似,但

是數(shù)據(jù)集、數(shù)據(jù)結(jié)構(gòu)定義和數(shù)據(jù)流更關(guān)注統(tǒng)計觀測,而元數(shù)據(jù)集、元數(shù)據(jù)結(jié)構(gòu)定義和元數(shù)據(jù)流更關(guān)注引

用元數(shù)據(jù)。同樣地,數(shù)據(jù)提供方可以發(fā)布統(tǒng)計數(shù)據(jù),也可以發(fā)布引用元數(shù)據(jù)。元數(shù)據(jù)結(jié)構(gòu)定義由機構(gòu)按

照與其維護數(shù)據(jù)結(jié)構(gòu)定義、數(shù)據(jù)集的結(jié)構(gòu)定義相類似的方式進行維護。

數(shù)據(jù)和引用元數(shù)據(jù)的結(jié)構(gòu)定義都將特定的統(tǒng)計概念與它們的表示法相關(guān)聯(lián)起來,而不論這些表示法

是文本表示還是編碼表示或其它表示等等。在本標準中,這些概念來自于特定機構(gòu)所維護的“概念方案”。

當某些概念是另一些概念的泛化時,概念方案則將一系列概念匯集成組,并給出了這些概念的定義和名

稱,同時還允許表達其語義關(guān)系。同一個概念方案既可以用于數(shù)據(jù)結(jié)構(gòu)——主族——也可以用于引用元

數(shù)據(jù)結(jié)構(gòu)。

在任意統(tǒng)計數(shù)據(jù)交換中以及在許多傳播活動中都隱含存在著“服務(wù)水平協(xié)議”的概念,即使這個

概念沒有被形式化或明確表達時也是如此。本標準以術(shù)語“供應(yīng)協(xié)議”表達了這個理念。數(shù)據(jù)提供方可

8

GB/TXXXXX—XXXX

以向多種不同的數(shù)據(jù)流提供數(shù)據(jù)。數(shù)據(jù)流可以整合多個數(shù)據(jù)提供方所提供的數(shù)據(jù)。供應(yīng)協(xié)議明確了哪一

個數(shù)據(jù)提供方通過何種數(shù)據(jù)流提供哪些數(shù)據(jù)。供應(yīng)協(xié)議也同樣適用于元數(shù)據(jù)流。

供應(yīng)協(xié)議可以按照以下方式獲得各種信息:統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)的發(fā)布時間、統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)的主

題(正如數(shù)據(jù)結(jié)構(gòu)定義或引用元數(shù)據(jù)結(jié)構(gòu)定義所描述的那樣)以及統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)所涵蓋的時間周期。

這些信息在SDMX信息模型中被稱為術(shù)語“約束”。

信息模型中描述的對象簡要概述如下:

a)數(shù)據(jù)集:以離散集合形式所組織的數(shù)據(jù),它包括了某一特定時間周期內(nèi)的觀測。數(shù)據(jù)集可以理解

為共享著某一結(jié)構(gòu)、并且涵蓋了某一確定時間周期的相似數(shù)據(jù)的集合。

b)數(shù)據(jù)結(jié)構(gòu)定義(DSD):每個數(shù)據(jù)集都擁有一套結(jié)構(gòu)化元數(shù)據(jù)。這些結(jié)構(gòu)化元數(shù)據(jù)在SDMX中稱之

為數(shù)據(jù)結(jié)構(gòu)定義,它包括了概念是如何與數(shù)據(jù)“立方體”的度量、維度和屬性相關(guān)聯(lián)的信息,同時也包

括了與數(shù)據(jù)和標識性、描述性(結(jié)構(gòu)性)的元數(shù)據(jù)的表示法都相關(guān)的信息。

c)代碼表:代碼表枚舉了一組數(shù)值,這些數(shù)值用于SDMX中的維度、屬性和其它結(jié)構(gòu)化內(nèi)容的表示。

代碼表還可以包括給出了代碼是如何組織成層級的其它結(jié)構(gòu)化元數(shù)據(jù)。

d)機構(gòu)方案:可以在機構(gòu)方案內(nèi)對機構(gòu)和機構(gòu)結(jié)構(gòu)進行定義。維護機構(gòu)、數(shù)據(jù)提供方、數(shù)據(jù)使用方

和組織單位都擁有特定的機構(gòu)方案。

e)分類方案和分類:分類方案由一個分類層級體系組成。在SDMX中,分類方案可以包括對數(shù)據(jù)和元

數(shù)據(jù)進行組織的任意類型。分類可將某一類型與某一可標識的對象相關(guān)聯(lián)。通過這種方式可以給對象集

進行分類。統(tǒng)計主題域方案在SDMX中作為分類方案來實施。

f)概念方案:概念方案是一個可維護的概念列表,這些概念用于數(shù)據(jù)結(jié)構(gòu)定義和元數(shù)據(jù)結(jié)構(gòu)定義中。

存在多個概念方案??梢砸?guī)定概念的“核心”表示法(例如,核心代碼表或其它諸如“日期”的表示法)。

注:在使用這一概念的數(shù)據(jù)結(jié)構(gòu)定義或元數(shù)據(jù)結(jié)構(gòu)定義中可以忽略這種核心表示法。

g)元數(shù)據(jù)集:引用元數(shù)據(jù)集是統(tǒng)計數(shù)據(jù)交換的SDMX視圖中描述對象的一系列信息:引用元數(shù)據(jù)集可

以描述數(shù)據(jù)或數(shù)據(jù)結(jié)構(gòu)定義的維護者;也可以描述發(fā)布數(shù)據(jù)的時間表;也可以描述單一類型的、隨時間

流動的數(shù)據(jù);也可以描述數(shù)據(jù)的質(zhì)量等。在SDMX中,引用元數(shù)據(jù)的創(chuàng)建者可以采用其關(guān)心的任意概念,

但是應(yīng)給出包含這些概念的引用元數(shù)據(jù)集。

h)元數(shù)據(jù)結(jié)構(gòu)定義:引用元數(shù)據(jù)集也擁有描述自身如何進行組織的結(jié)構(gòu)化元數(shù)據(jù)集。該結(jié)構(gòu)化元數(shù)

據(jù)集標識了正使用的引用元數(shù)據(jù)的概念、這些概念之間的關(guān)系(通常為層級關(guān)系)、它們的表示法結(jié)構(gòu)

和它們是如何進行表示的(作為自由文本、作為編碼數(shù)值等),以及它們與哪些SDMX對象類型相關(guān)聯(lián)。

i)數(shù)據(jù)流定義:在SDMX中,數(shù)據(jù)集按照數(shù)據(jù)流定義進行報告或傳播。數(shù)據(jù)流定義標識了數(shù)據(jù)結(jié)構(gòu)定

義,并且可以通過分類(已組織的分類方案促進了數(shù)據(jù)的搜索)與一個或多個主題域相關(guān)聯(lián)。根據(jù)報告

的周期性或數(shù)據(jù)集中所允許的可能鍵碼子集,約束還可以附加到數(shù)據(jù)流定義中。

j)元數(shù)據(jù)流定義:元數(shù)據(jù)流定義與數(shù)據(jù)流定義非常類似,但是它用于對元數(shù)據(jù)集進行描述、分類和

約束。

k)數(shù)據(jù)提供方:生成數(shù)據(jù)或引用元數(shù)據(jù)的機構(gòu)即稱為數(shù)據(jù)提供方。

l)供應(yīng)協(xié)議:描述數(shù)據(jù)提供方以某種方式提供數(shù)據(jù)集和元數(shù)據(jù)集的信息集。供應(yīng)協(xié)議可以與數(shù)據(jù)或

元數(shù)據(jù)流定義大致相同的方式進行約束。因此,數(shù)據(jù)提供方可以闡述提供了某一特定數(shù)據(jù)流的事實,這

些數(shù)據(jù)流涵蓋了地區(qū)和主題的特定集合。重要的是,供應(yīng)協(xié)議(以URL的形式)包含注冊數(shù)據(jù)或元數(shù)據(jù)

的實際來源。此處之所以使用“協(xié)議”這個術(shù)語,是因為這些信息可以理解為“服務(wù)水平協(xié)議”的基礎(chǔ)。

然而,在SDMX中,供應(yīng)協(xié)議是用于支持技術(shù)系統(tǒng)的元數(shù)據(jù),而不屬于任何類型的合同信息(這些合同信

息不包括在本標準范圍內(nèi))。

m)約束:約束描述了一個數(shù)據(jù)源或元數(shù)據(jù)源的子集,也可以提供關(guān)于數(shù)據(jù)定期發(fā)布的信息。約束與

數(shù)據(jù)提供方、供應(yīng)協(xié)議、數(shù)據(jù)流、元數(shù)據(jù)流、數(shù)據(jù)結(jié)構(gòu)定義和元數(shù)據(jù)結(jié)構(gòu)定義相互關(guān)聯(lián)。

9

GB/TXXXXX—XXXX

n)結(jié)構(gòu)集:結(jié)構(gòu)集給出了將結(jié)構(gòu)化元數(shù)據(jù)進行分組匯集,從而形成完整描述了特定的而又相互關(guān)聯(lián)

的數(shù)據(jù)集和元數(shù)據(jù)之間的關(guān)系。結(jié)構(gòu)集可用于對維度和屬性與其他維度和屬性進行相互映射,以及對概

念進行映射、對代碼表進行映射和對分類方案進行映射。在同一數(shù)據(jù)“立方體”中,即使數(shù)據(jù)沒有在同

一維度,結(jié)構(gòu)集也可用于描述數(shù)據(jù)“立方體”。

o)報告分類法:報告分類法允許機構(gòu)(可能以層級方式)將許多數(shù)據(jù)立方體或數(shù)據(jù)流定義聯(lián)系起來,

從而共同形成一個完整的數(shù)據(jù)或元數(shù)據(jù)“報告”。報告分類法支持通常由多個不同種類的數(shù)據(jù)立方體所

構(gòu)成的主要報告,但也可以支持其它的采集和報告功能。根據(jù)包含在出版物中的數(shù)據(jù)或元數(shù)據(jù),報告分

類法還可以支持諸如年鑒之類的出版物的規(guī)范。

p)過程:過程給出了將一系列相互連接的過程步驟作為建模統(tǒng)計過程的方式。盡管它并不是統(tǒng)計數(shù)

據(jù)和元數(shù)據(jù)交換和傳播的中心,但擁有一個共享的過程描述就可以對描述與過程相關(guān)概念的引用元數(shù)據(jù)

集進行互操作交換和傳播。

q)層級代碼表:代碼表支持代碼層級規(guī)范。這些代碼可以從代碼表中進行引用,而代碼表可以對代

碼進行維護。因此,層級代碼表規(guī)定了一種或多種層級的代碼結(jié)構(gòu),但沒有規(guī)定這些代碼本身。

結(jié)構(gòu)化數(shù)據(jù)的注意事項如下:

“立方體”數(shù)據(jù)是一種豐富的、多維度的結(jié)構(gòu),可以沿它的任意一個軸(或“維度”)對它進行

觀察。盡管在SDMX中可以描述立方體數(shù)據(jù)的完整結(jié)構(gòu),但是SDMX的實際“數(shù)據(jù)”規(guī)范在本標準中對這些

需求采用了相對簡化的視圖,其目的在于對傳輸?shù)臄?shù)據(jù)做格式化處理。在許多SDMX格式中的數(shù)據(jù)視圖主

要為時間序列——也就是說,是作為沿時間維度進行組織的一系列觀測數(shù)據(jù),這樣使得每個觀測的數(shù)據(jù)

是按照時間逐漸出現(xiàn)的。

然而,還有許多類型的統(tǒng)計數(shù)據(jù),它們并沒有按照時間序列來進行組織交換,而是沿立方體的一些

其它非時間的維度進行組織,這些數(shù)據(jù)稱為“橫截面”數(shù)據(jù)。SDMX支持統(tǒng)一的格式,而在數(shù)據(jù)集中,這

種格式表示了沿任意一種維度的數(shù)據(jù)組織方式。在這種語境下,時間序列就是這種統(tǒng)一格式的一個特例。

在統(tǒng)計數(shù)據(jù)“立方體”中,另一種結(jié)構(gòu)類型通常是層級分類,它用于描述沿立方體任意維度(或坐

標軸)上的點,本標準對這些層級分類進行了介紹。

此外,本標準提供了對立方體的不同維度之間的功能相互依賴性的表達,并且還支持對“稀疏立方

體”進行更好的處理。這也是“約束”的一個方面,約束允許對立方體區(qū)域進行劃定,或允許在數(shù)據(jù)結(jié)

構(gòu)定義所描述的全部鍵集中提供一組有效的鍵。

結(jié)構(gòu)化引用元數(shù)據(jù)的注意事項如下:

元數(shù)據(jù)結(jié)構(gòu)以“概念可以組織成語義和表示法層級”這一思想為基礎(chǔ),而且這些層級可以構(gòu)成結(jié)構(gòu)

化XML報告格式的基礎(chǔ)。SDMX-ML中存在3種服務(wù)于以下目的的報文類型:結(jié)構(gòu)化報文(提供元數(shù)據(jù)結(jié)構(gòu)

定義)、通用元數(shù)據(jù)報文(為任意元數(shù)據(jù)結(jié)構(gòu)定義提供單一格式)以及特定結(jié)構(gòu)元數(shù)據(jù)報文(提供一種

特定元數(shù)據(jù)結(jié)構(gòu)定義格式)。通常地,這種機制適用于支持對引用元數(shù)據(jù)進行報告和傳播。

元數(shù)據(jù)結(jié)構(gòu)定義可以從概念方案中采用概念,并可以將這些概念作為元數(shù)據(jù)屬性來描述如何形成報

告或傳播的結(jié)構(gòu),元數(shù)據(jù)屬性或者以扁平化列表,或者以層級形式出現(xiàn)。元數(shù)據(jù)屬性包含表示法(代碼

型、文本型等等)以及出現(xiàn)次數(shù)。元數(shù)據(jù)的“目標”——也就是過程類、信息、機構(gòu)、交換等——這也

是所描述的元數(shù)據(jù)的主題。由于SDMX信息模型給出了形式化的統(tǒng)計數(shù)據(jù)交換和傳播,因此,此模型可以

用作統(tǒng)計數(shù)據(jù)活動中不同參與者和資源之間的拓撲結(jié)構(gòu)。這樣,引用元數(shù)據(jù)集的“目標”(主題)和元

數(shù)據(jù)流可以通過參考此模型而描述成相應(yīng)的一些標準。

與數(shù)據(jù)結(jié)構(gòu)一樣,元數(shù)據(jù)集的通用格式給出了一種已知的文檔結(jié)構(gòu),然而該結(jié)構(gòu)的專用格式是專門

從元數(shù)據(jù)結(jié)構(gòu)定義處衍生而來的、并且能夠執(zhí)行更高程度的模式校驗。

4.5SDMX注冊服務(wù)

10

GB/TXXXXX—XXXX

為了使SDMX模型中的數(shù)據(jù)和元數(shù)據(jù)可視化,本標準提供了一套注冊服務(wù)的體系架構(gòu)?!白浴保?/p>

以理解為Web服務(wù)中的術(shù)語)是對用于查詢的元數(shù)據(jù)進行維護和存儲的一種應(yīng)用程序,并且可以被網(wǎng)絡(luò)

上擁有足夠訪問特權(quán)的任何其它應(yīng)用程序所使用(需要指出的是,訪問控制機制不屬于本標準的范圍)。

注冊可以是分布式數(shù)據(jù)庫或元數(shù)據(jù)注冊庫的索引,而元數(shù)據(jù)注冊庫是由統(tǒng)計機構(gòu)中的數(shù)據(jù)提供方所提供

的數(shù)據(jù)集和引用元數(shù)據(jù)集所組成,這些元數(shù)據(jù)注冊庫位于因特網(wǎng)或類似的網(wǎng)絡(luò)中。

注:SDMX注冊服務(wù)并不關(guān)心數(shù)據(jù)或引用元數(shù)據(jù)的存儲。此處假設(shè)數(shù)據(jù)和引用元數(shù)據(jù)位于數(shù)據(jù)提供方的網(wǎng)站上。SDMX

注冊服務(wù)自身與數(shù)據(jù)和引用元數(shù)據(jù)的可視化相關(guān),并且與需要訪問的數(shù)據(jù)和引用元數(shù)據(jù)的信息相關(guān)。因此,注

冊庫中注冊的數(shù)據(jù)集擁有它的URL而不是數(shù)據(jù)本身。擬訪問這些數(shù)據(jù)的應(yīng)用程序可以通過分類方案和數(shù)據(jù)流以

數(shù)據(jù)下鉆的方式來查詢注冊庫,以獲取已注冊數(shù)據(jù)源的URL,并且隨后直接從數(shù)據(jù)提供方處獲取這些數(shù)據(jù)(通

過使用SDMX-ML查詢消息或其它機制)。

SDMX不要求在實現(xiàn)注冊庫時采用任何特別的技術(shù),相反,它規(guī)定了注冊庫能夠支持的標準化接口。

因此,只要接口符合本標準的規(guī)定,則用戶可以采用其所選擇的任何形式來實現(xiàn)符合SDMX規(guī)范的注冊庫。

這些接口以XML文檔的形式表示,并成為SDMX-ML的組成部分。

SDMX不要求在實現(xiàn)注冊庫時采用任何特別的技術(shù),相反,它規(guī)定了注冊庫能夠支持的標準化接口。

因此,只要接口符合本標準的規(guī)定,,則用戶可以采用其所選擇的任何形式來實現(xiàn)符合SDMX規(guī)范的注冊

庫。這些接口以XML文檔的形式表示,并成為SDMX-ML的組成部分。

注冊服務(wù)可以簡要概述如下:

a)結(jié)構(gòu)化元數(shù)據(jù)的維護:該注冊服務(wù)允許具有維護機構(gòu)訪問權(quán)的用戶提交和修改結(jié)構(gòu)化元數(shù)據(jù)。

在這一方面,注冊起到結(jié)構(gòu)化元數(shù)據(jù)庫的作用。然而,在SDMX結(jié)構(gòu)中允許只提交結(jié)構(gòu)化對象的“存根”,

例如代碼表;并且對該“存根”而言,可以引用獲取的元數(shù)據(jù)實際位置,或者引用文件的實際位置,或

結(jié)構(gòu)化元數(shù)據(jù)源的實際位置(諸如另一注冊庫)。

b)數(shù)據(jù)和元數(shù)據(jù)源的注冊:注冊服務(wù)允許擁有維護機構(gòu)訪問權(quán)的用戶來通知數(shù)據(jù)集和引用元數(shù)據(jù)

集的存在及其位置(以便獲取)。注冊庫存儲有關(guān)這些對象的元數(shù)據(jù),并且將元數(shù)據(jù)與結(jié)構(gòu)化元數(shù)據(jù)鏈

接起來,而結(jié)構(gòu)化元數(shù)據(jù)則為應(yīng)用程序提供了足夠的結(jié)構(gòu)化信息,以便應(yīng)用程序進行處理或發(fā)現(xiàn)它的存

在。注冊庫中的對象按照一個或多個分類方案進行組織和分類。

c)查詢:注冊服務(wù)擁有查詢注冊庫中所包含的元數(shù)據(jù)的接口;因此,應(yīng)用程序和用戶可以發(fā)現(xiàn)數(shù)據(jù)

集和引用元數(shù)據(jù)集、結(jié)構(gòu)化元數(shù)據(jù)以及與這些對象相關(guān)聯(lián)的提供方/機構(gòu),還可發(fā)現(xiàn)對這些數(shù)據(jù)和元數(shù)

據(jù)如何獲取以及如何分類等進行描述的供應(yīng)方協(xié)議。

d)訂閱/通知:可以在注冊庫中“訂閱”特定的對象;這樣,一旦注冊對象進行更新時,就可以將

通知發(fā)送給所有訂閱者。

4.6Web服務(wù)

Web服務(wù)允許計算機應(yīng)用程序可以直接通過因特網(wǎng)交換數(shù)據(jù),特別是可以通過比以往更為靈活的方

式實現(xiàn)模塊化或分布式計算。然而,為了發(fā)揮web服務(wù)的功能,要求制訂以下方面的標準:請求和提供

數(shù)據(jù)標準;表示用來打包交換數(shù)據(jù)的封裝數(shù)據(jù)標準;在相互之間描述web服務(wù)的標準,以便更容易地集

成到使用了其它web服務(wù)來作為數(shù)據(jù)源的應(yīng)用程序中。

SDMX以某種方式為使用了可以促進SDMXweb服務(wù)之間互操作性的這些標準提供了指南,并且允許創(chuàng)

建通用客戶端應(yīng)用程序,而這些通用客戶端應(yīng)用程序可以與實施了這些指南的任意SDMXweb服務(wù)進行有

含義的信息交流。

具體而言,SDMXweb指南提供了以下幾方面內(nèi)容:

a)為基于SOAP的web服務(wù)提供了標準化接口(WSDL):Web服務(wù)指南包含了一套web服務(wù)功能,但

是通過實施發(fā)現(xiàn),這些功能還不足以支持目前正在開發(fā)的基于SDMX的web服務(wù)類型。進一步而言,操作

及其工作載荷目前均已實現(xiàn)了標準化(WSDL)。

11

GB/TXXXXX—XXXX

b)為RESTfulweb服務(wù)提供了標準化接口(WADL):RESTfulAPI注重簡潔性。其目的不是復(fù)制SDMX-ML

查詢信息的完整語意的豐富性,而是將其簡化以便執(zhí)行標準查詢的有限集合。然而,與SDMX規(guī)范其它部

分的作用不同,RESTfulAPI只側(cè)重于(通過HTTPGET)獲得數(shù)據(jù)。

標準化的常見錯誤代碼列表出現(xiàn)情況如下:當使用web服務(wù)時,有必要設(shè)置一些錯誤代碼,在遇到

問題時這些錯誤代碼有助于解釋所出現(xiàn)問題的狀況。

5SDMX信息模型

SDMX給出了對統(tǒng)計數(shù)據(jù)進行建模的方法,并且定義了用于此目的的元數(shù)據(jù)結(jié)構(gòu)集。為了表示數(shù)據(jù)和

結(jié)構(gòu)化的元數(shù)據(jù),則SDMX以兩種語法形式來規(guī)定格式,因此,此模型可以用作為確保不同格式之間的轉(zhuǎn)

換不發(fā)生信息損失的一種機制。

SDMX認為統(tǒng)計數(shù)據(jù)是結(jié)構(gòu)化的。在SDMX中,這種結(jié)構(gòu)就是術(shù)語“數(shù)據(jù)結(jié)構(gòu)定義”?!皵?shù)據(jù)集”由一

個或多個低階的“組”所構(gòu)成、并以這些組的相似程度為基礎(chǔ)。每個組依次由一個或多個數(shù)據(jù)“序列”

所構(gòu)成。每個系列或段都有一個“鍵碼”,它是每個簇種概念的值,該值也稱為“維度”。鍵碼用來標

識一個或多個“觀測”數(shù)據(jù),而觀測數(shù)據(jù)通常是與觀測時間和觀測值(如度量)相關(guān)聯(lián)的。另外,元數(shù)

據(jù)可以作為描述性“屬性”附加于該結(jié)構(gòu)的任意層。本標準中,對代碼表(枚舉)、數(shù)據(jù)和元數(shù)據(jù)表示

法的其它模式也進行了建模。

通常用于處理統(tǒng)計數(shù)據(jù)的“立方體”結(jié)構(gòu)與SDMX信息模型中的數(shù)據(jù)結(jié)構(gòu)定義概念之間存在某些相似

性。應(yīng)注意:為方便進行交換對符合SDMX信息模型結(jié)構(gòu)化的數(shù)據(jù)進行優(yōu)化,并且有可能與那些沒有能力

處理來自復(fù)雜統(tǒng)計系統(tǒng)的數(shù)據(jù)“立方體”的合作伙伴進行交換。SDMX時間序列可以理解為“立方體”的

切片。這樣的切片可由鍵碼作為標識。一個“序列”鍵碼是由除時間以外的、主鍵族所規(guī)定的所有維度

的值所組成。根據(jù)結(jié)構(gòu)化的SDMX數(shù)據(jù)可以重新構(gòu)建和描述數(shù)據(jù)立方體,也可以根據(jù)本標準來交換這些數(shù)

據(jù)庫。

SDMX標準還給出了引用元數(shù)據(jù)的視圖:統(tǒng)計數(shù)據(jù)交換過程的SDMX視圖中用于參考具有含義的“對象”

(數(shù)據(jù)提供方、結(jié)構(gòu)、供應(yīng)協(xié)議、數(shù)據(jù)流、元數(shù)據(jù)流等)的機制,并且元數(shù)據(jù)依附于該“對象”;也是

用于描述一套有含義的概念,并且可將這些概念組織成表示結(jié)構(gòu),同時指出它們的值是如何表示的機制。

這種機制以引用元數(shù)據(jù)的一個簡單、層級化的視圖為基礎(chǔ);對許多元數(shù)據(jù)系統(tǒng)和分類方案來說,該引用

元數(shù)據(jù)的視圖是一種常用的視圖。SDMX給出了一種模型(和XML格式),既可以用于描述引用元數(shù)據(jù)結(jié)

構(gòu),也可以根據(jù)這些結(jié)構(gòu)報告引用元數(shù)據(jù)。

本標準支持與統(tǒng)計數(shù)據(jù)交換過程相關(guān)的元數(shù)據(jù)。本標準可以對過程的步驟進行建模;也可以表達由

誰提供數(shù)據(jù)和引用元數(shù)據(jù)以及他們是如何被提供的有關(guān)信息;并且還可以表達服務(wù)水平協(xié)議(以及相似

類型的供應(yīng)協(xié)議)的技術(shù)方面。

SDMX信息模型描述了上面所列的所有對象,以便展示統(tǒng)計數(shù)據(jù)交換過程的標準視圖。

SDMX信息模型通過UML進行表示,同時也以文本形式進行描述。盡管信息模型并不是標準化的,然

而它是理解和使用標準化格式規(guī)范的有價值的工具。

6SDMX-EDI

SDMX-EDI格式從GESMES/TS3.0版實施指南中抽取而來,并且作為SDMX機構(gòu)的一項標準進行出版發(fā)

行。

a)統(tǒng)計定義:UN/EDIFACT格式中,對SDMX信息模型所覆蓋的結(jié)構(gòu)化元數(shù)據(jù)所進行的表達。

12

GB/TXXXXX—XXXX

b)統(tǒng)計數(shù)據(jù):雙方之間經(jīng)優(yōu)化的、用于批量交換的大量時間序列數(shù)據(jù),它允許對大量的整體或部分

數(shù)據(jù)集進行極為緊湊的表達。如果諸如橫截面數(shù)據(jù)之類的非時間序列數(shù)據(jù)作為重新打包的時間序列進行

表示,則其可以得到支持,但是,SDMX-EDI格式并沒有對橫截面數(shù)據(jù)提供直接的支持。

c)數(shù)據(jù)集列表:數(shù)據(jù)集及其結(jié)構(gòu)化元數(shù)據(jù)的列表。

SDMX信息模型給出了SDMX-EDI所使用的EDIFACT語法和SDMX-ML所使用的XML語法中都出現(xiàn)的結(jié)構(gòu)。

由于這兩種語法實施都反映了相同的邏輯結(jié)構(gòu),所以SDMX-EDI數(shù)據(jù)和結(jié)構(gòu)化元數(shù)據(jù)報文可以轉(zhuǎn)換成相應(yīng)

的SDMX-ML格式,反之亦然。因此,這些標準規(guī)定了基于UN/EDIFACT的以及基于XML的兩個系統(tǒng)處理以及

交換統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)之間的互操作。

7SDMX-ML

SDMX-EDI格式主要用于支持批量交換,而SDMX-ML支持著更大范圍的需求。XML格式用于許多不同類

型的自動化處理,因而它必然會支持更多不同的應(yīng)用場景。這就是多種類型的、可用的報文都采用

SDMX-ML格式的原因。每種類型的報文都適合于支持某一特定類的處理需求。

——結(jié)構(gòu)定義:所有SDMX-ML報文類型都共享著元數(shù)據(jù)(此處的元數(shù)據(jù)需理解和處理數(shù)據(jù)集和元數(shù)據(jù)

集)的通用XML表達式,并且還包含有關(guān)分類方案和機構(gòu)的附加元數(shù)據(jù)。而且,數(shù)據(jù)和元數(shù)據(jù)供應(yīng)(數(shù)

據(jù)流和元數(shù)據(jù)流)的結(jié)構(gòu)化方面也采用此格式進行描述;

——通用數(shù)據(jù):SDMX-ML中所有可以表達的統(tǒng)計數(shù)據(jù)都可以按照此數(shù)據(jù)格式進行標記,并且與結(jié)構(gòu)

定義報文的內(nèi)容相一致。對于應(yīng)用程序接收所需要的數(shù)據(jù)的任意場景而言,應(yīng)按照單一的格式進行設(shè)計

和處理。這些應(yīng)用程序在處理數(shù)據(jù)集之前,可能需要對數(shù)據(jù)集的結(jié)構(gòu)進行獨立訪問。以這種格式標記的

數(shù)據(jù)并不特別緊湊,但這些數(shù)據(jù)可以輕松獲得數(shù)據(jù)集的所有內(nèi)容。通過使用通用的XML解析器,這種格

式并沒有在數(shù)據(jù)集與其結(jié)構(gòu)定義之間提供嚴格的驗證。它既支持部分數(shù)據(jù)集(不斷更新)的傳輸,又支

持整個數(shù)據(jù)集的傳輸。同時,它還支持時間序列和橫截面用例;

——特定結(jié)構(gòu)的數(shù)據(jù):這種格式專用于數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)定義(換言之,它是特定的DSD),并且遵

循結(jié)構(gòu)定義報文中所定義的元數(shù)據(jù)結(jié)構(gòu)和該格式的技術(shù)規(guī)范之間的映射關(guān)系而創(chuàng)建。這種格式支持以

XML格式進行大數(shù)據(jù)集的交換(通常情況下,數(shù)據(jù)集的大小為通用數(shù)據(jù)所表達的相同數(shù)據(jù)的50%);通過

通用的XML解析器,這種格式還提供了與DSD進行符合性的嚴格驗證,并且還支持部分數(shù)據(jù)集(不斷更新)

以及整個數(shù)據(jù)集的傳輸;

許多XML工具和技術(shù)都對XMLSchema所執(zhí)行的功能有所預(yù)期,其中之一就是,XMLSchema中所描述的

XML結(jié)構(gòu)與XML實例中帶有標志符的數(shù)據(jù)之間存在非常緊密的直接關(guān)系。如果支持帶標簽數(shù)據(jù)的完整性校

驗,則通常認為需要強數(shù)據(jù)類型。設(shè)計這些報文類型的目的是支持校驗和其它所預(yù)期的XMLSchema功能。

——通用元數(shù)據(jù):SDMX-ML格式中所有可以表示的引用元數(shù)據(jù)都可以按照SDMX-ML進行標記。它只執(zhí)

行最低程度的校驗,并且稍顯冗長,然而它確實支持通用軟件工具和服務(wù)的創(chuàng)建,以便處理引用元數(shù)據(jù);

——特定結(jié)構(gòu)的元數(shù)據(jù):對于每一種元數(shù)據(jù)結(jié)構(gòu)定義,都可以創(chuàng)建一種該結(jié)構(gòu)專用的XML

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論