聯系我們contact

電(diàn)話(huà):027-59760188-801

地(dì)址:武漢市(shì)東(dōng)湖(hú)高(gāo)新開(kāi)發區∏ (qū)光(guāng)谷大(dà)道(dào)120号現(xφ&iàn)代森(sēn)林(lín)小(xiǎo¥¥)鎮A座609室

分(fēn)析儀器(qì)原始數(shù)據格式的(de♦>)通(tōng)用(yòng)标準AnIML

發布時(shí)間(jiān):2018-03-18 浏覽次數(shù):1022次

所有(yǒu)實驗室面對(duì)一(yī)個(gèσσ)共同問(wèn)題是(shì)實驗數(shù)據的₩♦♦(de)處理(lǐ)和(hé)交換,這(zhè)裡(lǐ)尤其以分(fē≈↔ n)析實驗室最為(wèi)典型。我們走訪諸多(duō£×≈)分(fēn)析實驗室時(shí),大(dà)家(jiā)談到(dàoε₩)最多(duō)的(de)就(jiù)是(shì)分(fēn)析‍✘±儀器(qì)的(de)原始數(shù)據,包括其保存,處理(lǐ‍♦≥€),再分(fēn)析等問(wèn)題。大(dà)家(jiā)都(dō ₹&u)有(yǒu)一(yī)個(gè)烏托邦式的(de)夢想,那(nà)就↑↕ ε(jiù)是(shì)可(kě)以用(yòng)一(yī)種軟件(jiàn)打€'開(kāi)多(duō)個(gè)不(bù)同廠(chǎng←©★)家(jiā),不(bù)同類型的(de)分(fēn)析數(shù)據。夢想歸✘•£夢想,現(xiàn)實仍然是(shì)現♣₹•(xiàn)實。儀器(qì)供應商們提供儀器(qì)的(de♥€≠)同時(shí)都(dōu)會(huì)采用(yòng)自(zì)己的♦±α(de)專有(yǒu)格式的(de)數(shù)據,這(zhè)導緻了(© ✘le)數(shù)據處理(lǐ),協作(zuò),儀器(q∞£" ì)集成和(hé)存檔遇到(dào)很(hěn)多(duō)問(w→£•↓èn)題。在處理(lǐ)這(zhè)些(♦§xiē)原始數(shù)據時(shí)除了(le)廠(chǎng)家(jiā)≈↑配套的(de)軟件(jiàn),很(hěn)少(sh♥Ωǎo)有(yǒu)可(kě)選的(de)餘地(dì↓¶)。

從(cóng)2003年(nián)開(k±↔āi)始, ASTM E13.15小(xiǎo)組>®←€委員(yuán)會(huì)開(kāi)始籌劃開(kāi)發一(yī)套分(f≤£♥$ēn)析數(shù)據的(de)通(tōng♥×∑)用(yòng)标準,力求适用(yòng)于所有(yǒu)分(fēn)析∏∑≥儀器(qì)技(jì)術(shù),并将其命名為(wèi)α'AnIML。為(wèi)了(le)平衡各方利益,該小(xiǎo)組聚集了(≤≤≤le)來(lái)自(zì)儀器(qì)♥β©♣廠(chǎng)商,最終用(yòng)戶★≤λ,政府機(jī)構和(hé)學術(shù)界的(de)人(rén)士,共&∞§同商討(tǎo)以确保格式完整,适用(yòng)性強。

AnIML并不(bù)是(shì)業(yè)界第一(yī)次嘗試将σ‍★φ分(fēn)析數(shù)據标準化(huà)÷<₽≤。之前已經設計(jì)過多(duō)種标準,如(rú)AN€&φDI(也(yě)叫NetCDF,适用(yòng)于GC,LC,MS),JCA¶→✘MP-DX(IR,FTIR,NMR,UV/Vis),Spe₽≈'ctroML(分(fēn)子(zǐ)光(guāng)譜數(shù)據)π♦¶♠以及mzML(質譜),以及一(yī)些(π↕ ™xiē)儀器(qì)公司倡導的(de)标準,如(rú)Thermo 所提出的♥↑☆↑(de)GAML。雖說(shuō)這(zhè)些(xiē)數(shù)據格'×σ式在分(fēn)析儀器(qì)行(xíng)業(yè)取得(de)了(♦♥le)較大(dà)的(de)支持力度,但(dàn ‌Ω₽)它們大(dà)都(dōu)隻針對(duì)特定的(de)分(fēn)>↓析技(jì)術(shù),例如(rú)J∑±CAMP-DX主要(yào)針對(duì)的(de)光(guā$←λng)譜技(jì)術(shù),而AnIML期望建立的(de)是(↓​shì)一(yī)種适用(yòng)于所有(yǒu)分(fēn≤>♦¥)析技(jì)術(shù)的(de)數(shù)據格式。借助清晰完整的(d☆¶e)擴展方式,即便将來(lái)出現(xiàn)了(le)新的(de)分(fē®∑₹₩n)析技(jì)術(shù),也(yě)不(bù)用(yòng)改變∞☆現(xiàn)有(yǒu)的(de)軟件(jiàn),從(cóng)而簡化(h₹$<≤uà)數(shù)據管理(lǐ)的(de)工(gōng)作(zuò)。由此, ‌€XML這(zhè)門(mén)強大(dà)而影(yǐng)響深遠(≈↔₽yuǎn)的(de)語言終于可(kě)以将其影(yǐε♥§ng)響力擴展到(dào)分(fēn)析實驗室。

AnIML是(shì)基于W3C XML标準←↑的(de)技(jì)術(shù)。XML獨立于平台,易于創☆ '≤建,使用(yòng)和(hé)維護。這(zhè)降低(dī)了(le‌↕≤ )使用(yòng)門(mén)檻,幾乎所±₹σ有(yǒu)的(de)主流軟件(jiàn)開(kāi)發商都(d‍ ←★ōu)支持XML,并且存在大(dà)量以XML格式為(wèi)基礎的(de)工¥¥(gōng)具。 由于XML是(shì)基于文(wén)本的(¥ε‌βde)。因此可(kě)以用(yòng)最簡單的(de)♣∑文(wén)本編輯器(qì)編輯AnIML文(wén)件(jiàn) – 而不π☆(bù)需要(yào)特定的(de)軟件(jiàn)。盡管這(zhè)樣♦★不(bù)一(yī)定方便,但(dàn)保留‌∞δ這(zhè)一(yī)特性是(shì)用(yòng)于長(cháng)期 €₩數(shù)據保存方案的(de)關鍵:即使丢失了(le)之前的(de)軟件♣¶(jiàn),我們仍舊(jiù)可(kě)以獲取我們需要(yào)的¶♣(de)數(shù)據。

實現(xiàn)AnIML的(de)靈活性和(hé)通(tōng)用(yòn≠↑g)性的(de)方法并不(bù)複雜(zá),AnIMLσφ₩數(shù)據标準包含兩個(gè)部分(₩₹☆fēn),一(yī)個(gè)是(shì)♦">&通(tōng)用(yòng)的(de)數(shù)據容器(q>₹ì),稱為(wèi)AnIML核心(AnIML core),可(kě)以存儲任★→何科(kē)學數(shù)據。構成AnIML核心的(de)包括樣品數(s↑ε✘hù)據集(SampleSet)、實驗步驟數(sh↔↓ù)據集(ExperimentStepSet)、審計(jì)跟蹤記錄'♠♥©數(shù)據集(AuditTrailEntry&≠®✔Set)、簽名記錄集(SignatureSet)®™♠₽。

 

在AnIML的(de)核心之上(shàng ∞ ),是(shì)“技(jì)術(shù)₩∏≤®定義”(Technique Definition)部分(fēn),所謂的(‍​ de)“技(jì)術(shù)定義”就(jiù)是(shì)說(shuō)明(∞ míng)針對(duì)某種分(fēn)析技(jì)術(shù)如(rú♦απ)何去(qù)使用(yòng)數(shù)據容器(qì)。技(jì)γ≤↑術(shù)定義(Technique Definition)可(kě)以被看×≠∞©(kàn)作(zuò)是(shì)記錄某種分(fēn)析實驗所需δ♥¶要(yào)的(de)數(shù)據字段的(de)目錄。技(jì)術(s≠£​hù)定義文(wén)件(jiàn)屬于常規的(de)XM≠★¶✔L文(wén)件(jiàn)中的(de)DTD文(wén)件(jiàn),£↕↑可(kě)以随時(shí)重新創建。通(tōng)過 DTD×₩•✘,每一(yī)個(gè) XML 文(wén)件(jiàn)均可(kě)攜帶一 ₩★(yī)個(gè)有(yǒu)關其自(zì)身(shēn)格式的(d∏×e)描述。雖說(shuō)AnIML是(shì)普适<&>性的(de),但(dàn)對(duì)于一(yī)些(xiē≥​↑)具體(tǐ)的(de)很(hěn)流行(xín÷'&g)的(de)分(fēn)析技(jì)術✔×(shù),例如(rú)液相(xiàng)‌∑♦☆色譜,紫外(wài)光(guāng)譜,除了(le)實驗®Ω∑ 的(de)一(yī)些(xiē)公共特征,還(háiβ∞)是(shì)有(yǒu)其自(zì)身(shēn¥↑™)獨有(yǒu)的(de)一(yī)些(xiē) ε屬性的(de)。通(tōng)過 DTD,大(dà)家(jiā)可(kě)一≠≠(yī)緻地(dì)使用(yòng)某個(gè)εΩα标準的(de) DTD(HPLC,IR) 來(lái)交換數<&<'(shù)據。而應用(yòng)程序也(yě)可(kě)使用(y ↔↕òng)某個(gè)标準的(de) DTD 來(lái‍δ≥γ)驗證從(cóng)外(wài)部接收到(dào)的(de)數 $Ω≥(shù)據。同時(shí)還(hái)可("↓♣±kě)以使用(yòng) DTD 來(lái)驗證自(zì)身(shēn)λ₹→的(de)數(shù)據。

作(zuò)為(wèi)一(yī)種通(​₩‍tōng)用(yòng)型的(de)數(♦∞≈shù)據表示方法,AnIML适合于包括光(guāng♦γ)譜,色譜,圖像,生(shēng)物(wù)分(fēn)析等各種數(shù)據σ&↑的(de)表示。除了(le)經常使用(yòng)的(d¶★ ♥e)分(fēn)析儀器(qì)數(shù)據,AnIML¶¥ 也(yě)可(kě)用(yòng)于新興的(de)數(shù)據格式或一(‌≠yī)次性的(de)探索性實驗,例如(rú)微(wēi)流體(tǐ)÷•芯片或特殊的(de)傳感器(qì)。随著(zhe)技(jìε✔)術(shù)的(de)發展,新的(de)分(fēn)析技(jì)術(shù)±>↓和(hé)其相(xiàng)應的(de)技(jì¥→λ)術(shù)說(shuō)明(míng)都(dōu)将取得(de)進™✘步。這(zhè)種通(tōng)用(yòng)性的(de)方法允₽Ω許系統繼續使用(yòng)這(zhè)些(xiē)早期↑¥→的(de)AnIML文(wén)件(jiàn),而無需≤<♣>對(duì)軟件(jiàn)進行(xíng)修改或升級。

 專有(yǒu)格式

 通(tōng)用(yòng)格式/标準格式

 二進制(zhì)

 基于ASCII碼 (例如(rú)XML)

 結構緊湊

 冗長(cháng)

 快(kuài)速讀(dú)/寫

 讀(dú)寫慢(màn)

 用(yòng)戶數(shù)據采集和(hé)處理(lǐ)

 主要(yào)用(yòng)于數(shù)據&∏©​共享和(hé)長(cháng)期保存

如(rú)果我們有(yǒu)心好(hǎo)好(hǎo)₹±δ↓看(kàn)看(kàn)AnIML的(de)技(jì)術(shù)文(w ↑♦én)檔,你(nǐ)會(huì)發現(xi§ àn)AnIML就(jiù)是(shì)純粹的(de)XML♥‌技(jì)術(shù)。這(zhè)将大(dà)大(€α‌dà)降低(dī)我們利用(yòng)這(zhè)'♣α一(yī)新技(jì)術(shù)的(de)難度。能(néng)≤'↔¶夠讀(dú)取和(hé)解析XML文(wén)→✘Ω檔的(de)軟件(jiàn)不(bù)勝枚舉。為(wèi)了(l∞∞e)掃盲,我這(zhè)裡(lǐ)再啰嗦幾句。XML→↑ •是(shì)完全基于普通(tōng)文(wén)本的(de)。即便存π♣×儲二進制(zhì)表示的(de)圖片,也©¶(yě)會(huì)先将二進制(zhì)轉換為(wΩ↔→èi)字符串再放(fàng)入XML文(wén)檔中。我們可(kě)以用(&↓♥yòng)最簡單的(de)閱讀(dú)工(gōng)具——記事(shì)本查看↕'±↔(kàn)XML文(wén)檔。想想就(jiù)知(z¶♥∑Ωhī)道(dào)這(zhè)是(shì)多(duō)麽≥☆™β美(měi)好(hǎo)的(de)一(yī)§'件(jiàn)事(shì)情,數(shù)據長(cháng→‍λ)期存儲的(de)擔心可(kě)以落地(dì)了(le),找不↓✔↕♥(bù)到(dào)原始工(gōng)作(zuò)站(zhàn)軟 <件(jiàn)的(de)人(rén)也(yě)可(kě)以出‌" 口氣了(le)。當然,那(nà)些(xiē)認為(wèi)可(kě)以更方便修∏₽改數(shù)據的(de)人(rén)美(m™↕ěi)夢做(zuò)得(de)就(jiù)有(yǒu)點早了(le)。✔±φ☆

1  應用(yòng)AnIML解決現(xiàn÷§)實問(wèn)題

想想,如(rú)果能(néng)将我們所有(yǒu)的(de)分(fēn≈©✘✘)析數(shù)據都(dōu)轉變成同樣的(de)格式,許多(duō)$★←實驗室中的(de)共性問(wèn)題就(jiù)都(¶✘®£dōu)能(néng)得(de)到(dào)解決。

LIMS和(hé)ELN集成采用(yòng)AnIML數(shù)據格式可(k®σ≥σě)以使得(de)儀器(qì)中的(de)數(shùπ' ₽)據更容易方便地(dì)傳輸到(dào)其他(tā÷<α)的(de)一(yī)些(xiē)數(shù)據系統中,例如↔σ(rú)LIMS(實驗室信息管理(lǐ)系統)和(hé)ELN(電(d₽>iàn)子(zǐ)實驗記錄本系統)。大(dà)家(π©¥​jiā)知(zhī)道(dào),不(bù)管是(shì)LIMS還(hái)£∏是(shì)ELN與儀器(qì)的(de)集成都(dōu)是("£♥§shì)這(zhè)類項目實施的(de)一(yī)個(gè)≤™難點,既耗錢(qián)又(yòu)費(fèi)力,最終≠↓¥•可(kě)能(néng)還(hái)不(bù)討(tǎo)好(hǎ♦→÷γo)。儀器(qì)種類一(yī)多(duō),因為(wèi)每種儀器​✔≤↕(qì)的(de)數(shù)據格式都(dōu)不(bù)  ✘σ一(yī)樣,工(gōng)作(zuò)量就(jiù)會(huì)成倍增加↑¶。有(yǒu)了(le)AnIML,就(jiù)不(‌↕↑bù)再需要(yào)為(wèi)每種儀器(qì)₹×¶做(zuò)獨立的(de)接口。通(tōng)過數(shù)據标準化∑§(huà),從(cóng)一(yī)個(gè)接®Ω‍‌口就(jiù)可(kě)以獲取所有(yǒu↑φ)儀器(qì)的(de)數(shù)據,既減少(shǎo)了(l★ &↔e)接口的(de)數(shù)量,也(yě)降低(dī)了(le)集成∞≥的(de)成本。

協作(zuò):在許多(duō)行(xíng)業(yè),企業(yè®±™✘)經常需要(yào)與內(nèi)部或外(wài)部的(♠‌ de)人(rén)員(yuán)進行(xí§α&δng)合作(zuò),特别是(shì)在制(zhì) ✘藥行(xíng)業(yè)中,外(wài)包業(yè)務☆₹的(de)發展更是(shì)如(rú)火(huǒ)如(rλ₹±ú)荼。由于雙方使用(yòng)的(de)儀器(qì)和(hé)↓ε軟件(jiàn)有(yǒu)差别,數(shù)據産生(sδΩ•hēng)方往往需要(yào)将這(zhè)些(​★€÷xiē)儀器(qì)産生(shēng)的(de)數(shù)據進行(xíΩ♣ng)處理(lǐ)後生(shēng)成各種電(diàn)子(zǐ)表格 ÷ 或Pdf文(wén)件(jiàn)後,再傳遞給合作(zuò)方β•>α。傳遞的(de)數(shù)據主要(yào)是(shì)處理♦≈↕(lǐ)後的(de)結果數(shù)據,其中丢失 β£很(hěn)多(duō)重要(yào)的(de)原¶Ω∞→始數(shù)據信息。采用(yòng)AnIML标準後的(d÷∞•≤e)分(fēn)析儀器(qì)原始數(shù)據文(wén)件(jiàn✔₩∑)可(kě)以更容易地(dì)交換數(shù)據。不(b≥→ù)同于傳統的(de)Excel電(diàn)子(zǐ)表格和÷↕"‍(hé)PDF報(bào)告,AnIML使我們能(né ₩>ng)夠傳輸完整的(de)分(fēn)析數(≤↔"shù)據,合作(zuò)方可(kě)以看(kàn)到(dào)♣¥&β完整的(de)原始數(shù)據。這(zhè)既可(kě)♦π₹以提高(gāo)數(shù)據質量,合作(zuò)方也(yě)可↓&(kě)對(duì)這(zhè)些(xiδ↕ē)數(shù)據進行(xíng)再分(f¶≈¥§ēn)析,提高(gāo)數(shù)據的(¶™de)利用(yòng)率。

長(cháng)期數(shù)據保存,在受監管的(de)行(xíng)業(yè¥♠)裡(lǐ)(例如(rú)制(zhì)藥行(xíng)業(yè)), ←分(fēn)析數(shù)據的(de)保存一(yī)直是(shì)一(yī♠α)個(gè)難以解決的(de)問(wèn)題。原ε£←₹因主要(yào)在于數(shù)據所需要φσ∑£(yào)保存的(de)時(shí)間(jiān)較長(c→ háng),甚至達數(shù)十年(nián)。數(shù)十年(nián)€₹←的(de)時(shí)間(jiān)對(duì)于IT技(jì₽♠)術(shù)來(lái)講,可(kě)能(néng)會(huì)發λ♦生(shēng)天翻地(dì)覆的(de)變化εγ÷​(huà)。同樣對(duì)于儀器(qì)配套的(de)↕←ε軟件(jiàn)來(lái)說(shuō),₹​↑其也(yě)會(huì)經曆無數(shù)個(gè)版本的(de)升級。更為(≥→♦wèi)關鍵的(de)是(shì),即便解決軟件(jiàn)的(♦∑©de)問(wèn)題,其讀(dú)取數(shù)據的(de)基礎環¥±★境也(yě)會(huì)發生(shēng)♠↕變化(huà),例如(rú)該軟件(ji↑♦☆•àn)所适合的(de)操作(zuò)系統。要(yào)在幾十年(nián★∞)裡(lǐ)為(wèi)某一(yī)類原始數(sh &ù)據保存一(yī)個(gè)讀(dú)取的(de)環境似乎不(bù) δ¶&太合乎實際,尤其是(shì)在儀器(qì)種類和(hé)數(ε•£shù)據種類比較多(duō)的(de)情況下(xià)。将這<​α↔(zhè)些(xiē)數(shù)據轉換為(wèi)AnIML可(kě)能α φ(néng)是(shì)一(yī)個(gè)好(hǎ→×¶o)的(de)解決辦法。此舉能(néng)大(dà)為×‍♠(wèi)減少(shǎo)所需要(yào)的(de)配套軟∑≠α件(jiàn)工(gōng)具,也(yě)不(bù)♠•會(huì)受到(dào)基礎環境的(de)制(zhì)約,很×→(hěn)自(zì)然會(huì)減少(shǎo)一π♦ (yī)個(gè)信息系統的(de)運行(xíng)成本。

數(shù)據分(fēn)析和(hé)報(bào)告通(tōng)常情況下(xià),采集和(hé)處理(lǐ♠←α§)分(fēn)析數(shù)據僅僅是(shì)第一(yī)步。我們看®♦€★(kàn)到(dào)各種數(shù)據驅動的(de)工 ×(gōng)作(zuò)流應用(yòng)在不(bù)斷增加。這(zh€εè)些(xiē)數(shù)據流方法在數(shù)據源頭上(s↕σ✘hàng)在不(bù)斷下(xià)探,逐步深入到(dào)原始數(shù©¥)據,并進一(yī)步對(duì)這(zhè)些(xi∑Ωē)數(shù)據集應用(yòng)可(kě)視(sφ↑✔♦hì)化(huà),實驗設計(jì),多(duō''∏)變量分(fēn)析等統計(jì)學工(gōng)具進行(xíng  §)數(shù)據分(fēn)析。通(tōng)過AnI ∞ML歸一(yī)化(huà)的(de)原始數(shù)據将會(h♥©uì)使得(de)為(wèi)這(zhè)些πΩ↑≈(xiē)流程提供數(shù)據變得(de)更加簡單。

但(dàn)這(zhè)世界上(shàng)沒有(yǒu)免費(fè>™§₹i)的(de)午餐,我們需要(yào)有(yǒu)能(néng)夠将原來&™₽≠(lái)儀器(qì)格式的(de)數(shù)據轉換為™€(wèi)AnIML格式的(de)工(gōng)具,還(hái)得♠♦(de)有(yǒu)能(néng)夠查看(kà& n)AnIML格式數(shù)據的(de)工(gδ≤¶ ōng)具。

為(wèi)了(le)建立AnIML,大(dà)家(jiā)花(hu£Ω☆ā)了(le)很(hěn)長(cháng)的(de)時(sh>δí)間(jiān),這(zhè)裡(lǐ)面不(bù)單是(•±shì)技(jì)術(shù)性的(de)問(w≥♥♦èn)題,還(hái)與一(yī)些(xiē)非技(jλ↕ì)術(shù)性的(de)因素。分(fēn)析實驗室雖小(↓δφxiǎo),利益相(xiàng)關者卻衆多(duō)。到(dào)目前為(↑$wèi)止,AnIML的(de)技(jì)術(shù)性的(de)工ε↕★©(gōng)作(zuò)早已完成,大(dà)家(σ→jiā)可(kě)以放(fàng)心使用÷Ω(yòng)。經過ASTM表決之後,AnIML将成為(wèi)一(yī)個♥↓÷(gè)開(kāi)放(fàng)的(de)公共的(de)标準。與此同ε©∑時(shí),真正施行(xíng)這(zσ hè)個(gè)标準所需要(yào)的(de) ✘™工(gōng)具的(de)開(kāi)發早已走在£↓≥了(le)前面。對(duì)于終端用(yòng)戶來(lái)說(γε∞shuō),桌面版的(de)AnIML數(shù)據查看(≈>↕δkàn)工(gōng)具,Web和(hé)移動 ↕✔λ平台,集成工(gōng)具,數(shù)據轉換器(qì)都(dōu)已經有(y ↔Ω​ǒu)現(xiàn)成的(de)了(le¶±)。對(duì)于供應商來(lái)說(sh ​uō),在他(tā)們現(xiàn)有(yǒu)的(de)儀×♦<<器(qì)軟件(jiàn)中嵌入AnIML功能(néng)也(yě)←σ并非難事(shì)。