市場謠傳成人娛樂業者著手發展一套專用的可延伸標示語言(Extensible Markup Language;XML),稱為「XXXML」。
雖然沒這回事,但除此之外,幾乎各種行業或利益團體都設法利用這種快速擴張的標準,作網路服務(Web services)和資料交換之用,少有例外。自從六年前首度發布基本的XML規格以來,XML已衍生出數百種方言(dialect),或稱綱目(schema),協助肉販、推土機業者和各行各業簡化電子資料交換。
有些業界觀察家擔心,XML方言若是繁衍過度,可能導致不相容問題再起,而這正是XML當初要解決的問題。支持者則表示,綱目種數呈爆炸性成長,證明這種規格大受歡迎。
XML基本規格的共同開創者Tim Bray說,為特別目的訂製的XML方言生生不息,證明當年他與同事想要達成的目標可行。
「打從一開始,我們的目標就是要讓人們能輕易用自己特有的語言,來解決自己特有的問題,」Bray說:「總括而論,我認為,XML比我們當初設計時所想像的還要成功。」
通常XML最受讚揚的功能,是作為提供網路服務的基礎。微軟和其他軟體製造商也根據XML,推動簡化商業應用程式發展與維護的計畫。微軟下一重大Windows升級版Longhorn預定納入新的通訊子系統,稱為Indigo,其主要元件即包括網路服務和XML。微軟最近修正Longhorn計畫時透露,Indigo將納入Windows XP和其他現有的Windows版本。換言之,沒多久電腦與電腦之間的XML資料傳輸會更簡便。
再者,近來商業軟體發展模式日益朝更有彈性的服務導向架構(services-oriented architecture;SOA)靠攏,企業若想加入這股新興趨勢,XML資料交換不可或缺。支持者說,SOA讓軟體更容易視需求變化重新設定,長期維護費用也比較低。
以一種全球各地都能理解的方式,來描述各類複雜的資料,這一點XML已辦得到。問問你家附近的雞農,他可能已經、或即將成為牲畜與禽肉XML(mpXML)的受惠者。mpXML是全球標準管理程序(GSMP)的分支,旨在順應肉品生產者、零售商和流通商的特殊需求。
巧的是,肉品業是實施一套共同資料標準的最佳產業範例。(例如,「上等」還是「特選」?「雞翅」還是「雞腿」?「新鮮」還是「冷凍」?) mpXML.org執行副總裁Blake Ashby說,對肉品業而言,能迅速傳輸電子資料,不啻是一大福音。
他說:「只要能加速把產品運到供應鏈終點,減少耗損和腐敗情形,就很值得。若是缺乏一套系統,這些(食品雜貨店)肉品販賣部的管理員就必須花時間巡視賣場,瞧瞧哪些產品進貨進得太多和賞味期間何時到期。」
業者就XML議題達成協議的效率相對迅速,已協助生產者和經銷商提昇業績,並準備好迎接新的挑戰。Ashby說:「發展一套全球通行標準的必要性與日俱增,特別是國會現在正推動原產地標示規定。」
同理,對報紙和其他需要處理大量資料的媒體而言,XML的優點顯然易見。例如,體育版刊登的得分統計繁雜,通常格式各不相同,形成困擾。
國際媒體通訊委員會(IPTC)運動標示語言(SportsML)工作小組主席Alan Karben在電子郵件中說:「由於閱聽者對各種運動比賽戰績統計的需求若渴,互相傳送資料和調整呈現格式的作業通常複雜得不可思議。對我們這一行而言,XML的好處很明顯:無論提供者、運動項目或本土語言為何,傳入的資料統統一致。」
Bray說,XML之所以成功,是因為能克服電子資料交換遭遇的一些惱人的問題,例如必須應付各式各樣的語言和字元集(character sets)。
「一大問題是國際化,」Bray說:「XML風行的原因之一,是因為解決許多與萬國碼(Unicode)相關的問題。當時Unicode還很新奇。」
多少才算太多?
儘管創造特殊用途的XML方言輕而易舉,但Bray提醒,切莫濫用這種特權。一旦處理類似任務的XML綱目各擁山頭、惡性競爭,可能造成混亂,反而有礙資料交流。以樂譜為例,目前至少有六件案子設法申請受審為標準版樂譜XML。在洞穴探勘這種似乎很冷僻的領域,也發生類似情形--申請成為XML資料標準的提案至少三件。
「創立一種語言來解決本行特有的問題,這種動機無可厚非」Bray說:「可是,假如已經有現成的,也許能符合你的需要,就不妨考慮採用。」
研究公司ZapThink的分析師Ron Schmelzer說,就哪些資料需要以XML綱目呈現的問題,業界領袖常能凝聚共識,難就難在同意一套執行方式--以致有時會產生互相衝突的規格。
「若有兩個不同的組織,試圖推動兩套不同的辭彙來解決相同的問題,對改善供應鏈流程沒有幫助,」Schmelzer說:「若你只是小型業者,支援一堆不同的綱目,會變得窒礙難行。」
但綱目數量繁多,通常可能反映需要描述的資料十分複雜,HR-XML Consortium經理Chuck Allen說。HR-XML Consortium是一個人力資源商業組織,督導十多種XML方言的發展計畫,希望在薪冊、股票選擇權獎勵計畫等方面促進資料格式的標準化。
「是有人擔心,數百個標準小組做的事可能彼此重複。有些例子也顯示,這些組織可能互別苗頭,」Allen說:「可是,當你設法草擬媒介資料(metadata)標準,把這些極複雜領域的知識統統涵蓋在內時,事情就變得蕪蔓龐雜。」
Allen指出,他所屬的團隊採用合理的標準,來檢驗新的XML發展計畫真的有必要。「我們需要至少三個贊助機構和十名參與者,」他說:「主要的檢驗標準是:『計畫在不在我們專業領域的範圍內?』,『別人也在處理同樣的問題嗎?』」
又如保險業,從輪船保險到再保險,各種專業領域可輕易發展出一堆標準。但保險業組織Acord的標準事務助理副總裁Lloyd Chumbley說,保險業在這方面領先一步,因為早就採用共通的文書表格,主要目的是確保經紀員與保險公司之間的資料傳輸順暢無阻。
「當你試著做保單報價時,最不想看到的,是必須用多種語言與多家保險公司洽商,」他說:「自從1960年代以來,保險業大多採用Acord制定的標準化表格。隨著資料的數位化,這有助於維持統一的參照依據。」
Chumbley指出,綱目孳生帶給保險業主要的挑戰,是本土化的綱目反映各國法律的變化。「我們必須與眾多不同的國際組織交涉,設法整合XML綱目和定義,」他說:「接觸不同的文化和法律制度需要時間調適,但我們漸有進步。」
Allen也認為XML方言會趨於整合。他說:「會不會有進一步的整合,眾說紛紜,我認為會,原因之一是智慧財產權問題......那有時比實際的發展過程花費更大。檢視專利庫、管理智財權政策,都需要耗費許多資源。支持的機構家數愈少,簽署的智財權協議也愈少。」
著有多本XML相關書籍的John Simpson說,描述類似資料的XML方言層出不窮,倒不會像有些人想像那般可能製造混亂,因為XML讓方言能輕易互譯。
「標準不同的問題無關緊要......把一種方言轉譯成另一種,幾乎是微不足道的小事,」Simpson說。他認為,這要歸功於基本XML規格的簡易性和完整性。
自創低預算電影分類綱目的Simpson說:「一開始,XML就具有非常簡單的規則,規定如何發展XML規格,允許極大的彈性......人們把XML稱為一種語言,但其實是一種文法,用來創造新語言或描述既有語言。XML規格本身就是奇妙的變色龍。」
RedMonk分析師Stephen O'Grady也認為,基本的XML標準平易近人,很容易包容多重的方言。但他預期,互相競爭的綱目勢必遭遇達爾文式的自然淘汰:隨著解決類似問題的方法增多,市場會顯現出一種偏好,支援的軟體隨之調整,把資料從某種XML方言推向另一種。
「根據XML的設計,擷取資料先天上並不困難,」O'Grady說:「(網誌規格)RSS和Atom的情況就是很好的例子。我認為,市場到頭來可能認定某種方式優於其他方式,接下來的整合任務就迎刃而解了。」
同時,高科技西洋棋玩家也提出諸多選擇方案。至少有五種描述棋步的XML系統正在醞釀之中,目前只形成一項明顯的共識:棋盤一邊必須是白的,另一邊是黑的。