| Vertimai
Sistematizuotiems duomenims priklauso tokie dalykai kaip elektroninų sprendinių
lentelės, adresų knygelės, nustatymų parametrai, finansiniai pavedimai ir
techniniai brėžiniai. XML yra taisyklių rinkinys (galima laikyti jas
nurodymais ar susitarimais) tekstams formatams kurti, kurie leidžia
sistematizuoti jūsų duomenis. XML nėra programinė kalba ir jūs neprivalote
būti programuotojas, norėdami ją naudoti ar jos išmokti. XML palengvina užduotį
kompiuteriui atvaizduoti duomenis, nuskaityti duomenis ir įsitikinti, kad
duomenų struktūra nėra dviprasmiška. XML išvengia įprastų kalbos sandaros
spąstų, yra išplečiama, nepriklauso nuo platformos ir palaiko
internacionalizaciją ir lokalizaciją. XML visiškai atitinka Unicode
standartą.
Kaip ir HTML, XML naudoja tegus (žodžius, atskirtus '<' ir '>')
ir atributus (formoje pavadinimas="argumentas").
Kai HTML nurodo ką reiškia kiekvienas tegas ir atributas, ir dažnai kaip
tekstas atrodys naršyklėje, XML naudoja tegus tik atskirti duomenų dalis ir
palieka duomenų interpretavimą taikomajai programai, kuri juos nuskaito.
Kitais žodžiais, jei matote "<p>" XML byloje, nemanykite, kad tai
paragrafas. Priklausomai nuo konteksto, tai gali būti parametras, puslapis,
p... (ir kas sako, jog tai turi būti žodis su "p"?).
Programos, kuriomis kuriamos duomenų lenteles, adresų knygeles ir kiti struktūrizuoti
duomenys dažnai saugo duomenis diske, naudodami dvejetainį ar tekstinį formatą.
Vienas tekstinio formato privalumų yra tas, kad jis leidžia žmonėms, jei būtina,
pažvelgti į duomenis be programos, kuri juos pateikia; blogiausiu atveju gali
skaityti tekstinį formatą naudodamas savo mėgstamą tekstinį redaktorių.
Tekstiniai formatai taip pat leidžia programų kūrėjams žymiai lengviau
surasti ir pašalinti programos klaidas. Kaip ir HTML, XML bylos yra teksttai,
kurių žmonės skaityti neprivalo, tačiau gali, jei iškyla būtinybė.
Palyginti su HTML, XML bylų taisyklės suteikia mažiau variacijų. Užmirštas
tegas arba taributas be kabučių padaro XML bylą nebetinkamą, kai HTML tokia
praktika dažnai plačiai sutinkama. Oficiali XML specifikacija neleidžia
taikomosioms programoms bandyti įspėti sugadintos XML bylos kūrėją; jeigu
byla yra sugadinta, taikomoji programa tirsiog sustos ir pateiks klaidą.
Kadangi XML yra tekstinis formatas ir naudoja tegus atskirti duomenims, XML
bylos beveik visada yra didesnės nei palygintinų dvejetainių formatų. Tai
buvo sąmoningas XML kūrėjų sprendimas. Tekstinio formato privalumai yra ganėtini
(žr. 3 punktą), ir trūkumai paprastai gali būti kompensuoti. Disko vieta yra
pigesnė nei turėtų, ir archyvavimo programos kaip zip ir gzip
gali labai gerai ir labai greitai suspausti bylas. Be to, komunikacijos
protokolai kaip modemo protokolai ir HTTP/1.1,
esminis interneto protokolas, gali suspausti duomenis realiu laiku, sutaupydami
duomenų perdavimo kiekį taip pat efektyviai kaip ir dvejetainiai formatai.
XML 1.0 yra
specifikacija, kuri nurodo kokie "tegai" ir "atributai"
egzistuoja. Be XML 1.0, "XML šeima" yra augantis modulių rinkinys,
suteikiantis naudingas priemones vykdyti svarbias ir dažnų kreipinių užduotis. XLink
aprašo standartinį būdą kaip į XML bylą įdėti nuorodas. XPointer
yra kuriama sintaksė, nurodanti kreipinius į XML bylos dalis. XPointer yra lyg URL,
tačiau vietoj kreipinio į dokumentus internete, ji kreipiasi į duomenų dalis XML
dokumento viduje. CSS,
stiliaus lentelių kalba, yra pritaikoma XML lygiai taip kaip ir HTML. XSL
yra pažangi kalba stilių
lentelėms išreikšti. Ji remiasi XSLT,
transformacijos kalba, naudojama įtraukiant ar ištrinant tegus ir atributus.
DOM yra
standartinis funkcinių kreipinių rinkinys XML (ir HTML) byloms valdyti. XML
Schemos 1 ir 2
padeda programų kūrėjams tiksliai nurodyti jų pačių XML pagrindu sukurtų
formatų duomenų struktūras. Yra dar keletas kuriamų modulių ir priemonių.
Apsilankykite W3C techninių pranešimų
puslapyje.
XML kūrimas prasidėjo 1996 ir tapo W3C Rekomendacija nuo 1998 vasario mėn.
Tai gali sukelti jums įtarimų, jog tai nebrandi technologija. Iš tiesų
technologija nėra nauja. Prieš XML buvo SGML, sukurta ansktyvaisiais
'80-aisiais, ISO standartas nuo 1986, ir plačiai naudota dideliems
dokumentavimo projektams . HTML kūrėjai pradėjo 1990, į XML tiesiog paėmė
geriausias SGML dalis, vedami patirties su HTML, ir sukūrė kas mažiau galingq
nei SGML, tačiau kur kas taisyklingesnę ir paprastai naudojamą kalbą. Kai
kurias evoliucijas, visgi, sunku atskirti nuo revoliucijų... Ir turi būti
pasakyta, kad SGML daugiausia naudojama techninei dokumentacijai ir kur kas mažiau
kitoms duomenų rūšims, kai su XML yra visiškai priešingai.
Yra svarbus XML pritaikymas, taip pat tekstinis formatas: W3C XHTML, HTML tesėjas. XHTML
turi daug tokių pat elementų kaip ir HTML. Sintaksė buvo truputį pakeista,
kad atitiktų XML taisykles. Formatas, "XML pagrindu" paveldėjo XML
sintaksę ir kai kuriais atvejais ją draudžia (pvz., XHTML leidžia "<p>",
tačiau ne "<r>"); jis taip pat suteikia prasmę šiai sintaksei (XHTML
sako, jog "<p>" reiškia "paragrafą", o ne "parametrą",
"puslapį", ar dar ką nors).
XML
leidžia nurodyti naują dokumento formatą derinant ir išnaudojant kitus
elementus. Kadangi du formatai, sukurti nepriklausomai gali turėti elementų ir
atributų tuo pačiu pavadinimu, turi būti atidus derinant šiuos abu formatus
(ar "<p>" reiškia "paragrafą" iš šio formato ar
"parametrą" iš kito?). Norint išvengti problemų derinant formatus, XML
pateikia namespace (rezervuūotų
pavadinimų) mechanizmą. XSL ir RDF
yra geri XML pagrindo formatų, naudojančių rezervuotus pavadinimus, pavyzdžiai. XML Schema
sukurta atkartoti šį moduliariškumo palaikymą, nurodant XML dokumento struktūras,
taip suteikiant galimybę derinti kelias schemas trečiai sukurti, kuri apima
sujungto dokumento struktūrą.
W3C Resource Description Framework (RDF,
Resurso Aprašymo Karkasas) yra XML tekstinis formatas, skirtams tokiems
dalykams kaip resurso aprašymas ir metaduomenų pritaikymai tokie kaip muzika,
grojaraštis, fotografijų kolekcijos ir bibliografijos. Pavyzdžiui, RDF gali
suteikti galimybę identifikuoti žmones internetiniame fotoalbume iš asmeninio
kontaktų sąrašo, tada jūsų el. pašto programa gali automatiškai išsiųsti
pranešimą tiems žmonėms, kad jų nuotraukos yra internete. Kaip ir HTML
integravo dokumentus, paveikslėlius, meniu sistemas ir formuoja pritaikymus
naudojimui tinkamam internetui atsirasti, taip RDF pateikia priemones integruoti
dar daugiau, padaryti internetą daugiau Semantiniu Tinklu. Kaip žmonėms
reikia susitarimo dėl bendravime naudojamų žodžių reikšmės, taip
kompiuteriai turi žinoti susitarimo mechanizmus dėl prasmių sąlygų, kad
efektyviai bendrautų. Formalūs sąlygų aprašai tam tikroje srityje
(apsipirkimas ar gamyba, pavyzdžiui) vadinami ontologijomis ir yra būtina
Semantinio Tinklo dalis. RDF, ontologijos, ir prasmių atvaizdavimas, kad
kompiuteriai padėtų žmonėms atlikti darbą yra Semantinio
Tinklo Veiklos temos.
Pasirinkę XML kaip projekto pagrindą, jūs gaunate priėjimą prie didelės ir
augančios priemonių (viena jų jau gali daryti tai, ko jums reikia!) ir
patyrusių šioje technologijoje inžinierių bendrijos. Renkantis XML yra lyg
renkantis SQL duomenų bazei: jūs vis vien turite kurti savo nuosavą duomenų
bazę, ir nuosavas programas, ir procedūras, valdančias visa tai, tačiau
egzistuoja daugybė priemonių ir žmonių, pasiruošusių jums padėti. Ir
kadangi XML yra nelicencijuota, galite jos pagrindu kurti savo nuosavą
programinę įrangą niekam nieko nemokėdami. Didelis ir augantis palaikymas
reiškia, jog nesate pririštas prie vieno pardavėjo. XML nėra visada
geriausias sprendimas, tačiau visada vertas apsvarstymo.
Autorinės teisės © 1999-2003 W3C® (MIT, ERCIM, Keio), Visos teisės saugomos. Taikomos W3C teisinės atsakomybės, prekių ženklų, dokumentų naudojimo ir programinės įrangos licencijavimo taisyklės.