content management
open source source
  ZAPYTAJ O OFERTĘ MAPA SERWISU  polski  english
 WebStyle | Internet i Nowe Technologie - Encyklopedia |
  
content management content management
content management
 DESIGN / BRANDING DESIGN . BRANDING  CONTENT MANAGEMENT CONTENT MANAGEMENT  MULTIMEDIA MULTIMEDIA  CONSULTING CONSULTING
agencja
Wielka Encyklopedia Internetu i Nowych Technologii Online

HomeopenNETOPEDIAsourceProtokoły i technologiesourceXML (Extensible Markup Language)

Protokoły i technologie
 [ - ]  [ + ]
 netopedia  
Webdeveloping
Webdesign
Open Source
eBiznes
eCommerce
eMarketing
Multimedia
WWW
Technologie mobilne
Protokoły i technologie
Sieci komputerowe
Bezpieczeństwo | Hacking
Software
Hardware
Internet w firmie
Społeczeństwo informacyjne
Cyberkultura
Firmy | Organizacje

XML (Extensible Markup Language)

/ rozszerzalny język znakowania /

Język służący do definiowania formatu i struktury dokumentów. Podzbiór języka SGML (Standard Generalized Markup Language) przeznaczonego do opisywania złożonych struktur danych w plikach tekstowych.

Język XML pozwala na wygodne definiowanie składni kolejnych (czytaj: niższego poziomu) języków opisu dokumentów i struktur danych. Te zaś umożliwiać mają wyświetlanie specjalizowanych dokumentów przez odbiorniki - przez co należy rozumieć przede wszystkim przeglądarki WWW i aplikacje biurowe (w XML-u zapisywane są już wszystkie dokumenty pakietu Microsoft Office 2000).

Świat elektronicznej informacji

Nowe sposoby publikowania i wymiany informacji (strony WWW, poczta elektroniczna) sprawiły, że dokumenty elektroniczne w wielu zastosowaniach wypierają dokumenty tradycyjne. Jednak wzrost popularności informacji w postaci cyfrowej nie idzie w parze z poprawą funkcjonalności będących w obiegu elektronicznym dokumentów.
Takie standardy i formaty jak DOC czy HTML oraz związane z nimi narzędzia edycji (MS Word, edytory HTML) nie pozwalają zawrzeć w dokumentach znaczenia poszczególnych fragmentów tekstu czy nadać im wyraźnej, logicznej struktury. Istniejące rozwiązania (np. style w Wordzie, czy arkusze styli CSS w HTML) można uznać co najwyżej za doraźne - brak uznanych standardów (choćby odnośnie nazewnictwa najczęściej pojawiających się elementów dokumentów) wyklucza je z większości poważnych zastosowań.

HTML to zdecydowanie za mało...

Sam HTML nie jest już nawet w stanie sprostać wymogom sieci World Wide Web, której dynamiczny rozwój wymusza wprowadzanie wciąż nowych rozwiązań. Prostota tego języka decyduje o łatwości posługiwania się nim, lecz jednocześnie sprawia, iż jest dość powierzchowny - opisując właściwie tylko sposób wyświetlania tekstu, obrazków czy odsyłaczy przez przeglądarkę. Ograniczony zasób znaczników w połączeniu z niemożnością tworzenia własnych poważnie zawęża krąg jego zastosowań (wyobraźmy sobie, że istnieją chociażby znaczniki oraz - o ileż łatwiejsze byłoby wyszukiwanie informacji o produktach, gdyby znaczniki te można było podawać w kryteriach wyszukiwania).

Te ograniczone funkcje HTML-a, w zupełności wystarczające do opisu prostych stron u zarania WWW, są dzisiaj "kulą u nogi" dla projektantów nowoczesnych dokumentów internetowych. Ci chętnie widzieliby format, w którym możliwe byłoby precyzyjne opisanie danych zamieszczanych na stronach WWW - tak, by mogły być wykorzystywane przez dowolne aplikacje (np. tabela kursów akcji mogła zostać zaimportowana bezpośrednio do programu giełdowego, niezależnie od tego, z jakiego serwisu została pobrana).

... - czas na XML!

Upowszechnienie się zastosowań komercyjnych WWW na dużą skalę skłoniło do poszukiwań rozwiązań bardziej ogólnych niż HTML. Sprawujące pieczę nad standardami internetowymi konsorcjum W3C powołało w tym celu specjalną grupę roboczą. W wyniku prowadzonych przez nią prac, w lutym 1998 roku opublikowano specyfikację języka XML.

XML nie został jednak zbudowany od podstaw. Jego konstrukcja została oparta na SGML-u - metajęzyku, który choć posiada ogromne możliwości, jest w równie dużym stopniu skomplikowany i trudny do stosowania w praktyce. W XML-u zrezygnowano z większości mniej przydatnych, a sprawiających problemy podczas implementacji elementów SGML-a. W ten sposób otrzymano metajęzyk funkcjonalny, przejrzysty i dający szerokie możliwości stosowania w nowych obszarach sieci WWW.
Nie należy jednak sądzić, że XML jest następcą HTML-a. Dostarcza on jedynie zestawu reguł gramatycznych i znaczników, na podstawie których można konstruować własne znaczniki i przyporządkowywać im atrybuty - czyli tworzyć od podstaw własne języki opisu dokumentów. Natomiast na sukcesora HTML-a "pasowano" skonstruowany zgodnie z zasadami XML-a język XHTML (zagadnienie języków pochodnych od XML zostanie poruszone w dalszej części artykułu).

Cechy języka XML

Kluczową cechą XML-a jest koncentracja na strukturze dokumentu i znaczeniu jego poszczególnych elementów. Przemyślane oznakowanie dokumentów zamienia je w elastyczne bazy danych, dając niemal nieograniczone możliwości ich przetwarzania w rozmaitych aplikacjach. Natomiast za wygląd dokumentu w urządzeniach odbiorczych (na ekranie, na wydruku) odpowiadają już zewnętrzne arkusze styli informujące o sposobie prezentacji elementów objętych poszczególnymi znacznikami. Zaawansowane są już prace nad standardem arkuszy styli dla dokumentów XML, nazwanym XSL (Extensible Stylesheet Language).

Oto, w skrócie, przegląd pozostałych cech XML-a:

  • Rozszerzalność (człon "extensible" w nazwie). Możliwość wprowadzania do języka nowych konstrukcji.
  • Niezależność od platformy i używanego oprogramowania.
  • Wsparcie dla »Unicode, uniwersalnego zestawu znaków narodowych. Pozwala to przygotowywać dokumenty w niemal każdym języku.
  • Elastyczność, czyli możliwość tworzenia własnych dialektów z dowolnymi zestawami znaczników przystosowanymi do opisu dokumentów o określonej zawartości.
  • Możliwość publikacji w Internecie. Dokumenty XML są już w dużym stopniu rozpoznawane przez najnowsze wersje przeglądarek.

Korzyści

XML oddaje nieocenione usługi w zakresie organizacji dużych projektów internetowych (np. rozproszonych systemów przedsiębiorstw), oraz tam, gdzie zachodzi konieczność przetwarzania danych. Wymieńmy tylko najważniejsze korzyści wynikające ze stosowania XML-a:

  • Usprawnienie przepływu elektronicznych dokumentów dzięki ustanowieniu jednego, obowiązującego formatu (zastępującego jednocześnie formaty HTML, DOC, XLS, PDF, itp.).
  • "Władza" nad serwisem - oddzielenie treści od wyglądu dokumentów sprawia, że łatwiej można zarządzać informacją. Natomiast kojarzenie dokumentów z szablonami styli pozwala przygotować jednolite "opakowanie" danych.
  • Możliwość korzystania z informacji zamieszczanych na stronach WWW bezpośrednio przez aplikacje.
  • Możliwość przetwarzania danych - zarówno po stronie serwera jak i po stronie klienta.
    Efektywniejsze wyszukiwanie danych.
  • Publikowanie specjalistycznych dokumentów w sieci WWW.
  • Możliwość przeprowadzania elektronicznych transakcji finansowych.

Postać dokumentu XML

Dokument w języku XML, tak jak w przypadku HTML, przechowywany jest w zwykłym pliku tekstowym. Podobnie jak w przypadku HTML, składa się na niego treść, z której za pomocą znaczników wyodrębnione zostały mniejsze elementy i opisana została struktura logiczna dokumentu.
Na dokument XML składają się:

  • Prolog, w którym należy określić używaną wersję języka XML, typ dokumentu oraz - opcjonalnie - DTD (Document Type Definition). DTD zawiera definicje wszystkich elementów występujących w dokumencie; na jego podstawie programów interpretujące mogą ocenić poprawność składniową dokumentu XML.
  • Zawartość, czyli właściwa (użytkowa) treść dokumentu.

Zamieszczony niżej kod jest przykładem prostego dokumentu XML:

Sprzęt i komputery
Notebooki
Firma
oznaczenie

Rodzina XML

Ponieważ dokumenty publikowane w Internecie zawierają informacje z wielu, niekiedy odległych od siebie dziedzin, nie należy sądzić, aby doszło do stworzenia jednego, wspólnego dla wszystkich języka zdolnego opisać każdy rodzaj danych. Ponieważ XML jest metajęzykiem pozwalającym projektować nowe języki, będziemy mieć do czynienia z wieloma jego dialektami przeznaczonymi już do konkretnych zastosowań. Takie języki istnieją i są z powodzeniem wykorzystywane. Cały czas też społeczności naukowe wysuwają propozycje nowych.

Obecnie funkcjonują takie specjalizowane dialekty XML jak:

  • MathML (Mathematical Markup Language) - przeznaczony do prezentowania wzorów matematycznych.
  • XHTML - język HTML 4.0 uzupełniony o dodatkowe ograniczenia wynikające z wymagań specyfikacji XML.
  • SMIL (Standardized Multimedia Integration Language) - język pozwalający w nowy sposób umieszczać na stronach WWW elementy multimedialne
  • CML (Chemical Markup Language) - umożliwia graficzne przedstawianie związków chemicznych.
  • AML (Astronomy Markup Language) - język przeznaczony dla zastosowań w astronomii.
  • BSML (Biosequence ML) - język opracowany na potrzeby genetyków.
  • XBRL (Extensible Business Reporting Language) - promowany przez największe instytucje i firmy nowy standard wymiany danych finansowych w Internecie.

Oczywiście nie należy spodziewać się, że w kolejnych wersjach Netscape Navigatora lub Internet Explorera będziemy mogli bez problemu oglądać skomplikowane wzory cząsteczek, współrzędne gwiazd w galaktyce czy położenie genów w łańcuchu DNA. Dla specjalistycznych języków powstaną bowiem (a nawet już są) specjalistyczne przeglądarki. Tym niemniej, opracowywana przez konsorcjum W3C eksperymentalna przeglądarka »Amaya potrafi już wyświetlać wzory matematyczne formułowane w języku MathML.

Przyszłość XML

Ze względu na swoje cechy jak i szerokie poparcie deklarowane przez konsorcjum W3C oraz największych producentów oprogramowania, XML jest poważnym kandydatem na nowy standard zapisu elektronicznych dokumentów.

Z obecnych na rynku przeglądarek internetowych, prawidłowe wyświetlanie dokumentów XML a także wzorców formatowania zdefiniowanych w XSLT zapewniają jedynie Internet Explorer (od wersji 5 wzwyż) oraz Mozilla. Coraz częściej pojawiają się także aplikacje użytkowe wykorzystujące XML oraz narzędzia wspierające tworzenie dokumentów w tym języku. Jednak za pierwsze zwiastuny powszechnej akceptacji standardu będzie można dopiero uznać pojawienie się wyszukiwarek umożliwiających kontekstowe przeszukiwanie dokumentów XML.

zobacz również: DTD, HTML, MathML, SGML, SMIL, XBRL, XHTML, XSL, XML (Extensible Markup Language)


XML (Extensible Markup Language) XML (W3C)

XML (Extensible Markup Language) XML.org

XML (Extensible Markup Language) XML.com

aktualizacja: 05/12/2003

  top top
© 2000-2008 WebStyle Systems  powered by eZ publish Open Source CMS