Sehen Sie in anderen Wörterbüchern, was „XML“ ist. Erweiterte Datenauszeichnungssprachen SGML, XML XML ist eine Teilmenge von SGML

SGML (Englisch: Standard Generalized Markup Language; ausgesprochen [SJM]) ist eine Metasprache, in der Sie eine Auszeichnungssprache für Dokumente definieren können. SGML ist der Nachfolger der 1969 bei IBM entwickelten GML (Generalized Markup Language), die nicht mit der vom Open GIS Consortium entwickelten Geography Markup Language verwechselt werden sollte.

SGML wurde ursprünglich für die gemeinsame Nutzung maschinenlesbarer Dokumente in großen Regierungs- und Luft- und Raumfahrtprojekten entwickelt. Es war in der Druck- und Verlagsbranche weit verbreitet, aber aufgrund seiner Komplexität war es schwierig, es allgemein für den täglichen Gebrauch zu nutzen.

Hauptteile des SGML-Dokuments:

SGML-Deklaration – definiert, welche Zeichen und Trennzeichen in der Anwendung erscheinen können;

Dokumenttypdefinition – definiert die Syntax von Markup-Konstrukten. Die DTD kann zusätzliche Definitionen enthalten, z. B. symbolische Referenzen;

Die Semantikspezifikation, die sich auf Markup bezieht, gibt auch Syntaxbeschränkungen an, die nicht innerhalb einer DTD ausgedrückt werden können;

Inhalt des SGML-Dokuments – es muss mindestens ein Root-Element vorhanden sein.

SGML bietet eine Vielzahl syntaktischer Markup-Optionen zur Verwendung durch eine Vielzahl von Anwendungen. Durch eine Änderung der SGML-Deklaration können Sie sogar auf die Verwendung spitzer Klammern verzichten, obwohl diese Syntax als Standard gilt, die sogenannte konkrete Referenzsyntax.

Beispiel für eine SGML-Syntax:

normalerweise so etwas

SGML ist von der ISO standardisiert: „ISO 8879:1986 Informationsverarbeitung – Text- und Bürosysteme – Standard Generalized Markup Language (SGML)“

HTML und XML sind von SGML abgeleitet. HTML ist eine Anwendung von SGML und XML ist eine Teilmenge von SGML, die den Prozess der maschinellen Analyse eines Dokuments vereinfachen soll. Weitere SGML-Anwendungen sind SGML Docbook (Dokumentation) und „Z Format“ (Typografie und Dokumentation).

XML – Extensible Markup Language, also Extensible Markup Language, entstand als Ergebnis der Entwicklung der HTML-Sprache (HyperText Markup Language, Hypertext Markup Language). Es wäre jedoch ein schwerer Fehler, es nur als eine verbesserte Version der HTML-Sprache zu betrachten. Im Wesentlichen handelt es sich bei XML um eine neue Generation von Auszeichnungssprachen. Hierbei sollten Sie 3 Punkte beachten, die XML grundlegend von HTML und seinen Vorgängern (GML – Generalized Markup Language, SGML – Standard General Markup Language) unterscheiden:

XML verfügt im Gegensatz zu HTML KEINE VORDEFINIERTEN TAGS – genauer gesagt, jeder Entwickler kann SEINE EIGENEN XML-Tags erstellen – so viele wie nötig. Die Anzahl solcher Tags ist praktisch unbegrenzt. Somit ist XML eine Metasprache, die die Erstellung anderer Auszeichnungssprachen wie HTML ermöglicht.

Mit der Weiterentwicklung der HTML-Sprache nahm die Anzahl der Tags rapide zu. Schließlich erreichte ihre Zahl einen „kritischen Wert“ – es wurde für Webdokumententwickler immer schwieriger, sich an immer mehr neue Tags zu erinnern, aber Browserentwickler befanden sich in einer noch schlimmeren Lage – sie mussten neue Versionen von Browsern erstellen, die „verstehen“ würden. neue Tags. Intelligentere Browser werden zudem immer größer und stellen immer höhere Anforderungen an die Computer, auf denen sie verwendet werden. Erschwerend kommt hinzu, dass Handheld-Geräte in letzter Zeit immer beliebter werden (insbesondere werden sie zunehmend im E-Commerce eingesetzt), mit begrenztem Speicher und „schwachen“ Bildschirmen und die darauf verwendeten Browser daher nur über sehr begrenzte Möglichkeiten verfügen . XML, das über kein vordefiniertes Tag-System verfügt, löst dieses Problem. Der „Lohn“ für Vielseitigkeit ist eine strengere Gestaltung von Webdokumenten. Die Regeln zum Formatieren von XML-Dokumenten sind einfach:

Nicht geschlossene Tag-Container sind nicht zulässig (Sie können jedoch öffnende und schließende Tags in einem kombinieren, zum Beispiel:
)

„verschachtelte“ Container können sich nicht „überlappen“

Klein- und Großbuchstaben werden als unterschiedliche Zeichen behandelt

Schlüsselwörter können nicht als Tag-Namen verwendet werden

Sie können in Tag-Namen keine Leerzeichen, Satzzeichen, runde, eckige oder geschweifte Klammern verwenden

Der Unterstrich (_) und Zahlen können in Tag-Namen vorkommen, eine Zahl darf jedoch nicht das erste Zeichen eines Tag-Namens sein

(Wenn Sie mehrere Wörter als Tag-Namen verwenden müssen, sollten diese zusammen geschrieben werden und jedes Wort mit einem Großbuchstaben beginnen.)

Dokumente, die diese Regeln erfüllen, werden als wohlgeformte Dokumente bezeichnet.

XML wird zur BESCHREIBUNG VON DATENSTRUKTUREN verwendet, hauptsächlich von HIERARCHISCHEN STRUKTUREN.

Einer der Haupttrends bei der Entwicklung von Webtechnologien ist die Trennung von Daten, Dokumentenstruktur und deren Stilgestaltung. Wie Sie wissen, besteht eine Möglichkeit, Daten aus der Dokumentstruktur zu trennen, darin, das DBMS über die ODBC-Schnittstelle (Open DataBase Connectivity) dynamisch mit Webdokumenten zu verknüpfen. Die Stiltrennung wird durch die Verwendung von Cascading Style Sheets erreicht. Mit XML können Sie nicht relationale Datenbanken beschreiben. Da Tags vom Entwickler erstellt werden können, beschreiben ihre Namen normalerweise die Bedeutung der Daten.

Als Mittel zur Beschreibung der Datenstruktur sorgt XML für den DATENAUSTAUSCH zwischen verschiedenen Anwendungen und fungiert somit als eine Art „Klebstoff“.

Die Bedeutung dieser XML-„Kleber“-Funktion kann nicht genug betont werden. Dank der Möglichkeit, Daten zwischen verschiedenen Anwendungen auszutauschen, „erreichen“ Webtechnologien ein ganz neues Niveau.

Hypertext Markup Language (HTML) ist ein einfaches System zum Erstellen von Hypertextdokumenten, die von einer Plattform auf eine andere portierbar sind. Im Wesentlichen handelt es sich bei HTML-Dokumenten um SGML-Dokumente mit gemeinsamer Semantik, die sich zur Darstellung von Informationen in einer Vielzahl von Anwendungen eignen. HTML kann verwendet werden, um Folgendes darzustellen:

    Hypertext-Nachrichten, E-Mail, Dokumentation und Hypermedia

    Optionsmenü

    Ergebnisse der Datenbankabfrage

    Einfache Dokumente mit eingebetteten Grafiken

    Und auch für die Hypertext-Anzeige vorhandener Informationsfelder

Das World Wide Web (WWW)-Projekt vereint weltweit verstreute Informationen. Zu diesem Zweck verwendet WWW das Internet HyperText Transfer Protocol (HTTP) – das HyperText Transfer Protocol, mit dem Sie Vereinbarungen über die Methoden der Datenpräsentation bei der Interaktion zwischen einem Client und einem Server treffen können.

Die Datenübertragung im Nachrichtentext erfolgt nach dem MIME-Standard. HTML ist eine der Darstellungen von Informationen im WWW. Es wird davon ausgegangen, dass HTML einem der MIME-Typen entspricht, nämlich text/html. Darüber hinaus wird HTML in Übereinstimmung mit dem internationalen Standard ISO 8879 – Standard Generalized Markup Language (SGML) entwickelt, einem System zur Definition strukturierter Dokumenttypen.

HTML-Dokument

Ein HTML-Dokument ist wie Textdatei, außer dass einige Zeichen (Strings) Steuerzeichen sind. Diese Symbole werden Tags genannt und definieren die Struktur des Dokuments.

HTML-Dokumente müssen mit dem Tag am Anfang der Datei beginnen und mit dem Tag enden. Zwischen diesen Tags ist das HTML-Dokument als HEAD- und BODY-Dokument organisiert, ähnlich einer E-Mail-Nachricht. Im HEAD-Teil werden der TITEL und andere Informationen zum gesamten Dokument angegeben. Innerhalb des BODY-Teils wird der Text mithilfe von HTML-Tags in Absätze, Listen usw. strukturiert. Es besteht die Möglichkeit, einzelne Wörter und ganze Sätze mit einem Stil hervorzuheben und Links zu Teilen dieses und externen Dokumenten zu erstellen. Technisch gesehen müssen öffnende und schließende Tags für HTML-, HEAD- und BODY-Elemente nicht verwendet werden. Dies wird jedoch nicht empfohlen, da die HEAD/BODY-Struktur es Anwendungen ermöglicht, Dokumentmerkmale (z. B. die Kopfzeile) zu bestimmen, ohne das gesamte Dokument zu scannen.

Struktur von HTML-Elementen

In einem HTML-Dokument definieren Tags den Anfang und das Ende von Überschriften, Absätzen, Listen, Zeichenhervorhebungen und Links. Die meisten HTML-Elemente in einem Dokument werden als öffnendes Tag definiert, das den Namen und die Attribute des Elements angibt, dann den Hauptteil des Elements, gefolgt von einem schließenden Tag. Die Trennzeichen für das öffnende Tag sind „“; für das Schlusswort - "". Zum Beispiel:

Das ist der Titel

Das ist ein Absatz.

Einige Elemente erscheinen nur als öffnendes Tag. Um beispielsweise eine Trennlinie zu erstellen, verwenden Sie das Tag
. Darüber hinaus können die schließenden Tags für einige Elemente (P, LI, DT, DD) weggelassen werden. Der Körper eines Elements ist eine Folge von Zeichen und verschachtelten Elementen. Einige Elemente, beispielsweise Elemente, die Links definieren, können nicht verschachtelt werden. In diesem Fall können Elemente, die Links und Zeichenauswahlen definieren, in anderen Strukturen platziert werden.

Ein Dokument anzeigen

Die konkrete Darstellung eines Dokuments kann von Kunde zu Kunde unterschiedlich sein. HTML-Tags bestimmen nur den allgemeinen Anzeigestil des Dokuments. Das bedeutet zum Beispiel, dass HTML die Überschrift der ersten Ebene nur als Überschrift der ersten Ebene behandelt, aber nicht angibt, dass die Überschrift der ersten Ebene in der 24-Größen-Schriftart „Times“ zentriert oben auf der Seite angezeigt werden soll. Der Vorteil dieses Ansatzes besteht darin, dass der Benutzer, wenn er sich entscheidet, die Überschrift der ersten Ebene in die linksbündige Schriftart Helvetica, Größe 20, zu ändern, lediglich die Definition der Überschrift der ersten Ebene in seinem WWW-Viewer ändern muss. Somit wird die konkrete Darstellung des Dokuments auf dem Monitorbildschirm vom Benutzer eines bestimmten Clients bestimmt.

Die größte Stärke von HTML ist seine Fähigkeit, Textbereiche (und auch Bilder) mit anderen Dokumenten zu verknüpfen. Betrachter heben diese Bereiche hervor (normalerweise durch Farbe und/oder Unterstreichung), um anzuzeigen, dass es sich um Hypertext-Links handelt. Ein Anker ist ein Textstück, das den Anfang und/oder das Ende eines Hypertext-Links markiert. Der Text zwischen den öffnenden und schließenden Tags ist der Start- oder Zielpunkt eines Hypertext-Links. Die Attribute dieses Tags lauten wie folgt: HREF

Optional. Wenn das HREF-Attribut vorhanden ist, handelt es sich beim Anker um sensiblen Text: den Ausgangspunkt für den Link. Wählt der Leser diesen Text aus, wird ihm ein weiteres Dokument angezeigt, dessen Netzwerkadresse im Wert des HREF-Attributs angegeben wurde. Format Netzwerkadresseähnlich wie URL. Dadurch kann die HREF="#identifier"-Struktur auf einen anderen Anker im aktuellen Dokument oder in einem Remote-Dokument verweisen, indem ihre Adresse vor dem „#“-Zeichen angegeben wird.

Optional. Falls vorhanden, ermöglicht es die Verwendung des Ankers als Linkziel. Der Wert des Attributs ist der Ankerbezeichner. Als Bezeichnerwert kann eine reguläre Textzeichenfolge verwendet werden, mit der Ausnahme, dass alle solchen Bezeichner innerhalb eines Dokuments eindeutig sein müssen.

Optional. Ermöglicht Ihnen, die Beziehung zwischen dem Dokument, von dem aus der Link erstellt wurde, und dem Dokument, zu dem der Link erstellt wurde, anzugeben.

Alle Attribute sind optional, mit der Ausnahme, dass entweder das HREF-Attribut oder das NAME-Attribut vorhanden sein muss, damit das Tag aussagekräftig ist.

Anwendungsbeispiele

...

Gibt die Stelle im Dokument an, zu der der Link erstellt wird

...

...

vPTYU fPVPFTBU

SGML: YUEN LFP EDSF?

uEZPDOS CHUE YUBEE NPTsOP CHUFTEFYFSH BVVTECHYBFHTH SGML. noPZIE CHYDSCH DPLHNEOFBGYY RPUFBCHMSAFUS CH ZHTNBFE SGML. rPRHMSTOSCHK SJSCHL TBNEFLY Web-UFTBOYG HTML SCHMSEFUS RTYMPTSEOYEN SGML. rPSCHMSEFUS CHUE VPMSHYE RTYLMBDOSH RTPZTBNN DMS TBVPFSCH U SGML: TEDBLFPTSCH, UTEDUFCHB ZHTNBFYTPCHBOYS, UYUFENSCH DPLHNEOFPPVPTPFB, YURPMSHJHAEYE SGML CH LBUEUFCHE ZHTTN BFB ITBOEOYS DPLHNEOFPCH... SGML-RTPDHLFSHCHSHCHRKHULBAF Adobe, Corel , SoftQuad, Microsoft. h SGML ZPFPCHSFUS LOYZY YJDBFEMSHUFCHB O"Reilly, FEIOYUUEULBS DPLHNEOFBGYS IBM, Sun Y OSF. PUOPCHCHCHBEFUS ÜBER SGML YOZHTNBGYPOOBS FEIOMPMPZYS NOPZYI CHEDHAYI NBYOPUFTPYFEMSH OSCHI Y BCHIBLPUNYUEULYI ZHYTN CHUEZP NYTB.

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFSHCHI SGML-FEIOPMPZYS RETETSYCHBEF UEKYUBU RETYPD TBUGCHEFB. YuFP LFP FBLPE? YuFP POB DBEF UCHPYN RPMSHЪPCHBFEMSN? lBL U OEK TBVPFBFS? ÜBER BFI Y DTHZIE CHPRPTUSCH MIT RSHCHFBAUSH PFCHEFIFSH LFPC UFBFSHEK.

UPDETSBOYE



















lBL MIT OBVTEM ÜBER SGML-FEIOPMPZYA

CHUE OBYUBMPUSH YOFTBOEFB. lFP NPDOPE UMPChP PBOBYUBMP DMS NEOS ÜBER RTBLFYLE FP, YuFP DPLHNEOFSHCH, LPFPTSCHE S TEZKHMSTOP RYUBM RP TPDH UCHPEK DESFEMSHOPUFY, UVBMP NPTsOP Y OHTsOP DEMBFSH DPUFKHROSHCHNY „online“. dP UYI RPT S RTPUFP OBVYTBM DPLKHNEOFSHCH T E X-e Y REYUBFBM YI ÜBER VKHNBZE. YDES DHVMYTPCHBFSH YI CH HTML CHTHYUOHA PFRBMB UTBH: OENEDMEOOOP CHPJOILMB VSC RTPVMENB UYOITPOYBGYY VKHNBTSOPK Y BMELFTPOOPK CHETUIK PDOPZP Y FPZP TSE DPLHNEOFB.

b CHULPTE RPFTEVPCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLHNEOPCH RPUFPTPOOYN MADSN CH LMELFTPOOPC ZHTNE, YFP, RP UMPTSYCHYEKUS X OBU RTBLFYLE, POBYUBEF – CH ZHTNBFE Microsoft Word. tBVPFBFSH Y MS Word

ъOBYUIF, OHTsOP VSHMP RTYDKHNBFSH URPUPV BCHFPNBFYUUEULPZP RTEPVTBBPCHBOYS OBVYTBENSHHI DPLKHNEOPCH CH TBMYUOSHE ZHTNBFSH: T E X-a – DMS REYUBFY ÜBER VKHNBZE, HTML – DMS RPNEEEOYS ÜBER WWW UTCHET, Word – VHI PVNEOB U TBVPFBAEY NYH Windows. lTPNE FPZP, NOE IPFEMPUSH, YUFPVSH FBLPE UTEDUFChP PFCHEYUBMP EEE TSDH FTEVPCHBOYK:

  • VShchFSH NPDKHMSHOSCHN, YuFPVSH NPTsOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSHCHESCHSHCHIPDOSH ZHTNBFSH YMY YYNEOSFSH BMZPTYFNSCH RTEPVTBPBCHBOYS CH UKHEEUFCHHAEYE;
  • VShchFSH PFLTSCHFSHCHN, VEURMBFOSHCHN, LBL NPTsOP NEOSHYE RTYCHSBOOSHCHN L LPOLTEFOSCHN RTPZTBNNBN;
  • VShchFSH NPVYMSHOSHCHN: TBVPFBFSH, LBL NYOINKHN, ÜBER TBOSCH UNIX-RMBFZhPTNBI;
  • VSHFSH MEZLP TKHUIZHYYTHENSHN.

RETCHSHCHN, YuFP RPRBMPUSHNOE RPD THLH RPUME RPIPDB ÜBER Altavista, PLBBBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. po LBL TBY RTEDOBOBYUBMUS DMS ZEOETBGYY HTML, T E X Y RTF YЪ PDOPZP CHIPDOZP ZhBKMB. yYTPL YURPMSHKHENSHCHK CH TBNLBI Linux Documentation Project, VON YURPMSHЪPCHBM CH LBYUEUFCHE CHIPDOZP ZHTNBFB OEBOBLPNSCHKNOE DP UYI RPT SJSHL SGML. chRTPYUEN, OYUEZP UMPTsOPZP CH OEN OE PLBBBMPUSH – VON CHEUSHNB OBRPNIOBM OBLPNSCHKNOE HTML Y CHSHZMSDEM CHRPMOYE RPOSPHOP. chPF, L RTYNETH, LHUPYUEL SGML-DPLHNEOFB:

Die Struktur eines TEI-Textes

Alle TEI-konformen Texte enthalten einen TEI-Header (markiert als teiHeader-Element) und die Transkription des eigentlichen Textes (markiert als Textelement).

DMS FPZP, YuFPVSH OBYUBFSH ÜBER LFPN RYUBFSH, RPFTEVPPCHBMPUSH CHUEZP MYYSH OBRPNOYFSH OEULPMSHLP PUOPCHOSHI BMENEOFPCH TBNEFLY, OBRTYNET, YuFP

OBYUBEF OBYUBMP RBTBZTBZHB, -- OBYUBMP RETEYUYUMEOYS Y F.R.

oBVTBOOSCHK CH SGML FELUF DBMEE ЪBRHULPN PDOPZP ZHYMSHFTB RTEPVTBKHEFUS CH HTML, DTHZPZP -- CH T E X, FTEFSHEZP -- CH RTF, Y FBL DBMEE.

YuFP FBLPE SGML Y YuEN auf IPTPY FETNYOPMPZYS

GML ( Generalisierte Auszeichnungssprache) TTBTBVPFBO CH OEDTBI CHEDEUHEEK LPTRPTBGYY IBM. EZP OBUMEDOIL SGML ( Standardisierte verallgemeinerte Auszeichnungssprache) RTYOSF CH 1986 ZPDH CH LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTTFB DMS PRTEDEMEOYS OEBCHYUYNSHI PF KHUFTPKUFCH CHCHPDB/CHSHCHPDB, OEBCHYUYNSHI PF CHSHCHYUYUMYFEMSHOPK UTEDSH NEFPDH RTEDUFBCHME OYS FELUFPCH CH LMELFTPOOPK ZHTNE. vPMEE FPYOP, SGML – LFP NEFBSJL, FP EUFSH UTEDUFCHP ZHTTNBMSHOPZP PRYUBOYS SJSHLB, CH DBOOPN UMHYUBE, SJSCHLB TBNEFLY .

yUFPTYYUEULY UMPChP TBNEFLB YURPMSHЪPCHBMPUSH DMS PRYUBOYK BOOPFBGYK YMY DTHZYI PVPOBYOOYK CHOKHFTY FELUFB, RTEDOBOBYOOOSCHI DMS KHLBBOYK UPUFBCHYFEMA YMY "CHETUFBMSHAILH" FPZP, LBL YNEOOOP LPOLTEFOPE NEUFP DPMTSOP VSHFSH OBREYUBFBOP YMY ACCOUNTING FBOP. rTYNETSH CHLMAYUBAF RPDYUETLYCHBOYE CHPMOYUFPK YuETFPK, PVPOBYUBAEE LHTUYCH, UREGYBMSHOSHE OBYULY DMS RTPRKHULB ZHTB YMY YI REYUBFY LPOLTEFOSCHN YTYZhFPN, Y FBL DBMEE. lPZDB ZHTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UFBMY BCHFPNBFYYTPCHBOOSCHNY, LFPF FETNYO UVBM PICHBFSHCHBFSH CHUE CHYDSCH UREGYBMSHOSHI LPDPCH TBNEFLY, CHUFBCHMSENSHI CH BMELFTPOOSCH FELUFSCH DMS HRTBCHMEOYS ZHTNBFYTPCHBOYEN, REYUBFSHHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS, TBNEFLH, YMY LPDYTPCHLH, PRTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFB. ÜBER VBOBMSHOPN HTPCHOE CHUE OBREYUBFBOOSCH FELUFSCH LPDYTPCHBOSH CH LFPN UNSHUME: OBLY RTERYOBOYS, YURPMSHЪPCHBOYE ЪБЗМБЧОСЧШИ ВХЛЧ, TBURPMPTSEOYE VХЛЧ RP UFTBOYGE, DBCE YOFETCH BMSH NETSD H UMPCHBNY NPTsOP UYUYFBFSH CH LBLPK-FP UFEREOY TBNEFLPK, ZHOLGYS LPFPTPK – RPNPYUSH YUEMPCHELH, YUYFBAEENKH FELUF, PRTEDEMYFSH, ZDE LPOYUBEFUS PDOP UMPChP Y OBUYOBEFUS DTHZPE, YMY LBL YDEOFYZHYGYTPCHBFSH PUPVEOOPUFY UFTHLFHTSCH, FBLYE LBL ЪBZPMPCHLY, YMY RTPUFSHCHE UYOFBLUYUEULYE EDYOYGB CHTPDE RPDYYOEOO Kohlsuppe RTEDMPTSEOYK. lPDYTPCHBOYE FELUFB DMS LPNRSHAFETOPK PVTBVPFLY, CH RTYOGYRE, LBL TBUYYZHTPCHLB NBOKHULTYRFB U RETZBNEOFB, -- RTPGEUU DEMBBOYS SCHOSCHN OESCHOPZP YMY RPDTBHNECHBENPZP, RTPG EUU KHLBBOYS RPMSHЪPCHBFEMA FPZP, LBL DPMTSOP YOFETRTEFYTPCH BFSHUS UPDETSINPE FELUFB.

rPD SJSHLPN TBNEFLY RPOINBAF OBVPT UPZMBYEOYK P TBNEFLE, RTYNEOSENSHI DMS LPDYTPCHBOYS FELUFPCH. sjShchl TB'NEFLY DPMTSEO UREGYZHYYTPCHBFSH, LBLBS TB'NEFLB DPRKHUFYNB, LBLBS TB'NEFLB PVSBFEMSHOB, LBL PFMYUYFSH TB'NEFLH PF FELUFB Y YUFP TB'NEFLB OBYU JF. SGML RTEDPUFBCHMSEF TEYEOYS DMS RETCHSCHI FTEI ЪBDБУ, PFDEMSHOBS DPLHNEOFBGYS PVSHYUOP OEPVIPDYNB DMS RPUMEDOEK.

pUPVEOOPUFY SGML

fTY IBTBLFETYUFYLY SGML PFMYUBAF EZP PF RTPYUYI SSHCHLPCH TBNEFLY.

prYUBFEMSHOBS TBNEFLB

uYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHЪHEF LPDSCH TBNEFLY, LPFPTSHCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFEZPTYBGYY YUBUFEK DPLHNEOFB. lPDSH TBNEFLY, FBLYE LBL YMY \end(list) , RTPUFP YDEOFYZHYYTHAF RPTGYA DPLHNEOFB Y KHFCHETTSDBAF, YuFP "POB SCHMSEFUS RBTBZTBZHPN", YMY YuFP "LFP - LPOEG RPUMEDOIN OBYU BFPZP URYULB" Y F.R. U MECHEE, RTBCHHA ZTBOYGH – UNGEFÄHR 2NN RTBCHEE, RTPRKHUFYFSH PDOKH UFTPLH Y CHUFBFSH ÜBER OPCHHA MECHHA ZTBOYGKH" Y F.R. h SGML YOUFTHLGYY, OEPVIPDYNSCHE DMS PVTBVPFLY DPLHNEOFB U LBLPK-MYVP LPOLTEFOPK GEMSHA (OBRTYNET, DMS ZHTNBFYTPCHBOYS), YuEFLP PFDEMSAFUS PF PRYUBFEMSHOPK TBNEFLY, LPF PTBS CHUFTEYUBEFUS CHOKHFTY DPLHNEOFB. pVSHYUOP POY UPVTBOSH CHOE DPLHNEOFB CH PFDEMSHOSHI RTPPGEDKHTBI YMY RTPZTBNNBI.

u PRYUBFEMSHOPK, B OE RTPGEDHTOPK, TBNEFLPK PDYO Y FPF TSE DPLHNEOF NPTsEF VSHFSH PVTBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNNY, LBTsDBS YЪ LPFPTSCHI NPTsEF RTYNEOSFSH TB ЪMYUOSCHE YOUFTHLGYY PVTBVPFLY L FEN EZP YUBUFSN, LPFPTSHCHE POB UYYFBEF CHBTTSOSCHNY. oBRTYNET, RTPZTBNNB BOBMYJB UPDETSYNPZP NPTSEF RPMOPUFSHA YZOPTYTPCHBFSH UPULY, FPZDB LBL RTPZTBNNB ZHTNBFYTPCHBOYS NPTSEF YICHMELBFSH Y UPVYTBFSH YI DMS REYU BFSH CH LPOGE LBTSDPK YUBUFY. TBMYUOSCHYODSH YOUFTHLGYK PVTBVPFLY NPZHF BUUPGYYTPCHBFSHUS U PDOPC Y FPK TSE YUBUFSHA ZHBKMB. OBRTYNET, PDOB RTPZTBNNNB NPTSEF YYCHMELBFSH YDPLHNEOFB ZHBNYMYY MADEK Y ZEPZTBZHYUEULYE OBCHBOYS DMS UP'DBOYS YODELUB YMY VBSHCH DBOSHI, FPZDB LBL DTHZBS, PVTBVBFSHCHCHBAEBS FPF CE UBNSCHK FELUF, NPTsEF REYUBFBFSH ZHBNYMYYY OBCHBO YS PFMYUBAEINUS YTYZhFPN.

fYRSH DPLHNEOFPCH

SGML CHCHPDYF RPOSFYE FYRB DPLHNEOFB,Y,UPPFCHEFFUFCHOOOP, PRTEDEMEOYS FYRB DPLHNEOFB (Dokumenttypdefinition, DTD). dPLKHNEOFSH UYYFBAFUS FYRYYTPCHBOOSCHNY, FBL CE, LBL Y DTHZIE PVTBVBFSCHBENSHCHEN LPNRSHAFETBNY PVYAELFSHCH. fYR DPLHNEOFB ZHTNBMSHOP PRTEDEMSEFUS EZP UPUFBCHOSCHNY YUBUFSNY YI UFTHLFKHTPC. PRTEDEMEOYE, OBRTYNET, PFYUEFB NPTSEF VSCHFSH FBLYN, YuFP PO UPUFPYF YЪ ЪБЗПМЧЛБ Ъ, ЧПЪНПЦП, БЧФПТБ, ЪБ LPFPTSHNY UMEDHEF BOOPFBGYS Y RPUMEDPCHBFEMSHOPUFSH PDOPZP YMY VPMEE BVBGECH. mAVPK DPLHNEOF CH PFUKHFUFCHYE ЪBZPMPCHLB, CH UPPFCHEFUFCHYY U LFYN ZHTNBMSHOSCHHN PRTEDEMEOYEN, OE VHDEF ZHTNBMSHOP SCHMSFSHUS PFYUEFPN, FBL TSE LBL OE VHDEF YN SCHMSFSHUS Y RPUMEDPCHBFEMSHOPUFSH BVBGECH, JB LPFPTPK UMEDHEF BOOPFB GYS, OECHYTBS ÜBER FP, OBULPMSHLP RPIPTS ÜBER PFUEF FBLPK DPLHNEOF U FPYULY ЪTEOYS YUFBFEMS- YUEMPCHELB.

rPULPMSHLH DPLKHNEOFSH PFOPUSFUS L YYCHEUFOSCHN FYRBN, NPTsOP YURPMSHЪPCHBFSH UREGYBMSHOKHA RTPZTBNNH, OBSCHCHBENKHA BOBMYBFPTPPN (Parser) SHOPK RPUMEDPCHBFEMSHOPUFY. YuFP EEE VPMEE CHBTsOP, TBOSCH DPLHNEOFSH PDOPZP FYRB NPZHF PVTBVBFSHCHBFSHUS KHOIZHYGYTPCHBOOSCHN PVTBBPN. nPTsOP RYUBFSH VPMEE YOFEMMELPHBMSHOSCH RTPZTBNNSHCH, YURPMSHQHAEYE OBBOYS, ЪBLMAYUEOOSCH YOZHTNBGYPOOPK UFTHLFHTE DPLHNEOFB.

oEBCHYUINPUFSH DBOOSCHI

PUOPCHOBS GEMS RTPPELFYTPCHBOYS SGML VSHMB CH UPJDBOY ZBTBOFYK FPZP, YuFP DPLHNEOF, UBBLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN, VKDEF RETEOPUYNSCHN U PDOPK BRRBTBFOPK Y RT PZTBNNOPK UTEDSH CH DTHZHA VEЪ RPFETY YOZHPTNBGYY. dChB EZP UCHPKUFCHB, PRYUBOOSCHI CHCHYE, PFCHEYUBAF LFPNH FTEVPCHBOYA ÜBER BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFChP – ÜBER HTPCHOE UFTPYUEL VBKFPCH (UYNCHPMPCH), LPFPTSHCHE UPUFBCHMSAF DPLHNEOF. SGML RTEDPUFBCHMSEF PVPVEOOOSCHK NEIBOIN UFTPLPChPK RPDUFBOPCHLY, FP EUFSH, RTPUFPK NBYOOOP-OEEBCHYUYNSCHK URPUPV KHLBBOYS, YuFP LPOLTEFOBS UFTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOFB DPMTSOB ЪBNEOSFSHUS ÜBER OELPFPTHA DTHZHA UFTPLH. pDOP PYUECHYDOPE RTYNEOOYE LFPNH NEIBOINH -- PVEUREYOOYE EDYOPK FETNYOPMPZYY; DTHZPE, Y VPMEE OBYUYFEMSHOPE, -- RTPFPYCHPDEKUFCHYE YJCHEUFOPK OEURPUPVOPUFY TBOSHI LPNRSHAFETOSHI UYUFEN RPOINBFSH OBVPTSCH UYNCHPMPCH DTHZ DTHZB, OBRTYNET, PDOPK UYUFEN R TEDUFBCHMSFSH CHUE ZTBZHYUEULYE UYNCHPMSCH, OEPVIPDYNSCHE RTY MPTSEOYA, RHFEN PRYUBFEMSHOPZP PFPVTBTTSEOYS OERETEDDBCHBENSHI UYNCHPMPCH. uFTPLY, PRTEDEMSENSCHE LFYN NEIBOYNPN, OBSCCHBAFUS UHEOPUFSNY(Entitäten).

p RTEINHEEUFCHBI

YuFP DBEF YURPMSHЪPCHBOYE SGML CH TEBMSHOPK QYYOY? noe POP UTBKH DBMP CHPNPTSOPUFSH RTPYCHPDYFSH DPLKHNEOFSHCH MAVPN FTEVKHENPN CHYDE. xDPVOP PLBBBMPUSH Y OBRYUBOYE „ChPTDPCHSHCHI“ VHNBTSEL CH RTYCHSHYUOPK UTEDE XEmacs VEЪ YURPMSHЪPCHBOYS Windows. CHUE YURPMSHЪPCHBOOSCH RTPZTBNNNSCH -- VEURMBFOSCH Y TBURTPUFTBOSAFUS CH YUIPDOSHI FELUFBI, YuFP RPЪCHPMYMP KHUFBOPCHYFSH YI ÜBER CHUEI YURPMSHKHENSHI NOK UYUFENBI. rTYUEN PLBBMPUSH, YuFP OBYUBFSH TBVPFBFSH U SGML CHCHUE OE UMPTsOP, LBTSDSCHK, LFP IPFSH TB TEDBLFYTPCHBM WWW UFTBOYULH, OE YURKHZBEFUS CHYDB LPOUFTHLGYK SGML.

rPFPN HCE, RP NETE RPUFEREOOPZP YHYUEOYS SGML, S PUBPOBM, YuFP LFB FEIOILB DBEF ZTPNBDOPE LPMYUEUUFChP CHPNPTsOPUFEK RP UTBCHOOYA U FYRYUOPK „OBUFPMSHOPK FYRPZTBZHY EK“:

rTPDKHLFYCHOPUFSH YuEFLP TBDEMEOOOSCH RTPGEUUSCH CHCHPDB YOZHPTNBGYY Y EE ​​​​ZHTNBFYTPCHBOYS RPJCHPMSAF BCHFPTH UPUTEDPFPYUFSHUS ÜBER YIMPTSEOY NSHUMEK, OE PFCHMELBSUSH ÜBER DCH YZBOYE FELUFB RP LBOH Y RPDVPT UFYMEK.

edYOBS UFYMYUFYLB MEZLP CHSHCHDETTSYCHBFSH TBMYUOSCH DPLHNEOFSHCH EDYOPN UFYME, YURPMSHЪHS EDYOHA FETNYOPMPZYA. еUMY UFYMSH YMY FETNYOSCH OCHTSOP YЪNEOIFSH, LFP DEMBEFUS TBBPN PE CHUEI DPLHNEOFBI, OE FTPZBS YI UPDETSINPE.

rPCHFPTOPE YURPMSHЪPCHBOYE yFPF FETNYO, IPTPYP OBLPNSCHK RTPZTBNNNYUFBN, POBYUBEF OBMYUYE CHNPTSOPUFY YURPMSHЪPCHBFSH DEFBMY UFBTSCHI RTPELFPCH CH OPCHSHCHI, U N YOINBMSHOSHNY YYNEOOOSNY. yuBUFSH DPLHNEOFB, PZHTTNMEOOBS CH CHYDE SGML-BMENEOFB, NPTsEF RETEOPUIFSHUS CH DTHZIE DPLHNEOFSHCH, MEZLP RPCHFPTSFSHUS CH TBOSHI NEUFBI FELUFB.

dPMZPCHYUOPUFSH YOZHPTNBGYY yЪ-ЪB FPZP, YuFP SGML -- RTPUFPK Y UFBODBTFOSCHK ZHTNBF ITBOEOYS DBOOSHI, PFUKHFUFCHHEF OEPVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHYDH KHUFB TECHBOYS BRRBTBFOPK YMY RTPZTBNNOPK RMBFZHTNSCH. yOZhPTNBGYS RTPUFP DPUFHROB OCHUEZDB. POB OUEEF U UPVPK CHUE OEPVIPDYNPE DMS UPJDBOYS DPLHNEOFB.

mHYUYEEE HRTBCHMEOYE DBOOSCHNYY SGML NPTsOP PRTEDEMSFSH YOZHPTNBGYPOOSCH BMENEOFSH Y NBOIRKHMSGYY U OINY U RTPYCHPMSHOPK UFEREOSHA DEFBMSHOPUFY. TBNEYOOOSCH BMENEOFSH NPZHF YNEFSH BFTYVKhFSH, PRTEDEMSAEYE IBTBLFETYUFYYY UCHPKUFCHB BMENEOFPCH. bFB YOZHPTNBGYS OE RTEDOBOBYEOB DMS REYUBFY, OP NPTSEF RPNPYUSH HRTBCHMEOYY BMENEOFBNY DBOOSCHI. oBRTYNET, BFTYVHF ID (YDEOFYZHYLBFPT) NPTSEF HOILBMSHOSCHN PVTBBPN YDEOFYZHYGYTPCHBFSH PDYO BVBG, YMY GEMSHCHK TBDEM, RTYNEYUBOIE, YMMAUFTBGYA, ЪBDBOYE, -- MAVPC BMENEOF, LBL CH LFPN RTYNETE:

yOZhPTNBGYS
fBL LBL YDEOFYZHYLBFPTSCH SCHMSAFUS NBYOOP-YUYFBENSCHNY, POY NPZHF UCHSCHCHBFSH NETSDH UPVPK YOZHPTNBGYA Y YURPMSHЪPCHBFSHUS DMS TBOPPVTBOPZP KHRTBCHMEOYS EK. UM:
  • lPOFTPMYTPCHBFSH VE'PRBUOPUFSH DPUFHRB L YOZHPTNBGYY, RPJCHPMSS FPMSHLP PRTEDEMEOOSCHN MADSN RTPUNBFTYCHBFSH YMY YNEOSFSH EE.
  • bChFPNBFYYTPCHBFSH RETENEEEOOYE YOZHPTNBGYY -- OBRTYNET, PVPCHMEOYE DBOOSCHI CH PDOPN NEUFE NPTSEF YOYGYTPCHBFSH PVOPCHMEOYE FPK TSE YOZHPTNBGYY CH DTHZYI RTYMPTSEOYSI.

TBDEMSENPUFSH CHPNPTSOPUFSH TBVPFSCH UP UFTKHLFKHTYTPCHBOOSCHNY LPNRPEOFBNY DPLKHNEOFB RPJCHPMSEF UFTPYFSH GEMSHK DPLKHNEOF YI UPUFBCHOSCHI YUBUFEK, TBVTPUBOOSCHI RP PTZB OHHHHHHHHHHHHHHHHHHHHHH lFP RPЪCHPMSEF RPMSHЪPCHBFEMSN DEMYFSHUS YOZHPTNBGYEK VEYE DHVMYTPCHBOYS.

nPVYMSHOPUFSH h YOZHPTNBGYPOOSCHI UEFSI, PVAEDYOSAEYI TBOPPVTBOSHE LPNRSHAFETSCH, PRETBGYPOOSHE UYUFENSH Y RTIMPTSEOYS, NPVYMSHOPUFSH UFBOPCHYFUS LMAYUPN LP CHUEPVEEK DPUF KHROPUFY YOZHPTNBGYY. rPULPMSHLH SGML OE ЪBCHYUYF PF BRRBTBFHTSCH Y RTYMPTSEOYK, NPTsOP MEZLP PVNEOYCHBFSHUS DPLHNEOFBNY NETSDKH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH CH RTYMPTSEOYY SGML RPЪCHPMSEF YURPMSHЪPCHBFSH YOZHPTNBGYA DBMELP ЪB TBNLBNY „OBUFPMSHOPK FYRPZTBZHYY“. UM:

  • UFTBOYGSCH WWW;
  • YOZHPTNBGYPOOSHE VBSHCH DBOOSCHI;
  • DYBZOPUFYUEULYE / LURETFOSCH UYUFENSCH;
  • LMELFTPOOBS RPYUFB;
  • ZYRETFELUFPCHBS DPLHNEOFBGYS;
  • RHWMYLBYY ÜBER CD-ROM;
  • YOFETBLFYCHOSHE LMELFTPOOSHE NBOHBMSHCH.
rPYENH SGML?

rPYENH OE Wort? rPFPNKH, YuFP LFP ЪBLTSCHFSCHHK ZHTNBF. rPFPNH, YuFP LFP ZhPTNBF PDOPZP RTYMPTSEOYS. rPFPNH, YuFP bFPZP RTYMPTSEOYS OEF RPD AOILUBNY, U LPFPTSCHNY S TBVPFBA. rPFPNKH, YuFP LFP OE FELUFPCHSHCHK ZHTNBF. rPFPNH, YuFP OEF UTEDUFCH BChFPNBFYUEULPK ZEOETBGYY FBLYI DPLHNEOFPCH. rPFPNH, YuFP OEF FPMLPCHSCHI UTEDUFCH HRTBCHMEOYS CHETUISNY Y LPMMELFYCHOPK TBVPFSHCH. rPFPNKH, YuFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSHUMPCHPK UFTHLFKhTSCH, Y OEF CHNPTSOPUFY YI UPPFOPUYFSH. rPFPNH, YuFP RTY LURPTFFE RPMHYUBEFUS UPCHETYYYOOOP OEHDPCHMEFCHPTYFEMSHOSHCHK HTML. rPFPNH, YuFP LBYUEUFChP CHETUFLY Y REYUBFY OJCE UTEDODOEZP.

rPYENH OE T E X? rPFPNKH, YuFP LFP UMYLPN OYLPHTPCHOECHSHCHK SJSHL. EZP OE DBYSH CH THLY OBUYOBAYENKH. rPFPNH, YuFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSHUMPCHPK UFTHHLFKhTSCH . rPFPNKH, YuFP NBMP T E X-PTYEOFYTPCHBOOSCHI TEDBLFPTPCH. rPFPNH, YuFP OEF KHDCHMEFCHPTYFEMSHOSHHI UTEDUFCH LURPTFB H Wort.

rPYENH OE HTML? rPFPNKH, YuFP UBNP RPOSFYE HTML UYMSHOP TBBNSHFP ZPOLPK WWW ЪБ LPNNETGYEK Y CHPKOK RTPYCHPDYFEMEC VTBHJETPCH DTHZ U DTHZPN. rPFPNH, YuFP HTML UFTBDBEF CHUE FEN TSE OEDPUFBFLPN: PTYEOFYTPCHBO ÜBER RTEDUFBCHMEOYE, B OE ÜBER UFTHLFHTH. rPFPNKH, YuFP PO PUEOSH VEDEO CHSTBIFEMSHOSHNY UTEDUFCHBNY, Y PFUKHFUFCHHAF CHNPTSOPUFY EZP TBUYYTEOYS. rPFPNH, YuFP OE TEYEOB RTPVMENB LPTTELFOPK TKHUIZHYLBGYY. rPFPNH, YuFP OEF KHDCHMEFCHPTYFEMSHOSHHI UTEDUFCH LURPTFB H Wort.

SGML RTPFPYCH WYSIWYG

dMS FAIRIES, LFP RTYCHSHL RPMSHЪPCHBFSHUS FPMSHLP „Textverarbeitung“-BNY, OBRTYNET, MS Word YMY WordPerfect, NPTsEF VSHCHFSH YOFETEUOP UPRPUFBCHMEOYE YI U SGML YOUFTHNEOFBNY. fY DCH ZTKHRRSCH RTPZTBNNOSHI UTEDUFCH, OEUNPFTS ÜBER UIPTSEUFSH TEYBENSHHI ЪBDBU -- RTPYCHPDUFCHP DPLHNEOFPCH -- CHEUSHNB DTHZ PF DTHZB PFMYUBAFUS RP BTIYFELFHTE Y ZHOLGYSN.

Textverarbeitungsprogramm – LFP YOFEMMELPHHBMSHOBS RYYHEBS NBYYOLB. AUF PTYEOFYTPCHBO ÜBER TBVPFH U CHYHBMSHOSCHN RTEDUFBCHMEOYEN FELUFB, IBTBLFETYYHAEEZPUS OBVPTPN UFYMEK: UFYMEK UYNCHPMPCH (YTYZhF, LEZMSH, OBUETFBOYE), BVBGECH (LTBUOBS UFTPLB, CHSTBCHOYCHBOYE, RPMPTSEOYE RP YYTYOE UFTBOYG SHCH), UFTBOYG (LPMPOFYFKHMSHCH, UOPULY), TBDEMPCH Y DPLHNEOPCH (ZHTNBF VKHNBZY, PZMBCHMEOYE), Y RTPYUYI. Textverarbeitung OE TBVPFBEF U CHOKHFTEOOEK UFTKHLFKHTPK DPLKHNEOFB.

SGML TEDBLFPT, OBRTPFYCH, PTYEOFYTPCHBO ÜBER TBVPFH U UPDETTSYNSCHN DPLHNEOFB. dMS SGML TEDBLFPTB, OBRTYNET, TBDEM – LFP BMENEOF, CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTBBDEMSH, BOE RTPNETSKHFPL PF PDOPZP BVBBGB, OBVTBOOPZP UFYMEN „bZPMPCHPL“ DP DTKhZ PZP, LBL VHI Textverarbeitung-a.

ьФП РПЪЧПМСЭФ БЧФПТХ UPUTEDDPFPYUFSHUS ÜBER UPDETSBOY FELUFB, BOE CHPJIFSHUS U EZP ZHTNBFYTPCHBOYEN Y CHSHCHVPTPN UFYMEK. chYHBMSHOBS UFYMYUFYLB DPLHNEOFB PRTEDEMSEFUS RTY EZP LURPTFFE CH CHCHPDOSH ZHTNBFSHCH, B OE RTY OBVPTE FELUFB.

p RTPZTBNNOPN PVEUREYUEOOYY

YuFPVSH OBYUBFSH TBVPBFFSH U DPLHNEOFBNY CH SGML RPMSHЪPCHBFEMA OHTSOSCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFCHB LURPTFB (ZHTNBFYTPCHBOYS).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHSHCHYUSHI FELUFPCHSCHI TEDBLFPTPCH, FBL Y PF „Textverarbeitung“ -PC. pF RETCHSHCHI – OBMYUYEN RPDDETSLY UFTHLFHTYTPCHBOOSCHI DPLHNEOPCH, PF CHFPTSCHI – PFUHFUFCHYEN RPDDETSLY CHYHBMSHOPZP ZHTNBFYTPCHBOYS. TEDBLFPT TBYTBEF DTD TEDBLFYTHENPZP DPLHNEOFB Y „CHEDEF“ RPMSHЪPCHBFEMS CH UPPFCHEFUFCHYY U OIN. OBRTYNET, EUMY DTD RTEDKHUNBFTYCHBEF BMENEOF, CH LPFPTPN NPZHF CHUFTEYUBFSHUS FPMSHLP BMENEOFSH YMY, FP RPMSHЪPCHBFEMA, TEDBLFYTHAENKH BMENEOF, VHDEF RTEDMPCEOP CH UFBCHYFSH PDYO YFYI DCHHI TBTEOOOSCHI BMENEOFPCH. SGML-TEDBLFPT FBLCE PVSHYUOP UPDETTSYF UTEDUFCHB OBCHYZBGYY RP YETBTIYY DPLHNEOF.

yЪ YUYUMB RPRKHMSTOSCHI SGML-TEDBLFPTPCH NPTsOP OBCHBFSH ArborText ADEPT*Editor, SoftQuad Author/Editor, psgml, Adobe FrameMaker+SGML, Corel WordPerfect, Y NOPCEUFChP DTHZYI.

uTEDUFCHB ZHTNBFYTPCHBOYS

uHEEUFCHHEF NOPTSEUFCHP UTEDUFCH TBVPFSCH U SGML FELUFBNY. VOMSHYKHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZHTNBFYTPCHBOYS -- LURPTFB SGML CH DTHZIE ZHTNBFSH DMS REYUBFY, RTPUNPFTB Y F.R. CHSHCHIPDOSH ZHPTNBFSH NPZHF VSCHFSH MAVSHNY, ЪBCHYUS MYYSH PF DPUFKHROPZP RTPZTBNNOPZP PVEUREYUEOYS Y OHTSD RPMSHЪPCHBFEMS. OBRTYNET, S YURPMSHYHA LPOCHETFETSHCH HTML, RTF Y L A T E X.

Im Jahr 1986, lange bevor die Idee, das Web zu schaffen, ins Leben gerufen wurde, wurde die universelle standardisierte Auszeichnungssprache SGML (Standardized Generalized Markup Language) als internationaler Standard (ISO 8879) zur Definition von Auszeichnungssprachen anerkannt, obwohl SGML seitdem existierte Ende der sechziger Jahre. Es wurde zur Beschreibung von Auszeichnungssprachen verwendet und ermöglichte es dem Autor gleichzeitig, jedem Element und Attribut der Sprache formale Definitionen zu geben.

HTML war ursprünglich nur eine der SGML-Anwendungen. Er beschrieb die Regeln, nach denen Informationen für die Welt aufbereitet werden sollten Breites Web. Somit ist HTML eine Reihe von SGML-Anweisungen, formuliert als Dokumenttypdefinition (DTD), die erklären, was Tags und Elemente bedeuten. Das HTML-DTD-Schema wird im Webbrowser gespeichert.

Zu den Nachteilen der HTML-Sprache gehören die folgenden:

  • HTML hat fester Satz von Tags. Sie können keine eigenen Tags erstellen, die für andere Benutzer verständlich sind.
  • HTML ist exklusiv Datenpräsentationstechnologie. HTML enthält keine Informationen über die Bedeutung des in den Tags enthaltenen Inhalts.
  • HTML - „flache“ Zunge. Die Bedeutung der Tags ist darin nicht definiert und kann daher nicht zur Beschreibung der Datenhierarchie verwendet werden.
  • Browser werden als Plattform für Anwendungen verwendet. HTML ist nicht leistungsfähig genug, um Webanwendungen auf dem Niveau zu erstellen, das Webentwickler derzeit anstreben. Beispielsweise ist es unmöglich, eine Anwendung zur professionellen Bearbeitung und Suche von Dokumenten in HTML zu entwickeln.
  • Große Mengen an Netzwerkverkehr. Bestehende HTML-Dokumente, die als Anwendungen verwendet werden, überlasten das Internet mit großem Datenverkehr in Client-Server-Systemen. Ein Beispiel wäre das Senden eines großen Dokuments über ein Netzwerk, wenn nur ein kleiner Teil des Dokuments benötigt wird.

Somit ist die HTML-Sprache einerseits ein sehr praktisches Mittel zum Markieren von Dokumenten für die Verwendung im Web, andererseits enthält ein in HTML markiertes Dokument nur wenige Informationen über seinen Inhalt. Wenn ein bestimmtes Dokument ausreichend vollständige Informationen über seinen Inhalt enthält, ist es relativ einfach möglich, eine automatische allgemeine Verarbeitung und Suche in der Datei durchzuführen, in der das Dokument gespeichert ist. Mit SGML können Sie Informationen über den Inhalt eines Dokuments speichern. Aufgrund seiner Komplexität wurde es jedoch nie so häufig verwendet wie HTML.

Eine Gruppe von SGML-Experten unter der Leitung von Jon Bosak von Sun Microsystems begann mit der Arbeit an der Erstellung einer Teilmenge von SGML, die von der Web-Community übernommen werden konnte. Es wurde beschlossen, viele nicht wesentliche Funktionen von SGML zu entfernen. Die so umgebaute Sprache hieß XML. Die vereinfachte Version erwies sich als wesentlich zugänglicher als das Original, da ihre Spezifikationen nur 26 Seiten lang waren, verglichen mit den über 500 Seiten der SGML-Spezifikationen.

Schauen wir uns die Struktur und Funktionen dieser Sprache genauer an.

XML (eXtensible Markup Language) ist eine vom W3C empfohlene Auszeichnungssprache. XML- Textformat, entwickelt zum Speichern strukturierter Daten, zum Austausch von Informationen zwischen Programmen sowie zum Erstellen darauf basierender spezialisierter Auszeichnungssprachen. XML ist eine vereinfachte Teilmenge der SGML-Sprache.

Die XML-Sprache hat Folgendes Würde:

  • Dies ist ein menschenorientiertes Dokumentformat, das sowohl für Menschen als auch für Computer verständlich ist.
  • Unterstützt Unicode.
  • Das XML-Format kann grundlegende Datenstrukturen wie Datensätze, Listen und Bäume beschreiben.
  • Es handelt sich um ein selbstdokumentierendes Format, das die Struktur und Feldnamen sowie Feldwerte beschreibt.
  • Es verfügt über streng definierte Syntax- und Parsing-Anforderungen, wodurch es einfach, effizient und konsistent bleibt.
  • Wird häufig zum Speichern und Verarbeiten von Dokumenten verwendet.
  • Dies ist ein Format, das auf internationalen Standards basiert;
  • Die hierarchische Struktur von XML eignet sich zur Beschreibung nahezu aller Dokumenttypen;
  • Es handelt sich um einen einfachen Text, frei von Lizenzen und jeglichen Einschränkungen;
  • Plattformunabhängig;
  • Es handelt sich um eine Teilmenge von SGML, für die umfangreiche Erfahrungen gesammelt und spezielle Anwendungen erstellt wurden;

Zu den Berühmten Mängel Zu den Sprachen gehören:

  • Die XML-Syntax ist redundant.
    • Die Größe des XML-Dokuments ist deutlich größer als die binäre Darstellung derselben Daten (etwa zehnmal).
    • Die Größe eines XML-Dokuments ist deutlich größer als die von alternativen textbasierten Datenübertragungsformaten (z. B. JSON, YAML) und insbesondere von Datenformaten, die für einen bestimmten Anwendungsfall optimiert sind.
    • XML-Redundanz kann sich auf die Anwendungsleistung auswirken. Die Kosten für die Speicherung, Verarbeitung und Übertragung von Daten steigen.
    • Für große Menge Aufgaben erfordern nicht die volle Leistungsfähigkeit der XML-Syntax und es können viel einfachere und leistungsfähigere Lösungen verwendet werden.
  • XML-Namespaces sind schwierig zu verwenden und in XML-Parsern schwer zu implementieren.
  • XML verfügt nicht über eine in die Sprache integrierte Datentypunterstützung. Es gibt keine Konzepte wie „Ganzzahlen“, „Zeichenfolgen“, „Datumsangaben“, „Boolesche Werte“ usw.
  • Das von XML angebotene hierarchische Datenmodell ist im Vergleich zum relationalen Modell und den objektorientierten Diagrammen begrenzt.

Generell kann man sich XML als mehr als nur vorstellen neue Sprache Markup, sondern auch als Grundlage für eine ganze Familie von Technologien:

Tabelle 9.1. XML-Familienstruktur
XML Technische Beratung zur Verwendung von XML
DTD Dokumenttypdefinition (Schema)
XDR XML-reduziertes Format (Microsoft Schema)
XSD Definieren eines XML-Schemas (W3C-Schema)
Namensraum Methode zur Definition von Element- und Attributnamen
XPath XML-Pfadsprache
XLink XML-Link-Sprache
XPointer XML-Zeigersprache
DOM Dokumentobjektmodell-API
SAXOPHON Einfache API für XML
XSL Erweiterbare Stylesheet-Sprache
XSL-FO XSL-Formatierungsobjekte
XSLT XSL-Transformationssprache
XInclude XML-Include-Syntax

Auszeichnungssprachen: SGML, HTML, XML. Ihre Verbindung untereinander.

HTML war ursprünglich nur eine SGML-Anwendung. Er beschrieb die Regeln, nach denen Informationen für das World Wide Web aufbereitet werden sollten. Somit ist HTML eine Reihe von SGML-Anweisungen, formuliert als Dokumenttypdefinition (DTD), die erklären, was Tags und Elemente bedeuten. Das HTML-DTD-Schema wird im Webbrowser gespeichert.

Somit ist die HTML-Sprache einerseits ein sehr praktisches Mittel zum Markieren von Dokumenten für die Verwendung im Web, andererseits enthält ein in HTML markiertes Dokument nur wenige Informationen über seinen Inhalt. Wenn ein bestimmtes Dokument ausreichend vollständige Informationen über seinen Inhalt enthält, ist es relativ einfach möglich, eine automatische allgemeine Verarbeitung und Suche in der Datei durchzuführen, in der das Dokument gespeichert ist. Mit SGML können Sie Informationen über den Inhalt eines Dokuments speichern. Aufgrund seiner Komplexität wurde es jedoch nie so häufig verwendet wie HTML.

Eine Gruppe von SGML-Experten unter der Leitung von Jon Bosak von Sun Microsystems begann mit der Arbeit an der Erstellung einer Teilmenge von SGML, die von der Web-Community übernommen werden konnte. Es wurde beschlossen, viele nicht wesentliche Funktionen von SGML zu entfernen. Die so umgebaute Sprache hieß XML. Die vereinfachte Version war wesentlich zugänglicher als das Original, da ihre Spezifikationen nur 26 Seiten lang waren, verglichen mit den mehr als 500 Seiten der SGML-Spezifikationen.

Vorteile der XML-Sprache.

  • Unterstützt Unicode.
  • Plattformunabhängig;

Internetdienste

Ein Webdienst ist ein Softwaresystem, das über einen URI verfügt und dessen öffentliche Schnittstellen in XML definiert sind. Die Beschreibung dieses Softwaresystems kann von anderen Anwendungen gefunden werden, die gemäß dieser Beschreibung über XML-basierte Nachrichten, die über Internetprotokolle übertragen werden, mit ihm interagieren können. Ein Webservice ist bei seiner Verwendung eine modulare Einheit Serviceorientierte Architektur Anwendungen.

Serviceorientierte Architektur (SOA, serviceorientierte Architektur) ist ein modularer Ansatz zur Softwareentwicklung, der auf der Nutzung von Diensten mit standardisierten Schnittstellen basiert.

SOA basiert auf den Prinzipien der Wiederverwendung von IT-Funktionselementen und der Vereinheitlichung standardmäßiger Betriebsprozesse. Programmkomponenten können über verschiedene Netzwerkknoten verteilt sein und werden als eigenständige und lose gekoppelte, austauschbare Anwendungsdienste angeboten.

Die Komponentenschnittstelle eines SOA-Programms kapselt die Implementierungsdetails einer bestimmten Komponente (Betriebssystem, Programmiersprache usw.).

.NET-Webdienste bieten die folgenden Vorteile:

  • Offenheit der Standards. Es gibt keine versteckten oder unzugänglichen Elemente in den Webdiensten. Jeder Aspekt der Technologie, von der Art und Weise, wie ein Webdienst gefunden wird, bis hin zu seiner Beschreibung und seiner Kommunikation, wird durch öffentlich verfügbare Standards definiert.
  • Plattformübergreifend. Eine Programmiersprache, mit der Sie XML-Dokumente erstellen und Informationen über HTTP senden können, sodass Sie mit jedem Webdienst interagieren können. Es ist möglich, einen Webdienst von einem anderen System als .NET zu empfangen.
  • Einfachheit.
  • Supportnachrichten in für Menschen lesbarer Sprache. Der Übergang von den in COM und CORBA verwendeten Binärstandards zu XML-Text erleichterte die Fehlerkorrektur und ermöglichte die Interaktion mit Webdiensten über reguläre HTTP-Kanäle.

Die Implementierung von .NET-Webdiensten ist so einfach wie das Aufrufen eines Remote-Webdiensts oder des Aufrufs einer lokalen Klassenmethode. Dies wird durch die Verwendung der vom .NET Framework bereitgestellten Tools erreicht, mit denen Sie einen vollständigen Webdienst erstellen können, ohne sich mit den Details der Funktionsweise von Standards wie SOAP, WSDL und UDDI vertraut machen zu müssen. Folgende Aktionen werden ausgeführt:

  • Ein Webdienst wird als .NET-Klasse mit Attributen entwickelt, die ihn als Webdienst mit einigen Funktionen identifizieren.
  • .NET generiert automatisch ein WSDL-Dokument, das beschreibt, wie der Client mit dem Webdienst interagieren soll.
  • Der Verbraucher findet den erstellten Webdienst und kann die entsprechende Webreferenz zum Visual Studio .NET-Projekt hinzufügen.
  • In der .NET-Umgebung wird es durchgeführt automatische Prüfung WSDL-Dokument und generiert eine Proxy-Klasse, die es dem Verbraucher ermöglicht, mit dem Webdienst zu interagieren.
  • Der Verbraucher ruft eine der Methoden Ihrer Webdienstklasse auf. Aus seiner Sicht unterscheidet sich dieser Aufruf optisch nicht vom Aufruf einer Methode in einer anderen Klasse, obwohl die Interaktion tatsächlich mit der Proxy-Klasse und nicht mit dem Webdienst erfolgt.
  • Die Proxy-Klasse wandelt die übergebenen Parameter in eine SOAP-Nachricht um und sendet diese an den Webservice.
  • Die Proxy-Klasse empfängt dann die SOAP-Antwort, konvertiert sie in den entsprechenden Datentyp und gibt sie als regulären .NET-Datentyp zurück.
  • Der Verbraucher nutzt die empfangenen Daten.
  • .NET-Webdienste nutzen die ASP .NET-Technologie, die Teil des .NET Frameworks ist. Es erfordert außerdem Unterstützung vom Microsoft IIS-Server.

    Die Hauptnachteile von Webdiensten sind eine geringere Leistung und größere Größe Netzwerkverkehr im Vergleich zu Technologien wie RMI, CORBA, DCOM durch die Verwendung von XML-Textnachrichten.

    Standards für Webdienste.

    WSDL-Spezifikation

    Jeder Webdienst stellt ein WSDL-Dokument (Web Service Description Language) bereit, das alles beschreibt, was der Client für die Arbeit mit diesem Dienst benötigt. Ein WSDL-Dokument bietet einem Entwickler eine einfache und konsistente Möglichkeit, die Syntax für den Aufruf einer beliebigen Webmethode anzugeben. Darüber hinaus ermöglicht Ihnen dieses Dokument die Verwendung von Tools zum automatischen Generieren von Proxy-Klassen, wie sie beispielsweise in den Umgebungen Visual Studio .NET und .NET Framework enthalten sind. Dank dieser Tools ist die Nutzung eines Webservices so einfach wie die Nutzung einer lokalen Klasse.

    Ein WSDL-Dokument verfügt über ein XML-basiertes Format, das Informationen in fünf Gruppen unterteilt. Bei den ersten drei Gruppen handelt es sich um abstrakte Definitionen, die unabhängig von Plattform-, Netzwerk- oder Sprachspezifika sind, während die verbleibenden beiden Gruppen konkrete Beschreibungen enthalten.

    SOAP-Protokoll

    Die Kommunikation zwischen Webdiensten und ihren Clients erfolgt über Nachrichten im XML-Format.

    SOAP (Simple Object Access Protocol) ist ein Nachrichtenprotokoll zur Auswahl von Webdiensten.

    Der Grundgedanke des SOAP-Standards besteht darin, dass Nachrichten in einem standardisierten XML-Format kodiert werden sollen.

    Zusätzlich zu SOAP-Nachrichten können Sie die Methoden GET und POST des HTTP-Protokolls verwenden, um Daten mit .NET-Diensten auszutauschen.

    Vorteile der Verwendung des SOAP-Formats gegenüber anderen Formaten zur Datenübertragung:

    • Das Kodieren von Datenstrukturen und DataSets in XML mithilfe von SOAP ist genauso einfach wie das Kodieren einfacher skalarer Datentypen.
    • Bei der Verwendung von SOAP-Nachrichten werden zusätzliche Tools bereitgestellt, um beispielsweise das Hinzufügen von Sicherheits- oder Tracing-Funktionen einfach zu ermöglichen.
    • Es gibt SOAP-Toolkits für verschiedene Programmiersprachen (und sogar für frühere Versionen von Microsoft C++ und Visual Basic). Andernfalls müssen Sie für die Kommunikation mit dem Dienst mithilfe der GET- und POST-Methoden des HTTP-Protokolls natürlich die Abfragezeichenfolge selbst erstellen und dann die Antwort analysieren.

    DISCO-Standard

    Der DISCO-Standard bietet der einfachste Weg Zugriff auf Manifestdateien erhalten, sodass Sie Links zu Webdiensten gruppieren können.

    Eine DISCO-Datei kann Dateien von verschiedenen Webservern enthalten und unterstützt die „dynamische Suche“ – die automatische Suche im Webdienst-Dateiverzeichnis auf dem Server.

    Manifestdateien sind nützlich, da sie mehrere Webdienste in einer einzigen Liste zusammenfassen, es Clients jedoch nicht ermöglichen, Webdienste zu finden bestimmter Typ ohne Angabe des Namens der Entwicklerfirma.

    UDDI-Spezifikation

    Die UDDI-Spezifikation (Universal Description, Discovery, and Integration) vermeidet diese Probleme, indem sie einen speziellen Speicher (Repository) verwendet, in dem Unternehmen und Organisationen Daten über die von ihnen bereitgestellten Dienste ablegen können. Mehr als 100 Unternehmen haben die Entwicklung der UDDI-Technologie initiiert ( volle Liste finden Sie unter http://www.uddi.org/community.html), einschließlich Sun und Microsoft. Gemeinsam entwickelten diese Unternehmen einen Entwurf einer UDDI-Spezifikation, der nach 18 Monaten standardisiert wurde.

    Die Informationen in diesem Repository müssen manuell aktualisiert werden. Zu diesem Zweck pflegen einige „Knotenbetreiber“ identische Kopien des UDDI-Repositorys. Diese Unternehmen stellen die Speicherung des angegebenen Repositorys und den kostenlosen Zugriff darauf zur Verfügung, um Webdienste bekannt zu machen. Darüber hinaus hat Microsoft eine Version von UDDI integriert Software Windows Server.NET zur Verwendung in Unternehmensnetzwerke Intranet.

    Der UDDI-Speicher enthält Informationen über die Unternehmen, die Webdienste bereitstellen, den Typ jedes Dienstes sowie die Beziehungen zu Informationen und Spezifikationen im Zusammenhang mit diesen Diensten. Die UDDI-Schnittstelle selbst ist ein Webdienst. Um sich zu registrieren oder nach einem Dienst zu suchen, müssen Sie eine SOAP-Nachricht senden.

    WEB - Integration.

    Das Ziel der Webintegration besteht darin, unterschiedliche Webanwendungen und -systeme in einer einzigen webbasierten Umgebung zu kombinieren.

    Folgende Ansätze zur Webintegration werden praktiziert:

    · Integration auf der Präsentationsebene. Diese Ebene ermöglicht dem Benutzer die Interaktion mit der Anwendung. Integration auf der Präsentationsebene gibt Zugriff auf die Benutzeroberfläche von Remote-Anwendungen.

    · Integration auf Funktionalitätsebene. Diese Integration impliziert die Bereitstellung eines direkten Zugriffs auf die Geschäftslogik der Anwendung. Dies wird durch die direkte Interaktion zwischen Anwendungen und erreicht API(Anwendungsprogrammierschnittstelle) oder Interaktion über Internetdienste.

    · Integration auf Datenebene. In diesem Fall Zugriff auf einen oder mehrere Datenbanken, wird von der Remote-Anwendung verwendet.

    · Umfassende Integration. Kommerzielle Web-Integrationslösungen umfassen typischerweise alle drei Arten der Integration

    Die Verwendung der Webintegration ist aus vielen Gründen vorteilhaft:

    · Webintegration ermöglicht Ihnen die Bereitstellung Informationssysteme basierend auf Drittanwendungen, ohne deren übergeordnete Systeme verstehen zu müssen, Softwareumgebungen und Datenbankarchitekturen.

    · SOA Und Internetdienste Nutzen Sie eine Programmiersprache und plattformunabhängige Schnittstellen zwischen Anwendungen der Unternehmens-IT-Infrastruktur. Dies bietet offensichtliche Vorteile bei der Unterstützung, Verwaltbarkeit und Bereitstellung von Informationsnetzwerken.

    · Durch die Webintegration können Sie komplexe Funktionen aufbauen, indem Sie unterschiedliche Komponenten über Webdienstprotokolle kombinieren.

    · Die Webintegration ermöglicht Ihnen die Nutzung von Entwickler-Webdiensten.

    · Die Webintegration ermöglicht Ihnen die Entwicklung von Anwendungsprogrammschnittstellen über Webdienstprotokolle ohne Programmierung.

    Für die Webintegration werden meist kommerzielle Software oder gängige Technologien genutzt, wie z.B PHP/Python/Perl, XForms, SEIFE usw.

    XML-basierte Integration

    Anstatt die Interaktion zwischen den einzelnen Systempaaren zu implementieren, müssen Sie jedem von ihnen lediglich beibringen, XML zu „sprechen“. Mit anderen Worten: Es kommt darauf an, mehrere zu entwickeln Wrapper(Umschlag - Packer, Software-Tool Erstellen einer System-Shell zur Standardisierung externer Aufrufe und zur Änderung der funktionalen Ausrichtung des aktuellen Systems), die von der Standard-XML-Sprache des integrierten Systems in eine für jedes einzelne System verständliche Sprache übersetzt.

    · Entwicklungstools und Standardbibliotheken für XML gibt es auf fast allen Plattformen und für die gängigsten Programmiersprachen;

    · Die Methoden zur Arbeit mit XML sind ausreichend standardisiert, sodass dieselben Techniken in verschiedenen Systemen verwendet werden können.

    · In XML formatierte Informationen können nicht nur von Maschinen, sondern auch von Menschen verarbeitet werden (was das Debuggen erheblich erleichtert).

    Grundsätzlich unterscheidet sich die auf einem XML-Schema basierende Integration nicht grundsätzlich von der auf einem anderen gängigen Standard basierenden Integration. Gleichzeitig bietet es eine Reihe wesentlicher Vorteile:

    · XML-Sprachen sind nicht von Hardware- und Softwareplattformen abhängig, was die Verbindung unterschiedlicher Systeme ermöglicht;

    · Die Ausdruckskraft von XML ist groß genug, um Daten nahezu beliebiger Komplexität zu beschreiben.

    Die XML-basierte Integration wird im Rahmen der folgenden Protokolle praktisch umgesetzt:

    · XML-RPC. Dabei handelt es sich um ein Remote-Procedure-Call-Protokoll mit Datenübertragung im XML-Format über TCP-Port 80, d.h. HTTP-Port.

    · WDDX(Web Distributed Exchange). Dabei handelt es sich um einen Mechanismus zum Austausch komplexer Datenstrukturen über das HTTP-Protokoll. Das Protokoll basiert nicht auf Strukturen, sondern auf Ereignissen.

    · ebXML(Electronic Business XML) – XML für elektronisches Geschäft. Der Hauptzweck besteht darin, eine offene XML-Infrastruktur bereitzustellen, die die sichere globale Nutzung von E-Business-Informationen gewährleistet. Webdienste (Webdienste).

    XML (eXtensibleMarkupLanguage) ist eine vom W3C empfohlene Auszeichnungssprache. XML ist ein Textformat, das zum Speichern strukturierter Daten, zum Austausch von Informationen zwischen Programmen und auch zum Erstellen darauf basierender spezialisierter Auszeichnungssprachen entwickelt wurde. XML ist eine vereinfachte Teilmenge der SGML-Sprache .

    Die XML-Sprache hat Folgendes Würde:

    • Dies ist ein menschenorientiertes Dokumentformat, das sowohl für Menschen als auch für Computer verständlich ist.
    • Unterstützt Unicode.
    • Das XML-Format kann grundlegende Datenstrukturen wie Datensätze, Listen und Bäume beschreiben.
    • Es handelt sich um ein selbstdokumentierendes Format, das die Struktur und Feldnamen sowie Feldwerte beschreibt.
    • Es verfügt über streng definierte Syntax- und Parsing-Anforderungen, wodurch es einfach, effizient und konsistent bleibt.
    • Wird häufig zum Speichern und Verarbeiten von Dokumenten verwendet.
    • Dies ist ein Format, das auf internationalen Standards basiert;
    • Die hierarchische Struktur von XML eignet sich zur Beschreibung nahezu aller Dokumenttypen;
    • Es handelt sich um einen einfachen Text, frei von Lizenzen und jeglichen Einschränkungen;
    • Plattformunabhängig;
    • Es handelt sich um eine Teilmenge von SGML, für die umfangreiche Erfahrungen gesammelt und spezielle Anwendungen erstellt wurden.

    Zu den Berühmten Mängel Zu den Sprachen gehören:

    · Die XML-Syntax ist redundant.

    · Die Größe eines XML-Dokuments ist deutlich größer als die binäre Darstellung derselben Daten.

    · Die Größe eines XML-Dokuments ist deutlich größer als die von alternativen textbasierten Datenübertragungsformaten (z. B. JSON, YAML) und insbesondere von Datenformaten, die für einen bestimmten Anwendungsfall optimiert sind.

    · XML-Redundanz kann die Leistung der Anwendung beeinträchtigen. Die Kosten für die Speicherung, Verarbeitung und Übertragung von Daten steigen.

    · Für eine große Anzahl von Aufgaben ist nicht die volle Leistungsfähigkeit der XML-Syntax erforderlich und es können viel einfachere und produktivere Lösungen verwendet werden.

    • XML-Namespaces sind schwierig zu verwenden und in XML-Parsern schwer zu implementieren.
    • XML verfügt nicht über eine in die Sprache integrierte Datentypunterstützung. Es gibt keine Konzepte wie „Ganzzahlen“, „Zeichenfolgen“, „Datumsangaben“, „Boolesche Werte“ usw.
    • Das von XML angebotene hierarchische Datenmodell ist im Vergleich zum relationalen Modell und den objektorientierten Diagrammen begrenzt.

    Im Wesentlichen dient XML Metasprache um die Struktur anderer Sprachen zu beschreiben. Die Beziehung zwischen SGML, XML, HTML und einigen anderen Sprachen wird im folgenden Diagramm dargestellt:

    Ein wichtiger Unterschied zwischen XML und HTML besteht darin, dass beim Markieren von Dokumenten großer Wert darauf gelegt wird, zu überwachen, wie genau die Regeln der Sprache befolgt werden. Abhängig davon ist es üblich zu unterscheiden richtig gebaut Und gültig XML-Dokumente.

    Es wird ein XML-Dokument betrachtet richtig aufgebaut, wenn es allen XML-Syntaxregeln entspricht.

    Untersuchung Wirklichkeit Das Dokument umfasst die folgenden Aktionen:

    • Überprüft, ob nur ein bestimmter Satz von Deskriptoren verwendet wird.
    • Überprüfung der vollständigen Übereinstimmung der Reihenfolge der Elemente und Attribute mit dem Inhalt des Dokuments oder bestimmten Regeln.
    • Kontrolle von Datentypen (erreicht durch die Verwendung eines geeigneten Schemas).
    • Kontrolle der Datenintegrität, um einen optimalen Informationsaustausch über das Web mithilfe von Transaktionen sicherzustellen.

    Grundlegende syntaktische Regeln zum Erstellen von XML-Dokumenten.

    • Das XML-Dokument enthält eins und nur eins Wurzelelement enthält alle anderen Elemente
    • Untergeordnete Elemente Enthalten in Wurzelelement, muss korrekt verschachtelt sein.
    • Namen Elemente gehorchen den Regeln:
    • Der Name beginnt mit einem Buchstaben, Unterstrich oder Doppelpunkt.
    • Nach dem ersten Zeichen im Namen können Buchstaben, Zahlen, Bindestriche, Unterstriche, ein Punkt oder ein Doppelpunkt stehen.
    • Namen dürfen nicht mit einer XML-Buchstabenkombination beginnen.

    Das XML-Dokument hat folgenden Aufbau:

    • Die erste Zeile des XML-Dokuments wird aufgerufen Bekanntmachung XML. Dies ist eine optionale Zeichenfolge, die die Version des XML-Standards angibt (normalerweise 1.0). Auch Zeichenkodierungen und externe Abhängigkeiten können hier angegeben werden.

    SGML (Englisch) Standardisierte verallgemeinerte Auszeichnungssprache- Standard-verallgemeinerte Auszeichnungssprache; ausgesprochen [ SGM]) ist eine Metasprache, in der Sie eine Auszeichnungssprache für Dokumente definieren können. SGML ist der Nachfolger der 1969 bei IBM entwickelten GML (Generalized Markup Language), die nicht mit der vom Open GIS Consortium entwickelten Geography Markup Language verwechselt werden sollte.

    SGML wurde ursprünglich für die gemeinsame Nutzung maschinenlesbarer Dokumente in großen Regierungs- und Luft- und Raumfahrtprojekten entwickelt. Es war in der Druck- und Verlagsbranche weit verbreitet, aber aufgrund seiner Komplexität war es schwierig, es allgemein für den täglichen Gebrauch zu nutzen.

    Hauptteile des SGML-Dokuments:

    1. SGML-Deklaration – definiert, welche Zeichen und Trennzeichen in der Anwendung erscheinen können;

    2. Dokumenttypdefinition – definiert die Syntax von Markup-Konstrukten. Die DTD kann zusätzliche Definitionen enthalten, z. B. symbolische Referenzen;

    3. Semantikspezifikation, bezieht sich auf Markup – gibt auch Syntaxbeschränkungen an, die nicht innerhalb einer DTD ausgedrückt werden können;

    4. Inhalt des SGML-Dokuments – es muss mindestens ein Root-Element vorhanden sein.

    SGML bietet eine Vielzahl syntaktischer Markup-Optionen zur Verwendung durch eine Vielzahl von Anwendungen. Durch Ändern der SGML-Deklaration können Sie sogar auf die Verwendung spitzer Klammern verzichten, obwohl diese Syntax als Standard gilt, die sogenannte konkrete Referenzsyntax.

    SGML ist von der ISO standardisiert: „ISO 8879:1986 Informationsverarbeitung – Text- und Bürosysteme – Standard Generalized Markup Language (SGML)“

    HTML und XML sind von SGML abgeleitet. HTML ist eine Anwendung von SGML und XML ist eine Teilmenge von SGML, die den Prozess der maschinellen Analyse eines Dokuments vereinfachen soll. Weitere SGML-Anwendungen sind SGML Docbook (Dokumentation) und „Z Format“ (Typografie und Dokumentation).

    XML Erweiterbare Auszeichnungssprache- erweiterbare Auszeichnungssprache; ausgesprochen [ x-em-el]) ist eine vom World Wide Web Consortium empfohlene Auszeichnungssprache, bei der es sich eigentlich um eine Reihe allgemeiner syntaktischer Regeln handelt. XML ist ein Textformat, das zum Speichern strukturierter Daten (anstelle vorhandener Datenbankdateien), zum Austausch von Informationen zwischen Programmen und auch zum Erstellen darauf basierender spezialisierterer Auszeichnungssprachen (z. B. XHTML) entwickelt wurde. XML ist eine vereinfachte Teilmenge der SGML-Sprache.

    Der Standard definiert zwei Korrektheitsstufen für ein XML-Dokument:

    · Richtig gebaut(Englisch) wohlgeformt). Ein wohlgeformtes Dokument folgt allen allgemeinen Regeln der XML-Syntax, die für jedes XML-Dokument gelten. Und wenn zum Beispiel der Start-Tag keinen entsprechenden End-Tag hat, dann dieser falsch konstruiert XML-Dokument. Ein Dokument, das nicht ordnungsgemäß erstellt wurde, kann nicht als XML-Dokument betrachtet werden. Der XML-Prozessor (Parser) sollte es nicht normal verarbeiten und die Situation als schwerwiegenden Fehler einstufen.

    · Gültig(Englisch) gültig). Ein gültiges Dokument unterliegt außerdem bestimmten semantischen Regeln. Hierbei handelt es sich um eine strengere zusätzliche Prüfung der Richtigkeit des Dokuments hinsichtlich der Einhaltung vorgegebener, aber bereits externer Regeln, um die Anzahl von Fehlern, beispielsweise in der Struktur und Zusammensetzung eines bestimmten, spezifischen Dokuments oder einer Dokumentenfamilie, zu minimieren. Diese Regeln können entweder vom Benutzer selbst oder von Drittentwicklern, beispielsweise Entwicklern von Wörterbüchern oder Datenaustauschstandards, entwickelt werden. Typischerweise werden solche Regeln in speziellen Dateien gespeichert – Diagrammen, in denen die Struktur des Dokuments, alle gültigen Namen von Elementen, Attributen und vieles mehr detailliert beschrieben werden. Und wenn ein Dokument beispielsweise einen Elementnamen enthält, der zuvor nicht in den Schemata definiert wurde, dann wird das XML-Dokument berücksichtigt Leere; Bei der Überprüfung der Einhaltung von Regeln und Schemata ist der prüfende XML-Prozessor (Validator) verpflichtet (nach Wahl des Benutzers), einen Fehler zu melden.

    Für diese beiden Konzepte gibt es keine gut etablierte standardisierte Übersetzung ins Russische, insbesondere das Konzept gültig, was auch übersetzt werden kann als gültig, legitim, zuverlässig, fit, oder auch geprüft auf Einhaltung von Regeln, Normen, Gesetzen. Manche Programmierer verwenden im Alltag etabliertes Transparentpapier. Gültig».

    XML-Technologie. Zweck, Umfang.

    XML ist eine erweiterbare Auszeichnungssprache. Stellt eine Reihe allgemeiner syntaktischer Regeln dar. XML ist ein Textformat zum Speichern strukturierter Daten, zum Austausch von Informationen zwischen Programmen sowie zum Erstellen darauf basierender spezialisierterer Auszeichnungssprachen (z. B. XHTML, HTML). XML ist eine vereinfachte Teilmenge der SGML-Sprache.

    Der Zweck der Erstellung von XML bestand darin, die Kompatibilität bei der Übertragung strukturierter Daten zwischen verschiedenen Isicherzustellen, insbesondere bei der Übertragung solcher Daten über das Internet. Auf XML basierende Wörterbücher (z. B. RDF, RSS, MathML, XHTML, SVG) werden selbst formal beschrieben, sodass Sie auf diesen Wörterbüchern basierende Dokumente programmgesteuert ändern und überprüfen können, ohne deren Semantik zu kennen, d die Elemente. Ein wichtiges Merkmal von XML ist auch die Verwendung sogenannter Namespaces.

    XML ist eine hierarchische Struktur zur Speicherung beliebiger Daten; visuell kann die Struktur als Baum dargestellt werden. Die wichtigste syntaktische Anforderung besteht darin, dass das Dokument nur ein Wurzelelement hat. Das bedeutet, dass der Text zwischen einem einzelnen Start-Root-Tag und dem entsprechenden End-Tag stehen muss.

    Wir listen die wichtigsten Aufgaben auf, die die XML-Plattform bietet:

    Schaffung des Webs der zweiten Generation;

    Erfüllt die Funktionen einer Zwischensprache beim Datenaustausch zwischen Softwaresysteme, möglicherweise unterschiedliche Technologien implementieren und so deren Interoperabilität sicherstellen;

    Integration heterogener Informationsressourcen, verschiedener Datenmanagementtechnologien und -anwendungen;

    Schaffung eines neuen Zweigs der Datenbanktechnologien namens XML-basierte Datenbanken;

    Neben der Verwendung XML-orientierter Datenbanktechnologien für ihren beabsichtigten Zweck – der Verwaltung von Repositories von XML-Dokumenten – können wir davon ausgehen, dass sie bei der Lösung des Problems des „verborgenen“ Webs Anwendung finden werden; Dank der Einheit des Datenmodells von XML-Dokumenten, die auf dem Webserver präsentiert werden, und in der darüber zugänglichen XML-orientierten Datenbank wird es möglich, „versteckte“ Dokumente zu „öffnen“ Informationsressourcen Datenbanken für die Mechanismen solcher Webserver;

    Bereitstellung von Tools für neue Anwendungsbereiche des Webs, wie E-Business, elektronische Bibliotheken, elektronische Publikationen usw.

    Der Umfang der XML-Plattformstandards wird ständig erweitert und deckt eine Reihe von Technologien und Standards sowohl im horizontalen als auch im vertikalen Bereich ab.

    Ajax-Technologie.

    AJAX (aus dem Englischen Asynchronous Javascript and XML – „asynchrones JavaScript und XML“) ist ein Ansatz zum Aufbau interaktiver Benutzeroberflächen für Webanwendungen, der aus dem „Hintergrund“-Austausch von Browserdaten mit dem Webserver besteht. Dadurch wird die Webseite beim Aktualisieren von Daten nicht vollständig neu geladen und Webanwendungen werden schneller und komfortabler.

    Technologie

    AJAX ist keine eigenständige Technologie, sondern ein Konzept zur Nutzung mehrerer verwandter Technologien. AJAX basiert auf zwei Hauptprinzipien:

    Verwendung von Technologie für den dynamischen Zugriff auf den Server im laufenden Betrieb, ohne die gesamte Seite neu laden zu müssen, zum Beispiel:

    Verwenden von XMLHttpRequest(Hauptobjekt);

    Durch die dynamische Erstellung von untergeordneten Frames;

    Durch dynamische Tag-Erstellung.

    Verwenden von DHTML zum dynamischen Ändern des Seiteninhalts;

    Das Datenübertragungsformat ist normalerweise JSON oder XML.

    Vorteile

    -Verkehr sparen

    Die Verwendung von AJAX kann den Datenverkehr bei der Arbeit mit einer Webanwendung erheblich reduzieren, da es häufig ausreicht, statt die gesamte Seite zu laden, nur den geänderten Teil zu laden, der normalerweise recht klein ist.

    -Reduzierung der Serverlast

    Mit AJAX können Sie die Belastung des Servers leicht reduzieren. Wenn Sie beispielsweise auf der E-Mail-Seite gelesene Nachrichten markieren, muss der Server lediglich Änderungen an der Datenbank vornehmen und eine Nachricht an das Client-Skript senden, dass der Vorgang erfolgreich war, ohne dass die Seite neu erstellt und an die E-Mail-Seite übertragen werden muss Klient.

    -Beschleunigte Schnittstellenreaktion

    Da nur der geänderte Teil geladen werden muss, sieht der Benutzer schneller das Ergebnis seiner Aktionen.

    Mängel

    -Mangelnde Integration mit Standard-Browser-Tools

    Dynamisch erstellte Seiten werden vom Browser nicht im Browserverlauf aufgezeichnet, sodass die Schaltfläche „Zurück“ nicht funktioniert und Benutzern die Möglichkeit gibt, zu zuvor angezeigten Seiten zurückzukehren. Es gibt jedoch Skripte, die dieses Problem lösen können.

    Ein weiterer Nachteil der Änderung des Seiteninhalts bei konstanter URL besteht darin, dass Sie den gewünschten Inhalt nicht mit einem Lesezeichen versehen können. Diese Probleme können teilweise gelöst werden, indem die Fragment-ID (der Teil der URL nach dem #) dynamisch geändert wird, was viele Browser zulassen.

    -Dynamisch geladene Inhalte stehen Suchmaschinen nicht zur Verfügung (es sei denn, Sie überprüfen die Anfrage, ob es sich um eine reguläre oder eine XMLHttpRequest handelt)

    Suchmaschinen können kein JavaScript ausführen, daher müssen Entwickler alternative Möglichkeiten für den Zugriff auf Website-Inhalte in Betracht ziehen.

    -Alte Methoden zur Berücksichtigung von Website-Statistiken werden irrelevant

    -Komplikation des Projekts

    Die Datenverarbeitungslogik wird neu verteilt – die primären Datenformatierungsprozesse werden getrennt und teilweise auf die Clientseite übertragen. Dies macht es schwierig, die Integrität von Formaten und Typen zu kontrollieren. Der endgültige Effekt der Technologie kann durch einen unangemessenen Anstieg der Kosten für Codierung und Projektmanagement sowie das Risiko einer Verringerung der Verfügbarkeit des Dienstes für Endbenutzer zunichte gemacht werden.

    -Erfordert im Browser aktiviertes JavaScript

    gastroguru 2017