Medlem : Innlogging |Registrering |Last opp kunnskap
Søk
Unicode [Modifisering ]
Unicode er en databehandlingsstandard for konsekvent koding, representasjon og håndtering av tekst uttrykt i de fleste av verdens skrivesystemer. Den nyeste versjonen inneholder et repertoar på 136,755 tegn som dekker 139 moderne og historiske skript, samt flere symbolsett. Unicode-standarden er opprettholdt i forbindelse med ISO / IEC 10646, og begge er kode-for-kode-identiske.Unicode Standard består av et sett med kodediagrammer for visuell referanse, en kodingsmetode og sett med standard tegnkodinger, et sett med referansedatafiler og en rekke relaterte elementer, for eksempel tegnegenskaper, regler for normalisering, dekomponering, sortering , gjengivelse og toveisvisning (for riktig visning av tekst som inneholder både høyre til venstre-skript, for eksempel arabisk og hebraisk, og venstre-til-høyre-skript). Fra juni 2017 er den nyeste versjonen Unicode 10.0. Standarden vedlikeholdes av Unicode Consortium.Unicodes suksess på samlende tegnsett har ført til en utbredt og dominerende bruk i internasjonalisering og lokalisering av dataprogramvare. Standarden er implementert i mange nyere teknologier, inkludert moderne operativsystemer, XML, Java (og andre programmeringsspråk) og .NET Framework.Unicode kan implementeres av forskjellige tegnkodinger. Unicode-standarden definerer UTF-8, UTF-16 og UTF-32, og flere andre kodinger er i bruk. De mest brukte kodene er UTF-8, UTF-16 og UCS-2, en forløper for UTF-16.UTF-8, dominerende brukt av nettsteder (over 90%), bruker en byte for de første 128 kodepunktene og opptil 4 byte for andre tegn. De første 128 Unicode-kodepunktene er ASCII-tegnene; så en ASCII-tekst er en UTF-8-tekst.UCS-2 bruker bare to byte (16 bits) for hvert tegn, men kan bare kode de første 65.536 koden poeng, det såkalte grunnleggende flerspråklige flyet (BMP). Med 1,114,112 kodepunkter på 17 fly er mulig, og med over 120.000 kodepunkter definert så langt, er mange Unicode-tegn utenfor rekkevidden til UCS-2. Derfor er UCS-2 foreldet, men fortsatt mye brukt i programvare. UTF-16 utvider UCS-2, ved å bruke samme 16-biters koding som UCS-2 for det grunnleggende flerspråklige flyet, og en 4-byte-koding for de andre flyene. Så lenge det ikke inneholder kodepunkter i det reserverte området U 0D800-U 0DFFF, er en UCS-2-tekst en gyldig UTF-16-tekst.UTF-32 (også referert til som UCS-4) bruker fire byte for hvert tegn. I likhet med UCS-2 er antall byte per tegn fast, noe som letter karakterindeksering; men i motsetning til UCS-2, er UTF-32 i stand til å kode alle Unicode-kodepunkter. Men fordi hvert tegn bruker fire byte, tar UTF-32 betydelig mer plass enn andre kodinger, og brukes ikke mye..
[Tegnkoding]
1.Opprinnelse og utvikling
1.1.Historie
1.2.Arkitektur og terminologi
1.2.1.Kodeplaner og blokker
1.2.2.Generelt Kategori eiendom
1.2.3.Abstrakte tegn
1.3.Unicode Consortium
1.4.versjoner
1.5.Skript dekket
2.Kartlegging og koding
2.1.Unicode Transformation Format og Universal Coded Character Set
2.2.Ferdige versus kompositte tegn
2.3.Ligaturer
2.4.Standardiserte delsett
3.Adopsjon
3.1.Operativsystemer
3.2.Inngangsmetoder
3.3.e-post
3.4.web
3.5.fonter
3.6.linjeskift
4.Problemer
4.1.Filosofisk og fullstendighetskritikk
4.2.Mapping til eldre tegnsett
4.3.Indikate skript
4.4.Kombinerer tegn
4.5.anomalies
[Last opp Mer Innhold ]


Copyright @2018 Lxjkh