ComputersNtaub ntawv technology

Encoding "Unicode": cim coding qauv

Txhua Internet neeg siv nyob rau hauv ib qho los teem ib los yog lwm ntawm nws muaj nuj nqi tsawg kawg yog ib zaug pom ntawm qhov screen sau nyob rau hauv Latin ntawv lo lus "Unicode." Yuav ua li cas yog nws, koj yuav kawm tau los ntawm kev nyeem no tsab xov xwm.

txhais

Charset "unicode" - cim encoding txheem. Nws twb npaj siab los ntawm Unicode Inc. non-profit organization nyob rau hauv 1991. Cov txuj no yog tsim los coj ua ke qhov loj tshaj plaws tau xov tooj ntawm ntau hom ntawm cov cim nyob rau hauv ib daim ntawv. Page, uas yog tsim los pab rau lub hauv paus ntawd, yuav muaj cov tsiaj ntawv thiab cov cim los ntawm ntau hom lus (los ntawm Lavxias teb sab mus Korean) thiab lej cim. Nyob rau hauv cov ntaub ntawv no, tag nrho cov cim nyob rau hauv lub cim txheej muaj tso tawm tsis muaj teeb meem.

Yog vim li cas cov creation ntawm

Ib zaug thaum ib lub sij hawm, ntev ua ntej cov tsos ntawm ib tug tib system "Unicode" encoding yog xaiv raws li lub nyiam ntawm tus neeg sau ntawm daim ntawv. Vim li no, feem ntau nyeem ib daim ntawv, nws yog tsim nyog los siv ntau lub rooj. Tej zaum nws yog tsim nyog los ua ob peb lub sij hawm, uas zoo heev complicates lub neej ntawm qhov nruab nrab neeg siv. Raws li twb tau hais, cov tshuaj rau qhov teeb meem no nyob rau hauv 1991 tau raug caw los Unicode Inc. ib tug uas tsis yog-profit cov koom haum kom muaj ib tug tshiab hom ntawm cov ua cim encoding. Nws yog tsim los mus ua ke outdated thiab ib tug ntau yam ntawm cov qauv. "Unicode" - ib tug encoding uas ozvolila cuag lub unthinkable thaum lub sij hawm: mus tsim ib lub cuab tam uas txhawb nqa ib tug lossis loj tus naj npawb ntawm cov cim. Cov ua zoo tshaj ntau cov miv nyuas - muaj cov ntaub ntawv txhij muaj lus Askiv thiab Lavxias teb sab ntawv nyeem, Latin, thiab lej kab zauv.

Tab sis lub creation ntawm ib tug unified coding preceded los ntawm cov kev xav tau los daws ib tug xov tooj ntawm cov teeb meem uas muaj arisen vim cov loj loj ntau yam ntawm cov qauv twb uas twb muaj lawm thaum lub sij hawm. Feem ntau ntawm lawv:

  • Elvish sau ntawv, los yog "gibberish";
  • rau cov kev txwv ntawm cov ua cim txheej;
  • teeb meem txia codings;
  • font Individuals.

Me keeb kwm excursus

Xav txog tej yam uas cov vaj 80th. Khoos phib tawj hardware tsis yog li ntawd ntau thiab muaj ib daim ntawv txawv ntawm hnub no. Thaum txhua OS yog cim thiab refined txhua txhua tus neeg txhawb lawv xav tau. Xav tau rau cov kev pauv ntawm cov ntaub ntawv yog hloov dua siab tshiab rau hauv ib qho ntxiv rework txhua yam. Sim nyeem ib daim ntawv uas tsim los ntawm lwm operating system, feem ntau qhia txog ib tug coj txawv txawv txheej ntawm cov cim, thiab qhov kev ua si pib nrog lub encoding. Nws tsis yeej ib txwm ua nws sai sai, thiab tej zaum kuj tsim nyog daim ntawv tsis qhib nyob rau hauv rau lub hlis, thiab txawm tom qab. Cov neeg uas nquag sib hloov xov xwm, tsim rau lawv tus kheej ib tug hloov dua siab tshiab lub rooj. Thiab ces ua hauj lwm rau lawv qhia ib qho kev nthuav qhia: qhov yuav tsum tau los tsim lawv nyob rau hauv ob cov lus qhia, "los ntawm kuv rau hauv koj lub" rov qab los los. Ua banal inversion xam tshuab tsis tau, rau nws nyob rau hauv txoj cai kem ntawm qhov, thiab rau sab laug - cov, tiam sis tsis vice versa. Yog hais tias koj pom qhov yuav tsum tau siv tej yam tshwj xeeb cim nyob rau hauv cov ntaub ntawv, lawv yuav tsum tau muab ntxiv ua ntej, thiab ces lwm, thiab tau piav rau cov khub li cas nws yuav tsum tau ua rau cov cim tsis ua ib tug "gibberish." Thiab cia tsis nco tias rau txhua txhua encoding yuav tsum tau tsim lossis siv lawv tus kheej fonts, uas coj mus rau lub creation ntawm ib tug lossis loj tus naj npawb ntawm duplicates nyob rau hauv lub OS.

Xav txog tej yam ntxiv tias cov fonts rau cov nplooj ntawv, koj yuav pom 10 daim ntawm zoo tib yam Times Tshiab Roman nrog ib tug me me daim ntawv: rau UTF-8, UTF-16, ANSI, UCS-2. Tam sim no koj to taub hais tias txoj kev loj hlob ntawm universal qauv yog ib qho tseem ceeb?

"Lub founding txiv ntawm cov creators ntawm"

Lub hauv paus pib ntawm lub creation ntawm Unicode yuav mus nrhiav tau nyob rau hauv 1987 thaum Dzho Bekker los ntawm Xerox, nrog rau Lee Collins thiab Mark Davis los ntawm cov kua pib tshawb fawb nyob rau hauv lub teb ntawm cov tswv yim creation ntawm ib tug universal cim txheej. Nyob rau hauv lub yim hli ntuj 1988, Dzho Bekker luam tawm ib tug kev kee tswv yim rau cov creation ntawm 16-ntsis multi-lingual thoob ntiaj teb coding system.

Ob peb lub hlis tom qab Unicode ua hauj lwm pab pawg neeg twb txhab rau muaj xws li Ken Whistler thiab Mike Kernegana los ntawm RLG, Glenn Rayt tshav Microsystems thiab ob peb lwm yam tshwj xeeb, enabling kawm tiav ntawm kev ua hauj lwm nyob rau hauv lub sij hawm luag tsim ntawm ib tug ntau coding qauv.

piav

Lub Unicode raws li lub tswvyim ntawm tus cim. Nyob rau hauv lub ntsiab txhais no yog hais txog ib tug paub daws teeb phenomenon uas tau tshwm sim nyob rau hauv ib tug daim ntawv ntawm kev sau ntawv thiab pom tau hais los ntawm ib tug grapheme (lawv "portraits"). Txhua tus neeg yog muab nyob rau hauv lub "Unicode" cim code teej tug mus rau ib tug tsev txheem. Eg grapheme B yog tseem nyob rau hauv lus Askiv thiab Lavxias teb sab ntawv, tab sis nws sau raws nkaus Ii Unicode 2 cim txawv. Lawv yuav raug hloov dua siab tshiab rau lowercase, t. E., Txhua yam ntawm uas qhia txog tus yuam sij database, ib tug txheej ntawm lub zog thiab lub npe.

Cov kev pab cuam ntawm Unicode

Los ntawm lwm lub contemporaries encoding "Unicode" Muaj ib tug zoo kawg li Tshuag ntawm tej yam tshwm sim rau "encryption" cim. Lub fact tias nws predecessors muaj 8 me me, uas yog kev txhawb los ntawm 28 cim, tab sis tus tshiab tsim yog twb 216 cim, uas yog ib tug loj heev kauj ruam rau pem hauv ntej. Qhov no pub encode yuav luag tag nrho cov uas twb muaj lawm thiab cov ntawv.

Nrog lub advent ntawm "Unicode" tsis xav kom siv ib tug hloov dua siab tshiab rooj: raws li ib tug kev cai coj nws cia li negated qhov yuav tsum tau rau lawv. Ib yam li ntawd, lawv tau sunk rau hauv oblivion, thiab "gibberish" - ib tug tib standard ua rau lawv tsis yooj yim sua, raws li zoo raws li txoj cai tawm qhov yuav tsum tau los tsim duplicate fonts.

txoj kev loj hlob ntawm Unicode

Ntawm cov hoob kawm, kev kawm tsis yog nyob rau hauv qhov chaw, thiab txij thaum thawj thawj nthuav qhia tau dhau rau 25 xyoo. Txawm li cas los, charset "unicode" stubbornly yuav nws txoj hauj lwm nyob rau hauv lub ntiaj teb no. Nyob rau hauv ntau txoj kev uas qhov no twb tau ua tau ua tsaug rau lub fact tias nws tau ua ib qho yooj yim los mus siv thiab tau kis, raug lees paub tias developers ntawm proprietary (them) thiab qhib qhov software.

Peb yuav tsum tsis txhob ntseeg tias niaj hnub no peb pom cov tib code "Unicode" raws li lub quarter ntawm xyoo dhau los. Thaum lub caij, nws twb hloov los ntawm version 5.h.h, thiab tus naj npawb ntawm coded cim muaj ntau zog rau 231. Nyob rau tau siv ib tug ntau dua cov npoo tias tsis kam los tseem muaj kev pab rau cov Unicode-16 (encoding, qhov twg lub siab tshaj plaws nqi ntawm lawv tsawg tus naj npawb 216). Txij thaum nws cov inception thiab mus txog rau version 2.0.0 "Lub Unicode Standard" tau nce tus naj npawb ntawm cov cim hais tias nws muaj yuav luag nyob rau hauv 2 lub sij hawm. lub sij hawm thiab txuas ntxiv txoj kev loj hlob nyob rau hauv lub xyoo tom ntej. Rau version 4.0.0 twb muaj ib tug yuav tsum tau ua kom tus txheej txheem nws tus kheej, thiab hais tias raug li cas. Raws li ib tug tshwm sim, "Unicode" tau pom hauv daim ntawv nyob rau hauv uas peb paub nws hnub no.

Yuav ua li cas lwm tus neeg yog nyob rau hauv Unicode?

Nyob rau hauv tas li ntawd mus rau lub loj heev, lossi tshiab nrog tus naj npawb ntawm cov cim, "Unicode" -Encoding ntawv nyeem ntaub ntawv yog lwm pab kev zoo losis phem. Qhov no yog qhov thiaj li hu ua normalization. Es sub los ntawm tag nrho cov ntaub ntawv ua cim los ntawm tus cwj pwm, thiab hloov cov icons ntawm lub xov xwm cov lus, siv ib qho ntawm cov uas twb muaj lawm normalization algorithms. Yuav ua li cas yog nws?

Es tsis txhob nkim cov kev pab ntawm lub computer rau ib tug mus kuaj ntawm tib tus cwj pwm, uas tej zaum yuav zoo ib yam li nyob rau hauv txawv ntawv, siv ib tug tshwj xeeb algorithm. Nws tso cai rau koj mus ua ib tug zoo xws li cov cim cais kem lookup rooj thiab thov twb mus rau lawv, tsis dua rov qab mus rau recheck tag nrho cov ntaub ntawv.

Tej algorithms yog tsim thiab siv plaub. Txhua hloov dua siab tshiab yuav siv sij hawm qhov chaw los ntawm nruj me ntsis meej hauv paus ntsiab lus, sib txawv los ntawm lwm yam, yog li yuav tau hu rau ib tug ntawm lawv yog tsis ntau npaum sai tau. Txhua tsim rau tej kev xav tau, twb kos thiab siv tau ntse.

Tawm txheem

Nyob rau hauv lub 25 xyoo ntawm nws keeb kwm encoding "Unicode" Kuv tau txais tej zaum cov feem ntau ntau nyob rau hauv lub ntiaj teb no. Nyob rau hauv cov txuj no yog tom li cov kev pab cuam thiab web-nplooj ntawv. Lub breadth ntawm daim ntawv thov tej zaum yuav qhia tau hais tias Unicode tam sim no siv los ntawm ntau tshaj 60% ntawm Internet resources.

Tam sim no, koj paub, thaum lub "Unicode" standard nyob. Yuav ua li cas nws yog, koj kuj paub thiab muaj peev xwm txaus siab rau tag nrho cov tseem ceeb ntawm cov invention, los ntawm ib pab pawg neeg ntawm cov kws txawj Unicode Inc. Ntau tshaj 25 xyoo dhau los.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hmn.birmiss.com. Theme powered by WordPress.