कम्प्युटरसूचना प्रविधि

इन्कोडिङ "युनिकोड": वर्ण कोडिङ मानक

एक सेट एक प्रयास मा हरेक इन्टरनेट प्रयोगकर्ता माथि वा यसको कार्य को अन्य कम्तिमा एक पटक लिखित स्क्रिनमा देखे ल्याटिन अक्षरहरू मा शब्द "युनिकोड।" यो के हो, तपाईं यो लेख पढेर सिक्न हुनेछ।

परिभाषा

इन्कोडिङ "युनिकोड" - मानक इन्कोडिङ अक्षर। यसलाई युनिकोड इंक गैर लाभ संगठन द्वारा प्रस्तावित भएको थियो 1991 मा। मानक कागजातमा वर्ण को विभिन्न प्रकारका सबै भन्दा ठूलो सम्भव नम्बर सँगै ल्याउन डिजाइन गरिएको छ। तत्संबंधी आधारमा स्थापित भएको थियो जो पृष्ठ, (कोरियाली गर्न रूसी देखि) विभिन्न भाषा तथा गणितीय संकेत देखि अक्षर र क्यारेक्टर समावेश गर्न सक्नुहुन्छ। यस मामला मा, वर्ण सेटमा वर्ण सबै कुनै पनि समस्या बिना प्रदर्शित छन्।

सिर्जना लागि कारण

एक पटक एक समय मा, लामो एकल सिस्टम को उपस्थिति अघि "युनिकोड" इन्कोडिङ कागजातको लेखक को प्राथमिकताहरू आधारित चयन गरिएको छ। यस कारण, अक्सर कागजात पढ्न को लागि, यो फरक टेबल प्रयोग गर्न आवश्यक थियो। कहिलेकाहीं यो धेरै पटक, जो निकै औसत प्रयोगकर्ता को जीवन complicates गर्न आवश्यक छ। पहिले नै उल्लेख रूपमा, 1991 मा यो समस्या समाधान युनिकोड इंक गर्न वर्ण इन्कोडिङ एउटा नयाँ प्रकारको प्रस्ताव एक गैर लाभ संगठन निमन्त्रणा गरिएको थियो। यो पुरानो र स्तर को एक किसिम संयोजन गर्न डिजाइन गरिएको थियो। "युनिकोड" - समयमा कल्पनासमेत नगरेको हासिल ozvolila एउटा सङ्केतन: वर्ण को एक विशाल संख्या समर्थन गर्ने उपकरण सिर्जना गर्न। परिणाम धेरै आशा बढ्यो - त्यहाँ एक साथ अंग्रेजी दुवै रूसी पाठ, ल्याटिन र गणितीय अभिव्यक्ति समावेश भएका कागजातहरू थिए।

तर आवश्यकता द्वारा preceded एकीकृत कोडिंग सिर्जना कारण स्तर त्यतिबेला पहिले नै अवस्थित को विशाल विविधता गर्न खडा गरेको समस्या को एक नम्बर समाधान गर्न। सबैभन्दा तिनीहरूलाई को साधारण:

  • Elvish लेखन, वा "gibberish";
  • वर्ण सेट को सीमितता;
  • समस्या codings परिवर्तन;
  • फन्ट दोहराव।

सानो ऐतिहासिक excursus

यार्ड 80th कल्पना गर्नुहोस्। कम्प्युटर हार्डवेयर यति साधारण छैन र फारम आज फरक छ। जबकि प्रत्येक ओएस अद्वितीय छ र हरेक उत्साही गरेको विशेष आवश्यकता परिष्कृत। जानकारी विनिमय लागि आवश्यक थप rework सबै मा परिवर्तित छ। अर्को अपरेटिङ सिस्टम द्वारा सिर्जना कागजात पढ्न प्रयास, अक्सर वर्ण को एक अनौठो सेट प्रदर्शन र खेल इन्कोडिङ साथ सुरु हुन्छ। यसलाई सधैं यो चाँडै गर्दैन, र कहिले काँही आवश्यक कागजात असमर्थ छ महिना मा पनि पछि खोल्न र। प्राय जानकारी आदान प्रदान गर्ने, आफूलाई लागि रूपान्तरण तालिका सिर्जना मान्छे। र त्यसपछि काम तिनीहरूलाई एक रोचक विवरण प्रकट मा: फिर्ता र निस्कने "आफ्नो मेरो देखि" दुई निर्देशनहरू तिनीहरूलाई सिर्जना गर्न आवश्यकता। स्रोत को सही स्तम्भमा यसको लागि banal उल्टाउने गणनाको मिसिन सक्दैन, बनाउन र बायाँ - परिणाम, तर विपरित। तपाईँ कागजात कुनै पनि विशेष वर्ण प्रयोग गर्न आवश्यकता देख्नुहुन्छ भने, तिनीहरूले पहिलो थप हुने थियो, र त्यसपछि अर्को, र उहाँले छैन एक यी वर्ण के गर्न आवश्यक छ के साझेदार व्याख्या गर्न "gibberish।" र गरेको हरेक इन्कोडिङ विकास वा OS मा डुप्लिकेट को एक विशाल संख्या सिर्जना गर्न नेतृत्व जो आफ्नै फन्ट, लागू थियो लागि भूल छैन गरौं।

थप कल्पना पृष्ठमा फन्ट, तपाईं एउटा सानो टिप्पणी संग समान टाइम्स न्यू रोमन को 10 टुक्रा देख्ने: -8 को लागि, UTF-16, एएनएसआई, UCS-2। अब तपाईँले विश्वव्यापी स्तर को विकास imperative थियो भनेर बुझ्न?

"को निर्माताहरू को संस्थापक पुर्खाहरूले"

जेरक्स देखि Dzho Bekker, ली कोलिन्स र मार्क डेविस स्याउ देखि संग एक विश्वव्यापी चरित्र सेटको व्यावहारिक सृष्टिको क्षेत्रमा अनुसन्धान सुरु गर्दा युनिकोड सिर्जना को मूल 1987 मा फेला गर्न। अगस्ट 1988 मा, Dzho Bekker 16-बिट बहु-बहुभाषी अन्तर्राष्ट्रिय कोडिङप्रणाली सिर्जना लागि मस्यौदा प्रस्ताव प्रकाशित।

केही महिनापछि युनिकोड काम समूह एक साधारण कोडिङ मानक को प्रारम्भिक गठन कार्य को पूरा सक्षम, केन विस्टलर र माइक Kernegana RLG देखि, रवि माइक्रोसिस्टम्स र धेरै अन्य विशेषज्ञहरु को ग्लेन Rayt समावेश गर्न विस्तार भएको थियो।

सामान्य विवरण

को युनिकोड प्रतीकको अवधारणा आधारित। यो परिभाषा एक ग्राफेम (आफ्नो "पोट्रेट") मार्फत लेखन को एक विशेष फारम अवस्थित र बुझे एक अमूर्त घटना बुझाउँछ अन्तर्गत। प्रत्येक चरित्र "युनिकोड" अद्वितीय एक विशेष एकाइ मानक स्वामित्वको कोड दिइएको छ। जस्तै ग्राफेम बी अंग्रेजी र रूसी अक्षर मा पनि छ, तर यसलाई युनिकोड 2 फरक वर्ण पारस्परिक रहेको छ। तिनीहरूले रूपान्तरणको विषय हो सानोवर्ण, टी। प्रत्येक जो प्रमुख डेटाबेस वर्णन ई, गुण को एक सेट र पूरा नाम।

युनिकोड को लाभ

"युनिकोड" सङ्केतन अन्य समकालीनहरूले देखि त्यहाँ "गुप्तिकरण" वर्ण लागि संकेत को एक जबरदस्त स्टक छ। आफ्नो predecessors 8 बिट थियो भन्ने तथ्यलाई, कि 28 वर्ण द्वारा समर्थित छ, तर नयाँ डिजाइन पहिले नै अगाडि एक विशाल चरण थियो, 216 वर्ण थियो। यो अनुमति ईन्कोड लगभग सबै अवस्थित र साधारण अक्षरहरू।

"युनिकोड" को आगमन संग अब रूपान्तरण तालिका प्रयोग गर्न आवश्यक: यो सिर्फ तिनीहरूलाई लागि आवश्यकता negated एक मानक रूप। त्यसै गरी, तिनीहरूले OBLIVION मा sunk छ, र "gibberish" - एक मानक नक्कलीफन्टफेलापर्यो सिर्जना गर्न आवश्यकता तिनीहरूलाई असम्भव, साथै नियम बनाए।

युनिकोड विकास

निस्सन्देह, प्रगति छैन स्थानमा छ, र पछि पहिलो प्रस्तुति 25 वर्ष को लागि पारित गरेको छ। तथापि, वर्णहरु "युनिकोड" हठी दुनिया मा आफ्नो स्थिति रहन्छ। थुप्रै तरिकामा यो छ कि यो लागू गर्न सजिलो भएको छ र फैलाउन छ भन्ने तथ्यलाई गर्न सम्भव धन्यवाद गरिएको छ, स्वामित्व (सशुल्क) र खुला स्रोत सफ्टवेयर को डेवलपर्स पहिचान भइरहेको।

हामी एउटै कोड सताब्दी पहिले को चौथाई रूपमा "युनिकोड" हेर्न आज विश्वास गर्नु हुँदैन। मा क्षण, यो थियो प्रतिस्थापित गरेर संस्करण 5.h.h र संख्या को कोडित प्रतीक छ वृद्धि गर्न 231. मा संभावना को प्रयोग गरेर ठूलो मार्जिन चिह्न इन्कार गर्न अझै पनि कायम समर्थन लागि युनिकोड-16 (इन्कोडिङ, जहाँ अधिकतम रकम आफ्नो सीमित नम्बर 216)। यसको शुरूआत देखि र माथि संस्करण 2.0.0 मा "द युनिकोड मानक" यो लगभग 2 पटक समावेश कि वर्ण संख्या बढेको छ। अवसर र आगामी वर्ष मा निरन्तर वृद्धि। संस्करण 4.0.0 लागि पहिले नै मानक नै वृद्धि गर्न आवश्यक छ, र त्यो गरेको थियो। फलस्वरूप, "युनिकोड" हामी आज यो थाहा जसमा फारम फेला छ।

युनिकोड मा अरू के छ?

विशाल साथै निरन्तर वर्ण संख्या अद्यावधिक, "युनिकोड" -Encoding पाठ जानकारी अर्को उपयोगी विशेषता छ। यो तथाकथित normalization छ। बरु वर्ण द्वारा सम्पूर्ण कागजात वर्ण स्क्रोल भन्दा, र पत्राचार तालिकाको प्रतिमा विकल्प, अवस्थित normalization एल्गोरिदम एउटा प्रयोग। यो के हो?

बरु, एउटै चरित्र, फरक अक्षरहरू त्यस्तै हुन सक्छ जो नियमित जाँच मा कम्प्युटर को स्रोतहरू बर्बाद विशेष अल्गोरिदम प्रयोग। यो तपाईं पनि यस्तै प्रतीक अलग स्तम्भ लुकअप तालिका बनाउन र पहिले नै सबै डाटा दोह्राएर गर्न फेरि माथि र अधिक, तिनीहरूलाई लागू गर्न अनुमति दिन्छ।

यस्तो एल्गोरिदम विकास र चार कार्यान्वयन गर्दै हुनुहुन्छ। प्रत्येक रूपान्तरण तिनीहरूलाई कुनै पनि एक भन्दा कुशल सम्भव छैन त्यसैले कल गर्न, कडाई निश्चित सिद्धान्त, अन्य फरक द्वारा ठाउँ लिन्छ। विशेष आवश्यकता लागि डिजाइन प्रत्येक, सम्मिलित र सफलतापूर्वक प्रयोग भएको थियो।

Dissemination मानक

यसको इतिहास इन्कोडिङ "युनिकोड" को 25 वर्ष मा म शायद सबैभन्दा संसारमा व्यापक प्राप्त गरेका छौं। यो मानक अन्तर्गत कार्यक्रम र वेब-पृष्ठ रूपमा समायोजित हुन्छन्। आवेदन चौडाई युनिकोड अब इन्टरनेट स्रोतहरूको 60% भन्दा प्रयोग संकेत हुन सक्छ।

को "युनिकोड" मानक देखा गर्दा अब, तपाईं, थाहा छ। यो के हो, तपाईं पनि थाहा र विशेषज्ञहरु युनिकोड इंक एक समूह गरेका आविष्कार को पूर्ण महत्व, बुझ्न सक्षम हुन 25 भन्दा बढी वर्ष पहिले।

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ne.birmiss.com. Theme powered by WordPress.