shadow

یونی کد یا یونیکد چیست و چه کاربردی دارد؟

یونی کد یا یونیکد – Unicode

جواد میرحسینیمنبع: گرته (اولین نشریه تحلیلی،   پژوهشی طراحی گرافیک ایران)
نویسنده: جواد میرحسینی

یونیکد – یونی کد (Unicode)، استانداردی صنعتی است که اجازه می‌دهد نمادهای تمامی رسم‌الخط‌های دنیا با رایانه نمایش داده شوند.
اغلب نوآوری‌های جدید با پیچیدگی‌ها و جزئیات زیادی همراه است و در ظاهر برای استفاده ساده نیستند.
این عوامل سبب می‌شوند که کاربران روی خوشی به آنها نشان ندهند، هرچند در بعضی از موارد به‌ناچار آن را فرا‌گرفته و استفاده می‌کنند؛ یونی‌کد نیز از این قاعده مستثنی نیست.

قبل از درک مفهوم یونی کد ، بد نیست درباره سیستم‌های کدگذاری بیشتر بدانیم. همان‌طور که می‌دانید هر داده‌ای که در کامپیوتر وجود دارد، حتی تصاویر یا فیلم‌ها، به‌صورت یک سری از ارقام در مبنای ۲ ذخیره می‌شوند. این داده‌ها در اصل از رقم‌های صفر و یک تشکیل شده و به صورت خاصی ذخیره شده‌اند. ما می‌توانیم اطلاعاتی مانند یک تصویر را طبق الگوریتم‌هایی ذخیره کرده و آن را مشاهده یا ویرایش کنیم. تمامی حروف و اعدادی که نمایش داده می‌شوند نیز به همین شکل هستند.

اختصاص دادن یک عدد خاص با در نظر گرفتن قالب خاص برای کاراکترها را «کدگذاری» می گوییم که این کدگذاری‌ها به‌صورت استانداردهای جهانی در می‌آیند و مانند استاندارد و یا یونی کد در سیستم‌های کامپیوتری از آن‌ها استفاده می‌شود.

یونی کد به هر نویسه، یک عدد مشخص اختصاص می‌دهد؛ مستقل از محیط، مستقل از برنامه، و مستقل از زبان. استاندارد یونی‌کد را پیشتازان صنعت کامپیوتر از قبیل شرکت‌هایی چون آی‌.بی‌.ام، اَپل، اچ‌.پی، اورکل، جاست سیستم، سان، سای بیس، مایکروسافت یونی‌سیس و بسیاری از شرکت‌های دیگر پذیرفته‌اند.
امروزه یونی‌کد در بسیاری از سیستم عامل‌ها، مرورگرها و بسیاری از محصولات دیگر پشتیبانی می شود. پیدایش استاندارد یونی‌کد و در دسترس بودن ابزارهایی که از آن پشتیبانی می‌کنند، از چشمگیرترین روندهای جدید در صحنه جهانی فناوری‌های نرم افزاری بوده است.

پیشنهاد می شود:  کلید موفقیت در نورپردازی پرتره چیست؟

گنجاندن یونی‌کد در سایت‌ها و برنامه‌های کاربردی، در مقایسه با کدهای قدیمی، می‌تواند باعث کاهش قابل‌ملاحظه هزینه‌ها شود.
یونی‌کد این امکان را فراهم می‌کند که یک محصول نرم‌افزاری یکسان یا یک سایت مشخص، بتواند بدون نیاز به طراحی مجدد، در محیط‌ها، زبان‌ها و کشورهای متعددی کار کند.
یونی‌کد به داده‌ها نیز امکان می‌دهد که بدون تحریف از سیستم‌های مختلف داده شوند؛ بدین‌ترتیب یونی‌کد امکان کدگذاری همه نویسه‌های مورد استفاده در نوشتن زبان‌های دنیا را فراهم می‌کند.

یونی‌کد شیوه‌ای نیز برای کدگذاری ۸‌بیتی متون مشخص کرده است که نویسه ها را پس از اعمال یک تابع خاص به کدشان، به‌صورت دنباله‌هایی که از یک تا چهار بایت دارند نگه می‌دارد. این شیوه که با UTF-8 شناخته می‌شود، به این خاطر است که نویسه‌های اسکی را عینا حفظ می کند و در نتیجه، هم برنامه‌های قدیمی راحت‌‌تر با آن کنار می‌آیند و هم طول پرونده‌های لاتین را زیاد نمی‌کند، بسیار محبوب است. در واقع بسیاری از سیستم‌هایی که ادعای پشتیبانی یونی‌کد را دارند، تنها UTF-8 را پشتیبانی می‌کنند و پرونده‌های یونی‌‌کد، اعم از کاربردهای اینترنتی یا موارد استفاده محلی، عمدتا در قالب UTF-8 ذخیره شده‌اند.
در استاندارد یونی‌کد، نویسه‌‌های فارسی در بلوک مربوط به خط عربی قرار دارند. این بلوک برای در بر گرفتن نویسه‌های زبان‌هایی که از خط عربی استفاده می‌‌کنند، مثل فارسی، اردو، پشتو، سندی، و کردی گسترش یافته است. این بلوک نشانه‌های قرآنی از قبیل نشانه‌های سجده و پایان آیه، و علائم وقف را نیز در بردارد.
در یونیکد با وجود یکی‌سازی کدهای حروف مشترک، برای حروف فارسی‌ای که بار معنایی یا نمایشی متفاوت با حروف عربی دارند، نویسه‌های جداگانه در نظر گرفته شده است. یعنی کلیه حروف خاص فارسی(پ،چ،ژ،گ) و نیز «ک» و «ی» فارسی که با حرف مشابه در عربی تفاوت نمایشی دارند، مکان جداگانه‌ای اختصاص داده‌اند. کلیه اعراب‌های متداول حضور دارند و میان شکل فارسی / اردو و عربی ارقام نیز به‌علت شکل و رفتار متفاوت، تفاوت‌هایی منظور گشته است.

پیشنهاد می شود:  معرفی کتاب مقدمه ای بر تاریخ گرافیک در ایران

از مهمترین مزایایی که یونی‌کد برای زبان فارسی دارد (مثل بسیاری زبان‌های دیگر) می‌توان موارد زیر را نام برد:
در نسخه استاندارد هر نرم‌‌افزاری که از این استاندارد پشتیبانی کند، می‌توان فارسی نوشت یا متون فارسی را خواند. بدین‌ترتیب دیگر نیازی به تأمین نسخه‌های خاص فارسی یا عربی نیست.
برای خواندن متون فارسی که توسط شرکت خاصی نوشته شده اند، نیازی به داشتن فونت خاص آن شرکت نداریم و هر متن فارسی که با استاندارد یونی کد کدگذاری شده باشد، با هر فونتی یونی‌کدی قابل‌مشاهده است.
امکان استفاده همزمان از زبان‌های فارسی و انگلیسی را تأمین می‌کند.
بدون استفاده از فونت‌های خاص امکان استفاده از علایم خاص را فراهم می‌کند.

به‌‌طور کلی، یونیکد به شرح زیر است:
نویسه‌های شانزده بیتی
ترتیب مفهومی (در مقابل دیداری)
کارایی
یکی‌سازی (اختصاص یک کد به نویسه‌های مشترک در چند زبان مختلف)
نویسه، نه شکل (یک «ع»، و نه چهارتا: «ﻋ»، «ﻌ»، «ﻊ»، «ع»)
ترکیب پویا
بار معنایی (حرف بودن، مقدار عددی)
دنباله‌های معادل (امکان ذخیره‌سازی یک متن به دو شکل مختلف ولی معادل)
متن ساده (و نه مفاهیمی مثل تغییر قلم، جدول بندی، و صفحه‌آرایی)
قابلیت تبدیل (هر متن موجود در قالب یک مجموعه نویسه سنتی باید بدون از بین رفتن معنا قابل‌ تبدیل به یونی‌کد باشد).

یونی کد

پیشنهاد می شود:  اندازه قطع بیاضی - اندازه کتاب بیاضی چقدر است؟

No Comments

Post a Comment

من رباط نیستم *