অসমীয়া   বাংলা   बोड़ो   डोगरी   ગુજરાતી   ಕನ್ನಡ   كأشُر   कोंकणी   संथाली   মনিপুরি   नेपाली   ଓରିୟା   ਪੰਜਾਬੀ   संस्कृत   தமிழ்  తెలుగు   ردو

ಯುನಿಕೋಡ್ ಎಂಬ ವಿಶ್ವಸಂಕೇತ

ಯುನಿಕೋಡ್ ಎಂಬ ವಿಶ್ವಸಂಕೇತ

ಅಂಗಡಿಗೆ ಹೋಗಿ ಒಂದು ಬಲ್ಬ್ ಬೇಕೆಂದು ಕೇಳಿ ನೋಡಿ. ಅಂಗಡಿಯಾತ ನಿಮ್ಮ ಮನೆಯಲ್ಲಿ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಇದೆ ಎಂದು ಕೇಳುವುದಿಲ್ಲ. ಯಾಕೆಂದರೆ ಯಾವ ಕಂಪೆನಿಯ ಹೋಲ್ಡರ್ ಆದರೇನು, ಎಲ್ಲ ಬಲ್ಬ್‌ಗಳು ಎಲ್ಲ ಹೋಲ್ಡರ್‍ಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ. ಈಗ ಕನ್ನಡ ಮತ್ತು ಗಣಕ ಕ್ಷೇತ್ರಕ್ಕೆ ಬನ್ನಿ. ನಿಮ್ಮ ಮನೆಯ ಗಣಕದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಫ್ಲಾಪಿಯಲ್ಲಿ ತುಂಬಿಸಿ ಅದರ ಲೇಸರ್ ಮುದ್ರಣಕ್ಕೆ ಯಾವುದಾದರು ಡಿ.ಟಿ.ಪಿ. ಕೇಂದ್ರಕ್ಕೆ ತೆಗೆದುಕೊಂದು ಹೋಗಿ. ಆತ ನಿಮ್ಮನ್ನು ಖಂಡಿತವಾಗಿ ಕೇಳುವ ಪ್ರಶ್ನೆಯೆಂದರೆ "ನೀವು ಯಾವ ತಂತ್ರಾಂಶ ತಯಾರಿಸಿ ಕಡತವನ್ನು ತಯಾರು ಮಾಡಿದ್ದೀರಾ?". ನೀವು ಬಳಸಿದ ತಂತ್ರಾಂಶ ಆತನ ಗಣಕದಲ್ಲಿ ಇಲ್ಲದಿರುವ ಸಂಭವವೇ ಹೆಚ್ಚು. ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶವನ್ನು ಬಳಸಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಕನ್ನಡದ ಯಾವುದೇ ತಂತ್ರಾಂಶದಲ್ಲಿ ಓದಲು ಸಾಧ್ಯವಿರಬೇಕಲ್ಲವೇ, ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿದ್ದಂತೆ, ಎಂದು ನಿಮಗೆ ಅನ್ನಿಸಿರಬೇಕಲ್ಲವೇ? ಆದರೆ ನಿಜ ಪರಿಸ್ಥಿತಿ ಹಾಗೇನೂ ಇಲ್ಲ.

ಕನ್ನಡದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿ ಜಪಾನಿಗೆ ಕಳುಹಿಸಿದರೆ ಅವರಿಗೆ ಇದು ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿದೆ ಎಂದು ತಿಳಿಯುವುದು ಹೇಗೆ? ವಿಶ್ವಕ್ಕೆಲ್ಲ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇದ್ದರೆ ಒಳ್ಳೆಯದಲ್ಲವೇ? ಇದುವೇ ಯುನಿಕೋಡ್.

ನಾವು ಇಂಗ್ಲೀಷಿನಲ್ಲಿ ಮಾತನಾಡುವಾಗ ಕನ್ನಡದಲ್ಲಿ ಆಲೋಚಿಸಿ ಇಂಗ್ಲಿಗೆ ಅನುವಾದಿಸಿ ಮಾತನಾಡುತ್ತೇವಲ್ಲವೇ? ಗಣಕಗಳು ಕನ್ನಡದಲ್ಲಿ ವ್ಯವಹರಿಸುವುದು ಸುಮಾರಾಗಿ ಹಾಗೆಯೇ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಒಂದು ಸಂಕೇತ, ತೋರಿಸಲು ಇನ್ನೊಂದು ಸಂಕೇತ. ಮಾಹಿತಿಯ ಸಂಗ್ರಹಣೆಗೆ ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಬಳಸುತ್ತಿರುವುದು ಇಸ್ಕಿಯನ್ನು (ISCII = Indian Script Code for Information Interchange). ಇಸ್ಕಿಯು ಆಸ್ಕಿಯನ್ನು (ASCII = American Standards Code for Information Interchange) ಆಧರಿಸಿದೆ. ಇವುಗಳನ್ನು ಸ್ವಲ್ಪ ವಿಮರ್ಶಿಸೋಣ.

ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿ
ಆಸ್ಕಿ 8 ಬಿಟ್‌ಗಳನ್ನು ಹೊಂದಿದೆ. ಗಣಕದಲ್ಲಿ ಮಾಹಿತಿಯ ಒಂದು ತುಣಕೇ ಬಿಟ್ (bit = binary digit). ವಿದ್ಯುತ್ತಿಗೆ ಎರಡೇ ಸಾಧ್ಯತೆಗಳಿರುವುದು -ಇದೆ ಅಥವಾ ಇಲ್ಲ. ವಿದ್ಯುತ್ ಇದೆ ಎಂದರೆ "ಒಂದು", ಇಲ್ಲ ಎಂದರೆ "ಸೊನ್ನೆ" ಎಂದು ತೆಗೆದುಕೊಂಡರೆ ಒಂದು ಬಿಟ್‌ನಲ್ಲಿ 0 ಅಥವಾ 1 ಅನ್ನು ಸೂಚಿಸಬಹದು. ಒಂದು ಅಕ್ಷರವನ್ನು ಶೇಖರಿಸಲು ಎರಡು ಬಿಟ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಂಡರೆ ಒಟ್ಟು ನಾಲ್ಕು ಸಾಧ್ಯತೆಗಳಿವೆ -00, 01, 10 ಮತ್ತು 11 (ದ್ವಿಮಾನ). ಇವು ದಶಮಾನ ಪದ್ಧತಿಯಲ್ಲಿ 0, 1, 2, 3 ಆಗುತ್ತವೆ. ಆಸ್ಕಿ ಮತ್ತು ಇಸ್ಕಿಗಳು 8 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುತ್ತವೆ. 8 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವ ಯಾವುದೇ ಸಂಕೇತೀಕರಣ ವಿಧಾನವು 256 (28 = 256) ಅಕ್ಷರಗಳನ್ನು ಮಾತ್ರವೇ ಹೊಂದಿರಬಲ್ಲುದು. ಕನ್ನಡ ಭಾಷೆಯಲ್ಲಿ 49 ಅಕ್ಷರಗಳಿವೆ. ಜೊತೆಗೆ ಸ್ವರ ಚಿಹ್ನೆಗಳಿವೆ. ಇಂಗ್ಲೀಷ್ ಭಾಷೆಯಲ್ಲಿ 26 (ಮತ್ತು 26) ಅಕ್ಷರಗಳಿವೆ. ಬರೆವಣಿಗೆಯ ಚಿಹ್ನೆ, ಅಂಕೆ, ಇತ್ಯಾದಿಗಳೆಲ್ಲ ಒಟ್ಟು ಸೇರಿದರೂ 256ಕ್ಕಿಂತ ಕಡಿಮೆಯೇ. ಹಾಗಿದ್ದಲ್ಲಿ 256 ಸಂಕೇತಗಳು ಸಾಕಲ್ಲವೇ? ಇಸ್ಕಿಯಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸುವಾಗ ಇಂಗ್ಲೀಷ್ ಮತ್ತು ಒಂದು ಭಾರತೀಯ ಭಾಷೆಯನ್ನು ಬಳಸಬಹುದು. ಅಂದರೆ ಕನ್ನಡ, ಹಿಂದಿ, ತಮಿಳು, ತೆಲುಗು, ಹೀಗೆ ಹಲವು ಭಾಷೆಗಳನ್ನು ಒಂದೇ ಕಡತದಲ್ಲಿ ಸಂಗ್ರಹಿಸುವುದು ಅಸಾಧ್ಯ.

ಇಸ್ಕಿಯಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೆ ಒಂದೇ ಸಂಕೇತ ನೀಡಲಾಗಿದೆ. ಅಂದರೆ ಕನ್ನಡದ "ಕ" ಮತ್ತು ಹಿಂದಿಯ "क" ಎರಡಕ್ಕೂ ಒಂದೇ ಸಂಕೇತ ಇದೆ. ಇದರಿಂದ ಕೆಲವೊಮ್ಮೆ ಲಾಭವೂ ಇದೆ. ಒಂದು ಟೆಲಿಫೋನ್ ಡೈರೆಕ್ಟರಿಯನ್ನು ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿ ಭಾಷೆಯಲ್ಲಿ ತಯಾರಿಸಬೇಕಾದರೆ, ಕನ್ನಡದಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿ, ಇಸ್ಕಿಯಲ್ಲಿ ಶೇಖರಿಸಿ, ಅದನ್ನು ಹಿಂದಿಯ ಫಾಂಟ್‌ನ ಸಂಕೇತಗಳಿಗೆ ಪರಿವರ್ತಿಸಿದರೆ ಸಾಕು. ಆದರೆ ಸಮಸ್ಯೆ ಇರುವುದು ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯಲ್ಲಿ. ಕನ್ನಡ, ತೆಲುಗು, ಮರಾಠಿ, ಹಿಂದಿ, ಹೀಗೆ ಎಲ್ಲ ಭಾಷೆಗಳಿಗೂ ಒಂದೆ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರ ಕಲ್ಪಿಸಲಾಗಿದೆ. ಕನ್ನಡ ಮತ್ತು ಹಿಂದಿಯ ಸೂತ್ರ ಒಂದೇ ಆಗಿರಬೇಕಾಗಿಲ್ಲ. ಉದಾಹರಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆ -"ಯ, ರ, ಲ, ಳ, ವ, ಶ, ಷ, ಸ, ಹ". ಕನ್ನಡದಲ್ಲಿ ಇದು "ಯ, ರ, ಲ, ವ, ಶ, ಷ, ಸ, ಹ, ಳ" ಆಗಬೇಕು.

ಯುನಿಕೋಡ್
ಪ್ರಪಂಚದ ಮಟ್ಟಿಗೆ ಹೇಳುವುದಾದರೆ ಭಾರತೀಯ ಭಾಷೆಗಳ ಜೊತೆ, ಚೀನಾ, ಜಪಾನ್, ಅರೇಬಿ, ಯುರೋಪಿನ ಭಾಷೆಗಳು, ಹೀಗೆ ನೂರಾರು ಭಾಷೆಗಳಿಗೆ ಸ್ಥಾನ ಕಲ್ಪಿಸಿ ಕೊಡಬೇಕಾಗುತ್ತದೆ. ಇದಕ್ಕೆಲ್ಲ ಮದ್ದೆಂದರೆ 8 ಬಿಟ್‌ಗಳ ಸಂಕೇತೀಕರಣದ ಬದಲಿಗೆ 16 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದು. 16 ಬಿಟ್‌ಗಳನ್ನು ಬಳಸುವುದರಿಂದ ಸುಮಾರು 65,೦೦೦ ಮೂಲಾಕ್ಷರಗಳಿಗೆ ಜಾಗ ಮಾಡಿಕೊಟ್ಟಂತಾಗುತ್ತದೆ. ಇದು ಪ್ರಪಂಚದ ಬಹುತೇಕ ಭಾಷೆಗಳಿಗೆ ಸಾಕು. ಇದುವೇ ಯುನಿಕೋಡ್ (Unicode). ಯುನಿಕೋಡ್ ಎಂಬುದು uniform, universal, unique ಮತ್ತು code (ಸಂಕೇತ) ಎಂಬ ಪದಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಪ್ರಪಂಚಕ್ಕೆಲ್ಲಾ ಒಂದೇ ಸಂಕೇತ ವಿಧಾನ ಇರತಕ್ಕದ್ದು. ಪ್ರಪಂಚದ ಪ್ರತಿ ಭಾಷೆಯ ಪ್ರತಿಯೊಂದು ಅಕ್ಷರಕ್ಕೂ ತನ್ನದೇ ಆದ ಪ್ರತ್ಯೇಕ ಸಂಕೇತ ಇರಬೇಕು. ಈ ಎಲ್ಲ ಬೇಕುಗಳಿಗೆ ಉತ್ತರವೇ ಯುನಿಕೋಡ್. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಶ್ರೇಣಿ ಇದೆ. ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೂ ಅನ್ವಯಿಸುತ್ತದೆ. ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಮಾಡಿದರೆ ಒಂದೇ ಕಡತದಲ್ಲಿ ಪ್ರಪಂಚದ ಎಲ್ಲ ಭಾಷೆಗಳಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಶೇಖರಣೆ ಮಾಡಲು ಸಾಧ್ಯ. ಗ್ರಂಥಾಲಯವೊಂದರಲ್ಲಿ ಭಾರತದ ಎಲ್ಲ ಭಾಷೆಯ ಪುಸ್ತಕಗಳಿದ್ದಲ್ಲಿ ಅವುಗಳ ವಿವರಗಳ ದತ್ತಸಂಚಯ (database) ತಯಾರಿಸಬೇಕಾದರೆ ಯುನಿಕೋಡ್ ವಿಧಾನದಿಂದ ಮಾತ್ರ ಸಾಧ್ಯ.

ಯುನಿಕೋಡ್ ಆಧಾರಿತ ತಂತ್ರಾಂಶಗಳಲ್ಲಿ ಬೆರಳಚ್ಚು ಮಾಡಿದ ಮಾಹಿತಿಯನ್ನು ನೇರವಾಗಿ ಮಾಹಿತಿ ಶೇಖರಣೆಯ ಸಂಕೇತವಾದ ಯುನಿಕೋಡ್‌ನಲ್ಲೇ ಸಂಗ್ರಹಿಸಿಡಲಾಗುತ್ತದೆ. ಅಂದರೆ ನುಡಿ, ಬರಹ, ಆಕೃತಿ, ಶ್ರೀಲಿಪಿ, ಸಿಡಾಕ್, ಇತ್ಯಾದಿ ತಂತ್ರಾಂಶಗಳಂತೆ ಅಕ್ಷರಶೈಲಿ (ಫಾಂಟ್) ಗಳ ಸಂಕೇತಗಳಲ್ಲಿ ಮಾಹಿತಿ ಸಂಗ್ರಹಣೆ ಅಲ್ಲ. ನಿಮ್ಮಲ್ಲಿ ಯುನಿಕೋಡ್ ಆಧಾರಿತ ಕನ್ನಡದ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಇರತಕ್ಕದ್ದು. ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ತಯಾರಿಸಿದ ಕಡತವನ್ನು ಬೇರೊಬ್ಬರಿಗೆ ಕಳುಹಿಸುವಾಗ ಕಡತದ ಜೊತೆ ನಿಮ್ಮ ಅಕ್ಷರಶೈಲಿಯನ್ನೂ ಕಳುಹಿಸುವ ಅಗತ್ಯವಿಲ್ಲ. ನಿಮ್ಮಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಮತ್ತು ನಿಮ್ಮ ಸ್ನೇಹಿತರಲ್ಲಿರುವ ಓಪನ್‌ಟೈಪ್ ಫಾಂಟ್ ಬೇರೆ ಬೇರೆ ಇರಬಹುದು. ಮಾಹಿತಿಯನ್ನು ಅಕ್ಷರಶೈಲಿಯ ಸಂಕೇತಗಳ ಬದಲಿಗೆ ಮೂಲ ಮಾಹಿತಿಯಾಗಿಯೇ ಕಳುಹಿಸುವುದರಿಂದ ಮಾಹಿತಿ ಸಂವಹನೆಯಲ್ಲಿ ಯಾವ ತೊಡಕೂ ಇಲ್ಲ.

ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಸಂಕೇತಗಳಿರುವುದು ಮಾತ್ರವಲ್ಲ, ಪ್ರತಿ ಭಾಷೆಗೂ ತನ್ನದೇ ಆದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸೂತ್ರವೂ ಯುನಿಕೋಡ್‌ನಲ್ಲಿದೆ. ಇಸ್ಕಿಯಲ್ಲಿರುವ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಯ ಸಮಸ್ಯೆಗೆ ಯುನಿಕೋಡ್‌ನಲ್ಲಿ ಪರಿಹಾರಹವಿದೆ. ಯುನಿಕೋಡ್‌ನ ಹಳೆಯ ಆವೃತ್ತಿಯಲ್ಲಿ ಕನ್ನಡದ ಅಕಾರಾದಿ ವಿಂಗಡಣೆಗೆ ಇಸ್ಕಿಯಲ್ಲಿನ ಸೂತ್ರವನ್ನೇ ಬಳಸಲಾಗಿತ್ತು. ಆದರೆ ಯುನಿಕೋಡ್‌ನ 4.0 ಆವೃತ್ತಿಯಲ್ಲಿ ಈ ಸಮಸ್ಯೆಯನ್ನು ಪರಿಹರಿಸಲಾಗಿದೆ.

ಪ್ರಪಂಚದ ಖ್ಯಾತ ಗಣಕ ಕಂಪೆನಿಗಳು, ತಂತ್ರಾಂಶ ತಯಾರಕರು, ದೇಶಗಳು ಸೇರಿ ಆಗಿರುವ ಒಂದು ಸಂಸ್ಥೆ ಯುನಿಕೋಡ್ ಕನ್‌ಸೋರ್ಟಿಯಂ. ಭಾರತ ದೇಶವೂ ಇದರ ಸದಸ್ಯತ್ವ ಹೊಂದಿದೆ. ಯುನಿಕೋಡ್ ಒಂದು ಕಂಪೆನಿಯ ಸ್ವತ್ತಲ್ಲ. ಈಗ ಎಲ್ಲ ತಂತ್ರಾಂಶಗಳು ಯುನಿಕೋಡ್‌ನ್ನೇ ಬಳಸುತ್ತಿರುತ್ತವೆ.

ಮೈಕ್ರೋಸಾಫ್ಟ್‌ನವರ ವಿಂಡೋಸ್ ಎಕ್ಸ್‌ಪಿ, ಸರ್ವರ್ 2003 ಮತ್ತು ವಿಸ್ಟ ಕಾರ್ಯಾಚರಣ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ (operating system) ಕನ್ನಡದ ಯುನಿಕೋಡ್ ಸವಲತ್ತನ್ನು ನೀಡಲಾಗಿದೆ. ವಿಂಡೋಸ್ ಎಂಇ, 98, 95, ಇತ್ಯಾದಿಗಳಲ್ಲಿ ಯುನಿಕೋಡ್‌ನ ಸೌಲಭ್ಯ (ಸರಿಯಾಗಿ) ಇಲ್ಲವೆಂದೇ ಹೇಳಬಹುದು. ಕನ್ನಡ ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ನೇರವಾಗಿ ಯುನಿಕೋಡ್‌ನ್ನೇ ಬಳಸಲಾಗಿದೆ. ಅಂದರೆ ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಯುನಿಕೋಡ್ ವಿಧಾನದಲ್ಲಿ ಕಡತವೊಂದನ್ನು ತಯಾರಿಸಿದರೆ ಅದನ್ನು ಲಿನಕ್ಸ್‌ನಲ್ಲಿ ಯಾವ ತೊಂದರೆಯೂ ಇಲ್ಲದೆ ಓದಬಹುದು.

ಮೂಲ : ಭಾಷಾಇಂಡಿಯ

ಕೊನೆಯ ಮಾರ್ಪಾಟು : 6/22/2020



© C–DAC.All content appearing on the vikaspedia portal is through collaborative effort of vikaspedia and its partners.We encourage you to use and share the content in a respectful and fair manner. Please leave all source links intact and adhere to applicable copyright and intellectual property guidelines and laws.
English to Hindi Transliterate