ഡോ. മഹേഷ് മംഗലാട്ട്
മാതൃഭൂമി ആഴ്ചപ്പതിപ്പില് പ്രസിദ്ധീകരിച്ച ലേഖനം
ബ്ലോഗ് വായനക്കാര്ക്കായി ഇവിടെ പുന:പ്രസിദ്ധീകരിക്കുന്നു.
മലയാളം ബ്ലോഗ്, മലയാളം വിക്കിപീഡിയ എന്നെല്ലാം ഇക്കഴിഞ്ഞ കുറേ നാളായി പത്രമാദ്ധ്യമങ്ങളില് ആവര്ത്തിച്ച് പരാമര്ശിക്കപ്പെട്ടുകാണുന്നു. കമ്പ്യൂട്ടറില് മലയാളം ഉപയോഗിക്കാമെന്നും ഇന്റര്നെറ്റില് മലയാളഭാഷയില് വിവരങ്ങള് വിനിമയം ചെയ്യാമെന്നും കേരളീയസമൂഹം മനസ്സിലാക്കുന്നതിന് ഇത് വഴിയൊരുക്കിയിട്ടുണ്ട്. എന്നിരുന്നാലും, കമ്പ്യൂട്ടറില് മലയാളഭാഷ ഉപയോഗിക്കുന്നത് കേരളത്തില് ജീവിക്കുന്ന മലയാളികളേക്കാള് വിദേശവാസികളാണ്. ബ്ലോഗ് എഴുതുന്നതിനു പുറമെ മലയാളത്തില് മെയിലയക്കാനും ചാറ്റ് ചെയ്യാനും ഇപ്പോള് സാദ്ധ്യമാണ്. ഇത്തരം സാദ്ധ്യതകള് ഉപയോഗപ്പെടുത്താത്തതിനാല് കേരളത്തിലെ കമ്പ്യൂട്ടറുകള് ഏറെയും അലങ്കാരവസ്തുക്കളായി ഉപയോഗിക്കപ്പെടുകയാണ്. വീടുകളില് മാത്രമല്ല ടെലിവിഷന് വാര്ത്തകളില് ഉദ്യോഗസ്ഥമേധാവികളുടെയും മന്ത്രിമാരുടേയും ചേംബറുകളിലും ഈ അലങ്കാരവസ്തുവിനെ കാണാവുന്നതാണ്.
ആദ്യത്തെ മലയാളം ബ്ലോഗ് 2003 ഏപ്രില് മാസത്തിലാണ് പ്രസിദ്ധീകരിക്കപ്പെട്ടത്। അതിനു ശേഷം ഈ മാദ്ധ്യമത്തിന്റെ സാദ്ധ്യതകള് തിരിച്ചറിഞ്ഞ നിരവധി പേര് ബ്ലോഗുകള് ഉണ്ടാക്കി. തുടക്കത്തില് പതുക്കെയായിരുന്നുവെങ്കിലും ഇപ്പോള് ഓരോ ആഴ്ചയിലും ഇരുന്നൂറോളം പുതിയ ബ്ലോഗുകള് ഉണ്ടാകുന്നുണ്ട്. അവയില് ഏറെയും നിരന്തരമായി പുതിയ പോസ്റ്റുകള് പ്രസിദ്ധീകരിച്ച് സജീവമായി നില്ക്കുന്നവയുമാണ്. ബ്ലോഗു പോലെ സജീവമാണ് മലയാളം വിക്കിപീഡിയയും. താല്പര്യമുള്ള ആര്ക്കും ലേഖനങ്ങള് എഴുതാവുന്നതും തിരുത്തലുകളിലൂടെ ലേഖനങ്ങള് മെച്ചപ്പെടുത്താവുന്നതുമായ സ്വതന്ത്രവിജ്ഞാനകോശമാണ് വിക്കിപീഡിയ. ഇക്കഴിഞ്ഞ ഡിസംബറില് അഞ്ചു വയസ്സു പൂര്ത്തിയാക്കിയ മലയാളം വിക്കിപീഡിയയില് അയ്യായിരത്തിലധികം ലേഖനങ്ങള് ഉണ്ട്. ഒരു ലക്ഷം തിരുത്തലുകള് വിക്കിപീഡിയയില് ഇതിനകം നടന്നു കഴിഞ്ഞിട്ടുണ്ട്. ഇന്റര്നെറ്റിലെ മലയാളത്തിന്റെ സജീവത വ്യക്തമാക്കാന് ഈ കണക്കുകള് പര്യാപ്തമാണ് . ഈ അവസ്ഥയിലും ഇത്തരം സാദ്ധ്യതകള് ഉപയോഗിക്കുന്നതില് നമ്മുടെ സര്ക്കാര് വകുപ്പുകള് തികഞ്ഞ അലംഭാവമാണ് കാണിക്കുന്നത്. കേരള സര്ക്കാരിന്റെ ഔദ്യോഗിക വെബ്സൈറ്റ് ഇപ്പോഴും ആംഗലത്തിലാണ്. ഭരണഭാഷ മലയാളമാക്കുന്നതില് നാം പുലര്ത്തുന്ന നിഷ്കര്ഷയുടെ മികച്ച ഉദാഹരണമാണിത്.
ഇന്റര്നെറ്റിലെ മലയാളം അനായാസമായത് യൂനിക്കോഡ് എന്കോഡിംഗിനെത്തുടര്ന്നാണ്. മലയാളത്തിന്റെ യൂനിക്കോഡ് എന്കോഡിംഗിനെക്കുറിച്ച് ഇപ്പോള് ചില തര്ക്കങ്ങള് നിലവിലുണ്ട്. ഭാഷാപരവും സാങ്കേതികവുമായ പരിജ്ഞാനം ഈ പ്രശ്നങ്ങള് മനസ്സിലാക്കാനും അവയ്ക്ക് പരിഹാരം കാണാനും ആവശ്യമാണ്. എന്നാല് കേരളത്തിലെ ഭാഷാപണ്ഡിതന്മാരോ വിവരസാങ്കേതികതാ വിദഗ്ദ്ധരോ ഈ പ്രശ്നത്തെക്കുറിച്ച് സഗൗരവം പഠിക്കുകയോ അഭിപ്രായം രൂപീകരിക്കുകയോ ചെയ്തിട്ടില്ല. എന്താണ് ഈ പ്രശ്നം എന്നു പോലും ശരിയായ രീതിയില് മനസ്സിലാക്കാന് ഔദ്യോഗികഭാഷാസ്ഥാപനങ്ങള്ക്ക് ഇനിയും കഴിഞ്ഞിട്ടില്ല. എന്താണ് യൂനിക്കോഡ് എന്കോഡിംഗിലെ പ്രശ്നം എന്ന് വിശദീകരിക്കാനുള്ള ഒരു ശ്രമമാണ് ഈ ലേഖനം.
ലോകത്തിലെ പ്രമുഖ കമ്പ്യൂട്ടര്നിര്മ്മാണക്കമ്പനികളും സോഫ്റ്റ്വേര്കമ്പനികളും ചേര്ന്ന് രൂപീകരിച്ച ഒരു സംഘടനയാണ് കാലിഫോര്ണിയ ആസ്ഥാനമായ യൂനിക്കോഡ് കണ്സോര്ഷ്യം। ലോകത്തിലെ എല്ലാ ഭാഷകളും അനായാസം ഫലപ്രദമായി കമ്പ്യൂട്ടറില് ഉപയോഗിക്കാനും ഇന്റര്നെറ്റ് വഴി ഈ ഭാഷകളില് വിവരവിനിമയം അനായാസമാക്കാനും സഹായകമായ സാങ്കേതികവിദ്യ രൂപപ്പെടുത്തുക എന്നതാണ് ഈ കണ്സോര്ഷ്യത്തിന്റെ ഉദ്ദേശ്യലക്ഷ്യം. അതിനായി അവര് ചിട്ടപ്പെടുത്തിയ ഭാഷാകോഡുകളാണ് യൂനിക്കോഡ് എന്ന പേരില് അറിയപ്പെടുന്നത്. ലോകത്തിലെ ഭാഷകള്ക്കെല്ലാം ഓരോ കോഡ് പേജുകള് യൂനിക്കോഡില് നല്കിയിട്ടുണ്ട്. മലയാളത്തിന്റെ യൂനിക്കോഡ് കോഡ്പേജ് നിലവില് വരികയും സോഫ്റ്റ്വേര് നിര്മ്മാതാക്കള് ഇത് പിന്തുടരുകയും ചെയ്തതിനാലാണ് ഇന്ന് ഇന്റര്നെറ്റില് നേരത്തെ പറഞ്ഞതു പോലെ മലയാളം ഉപയോഗിക്കാന് സാധിക്കുന്നത്.
വിന്ഡോസ് എക്സ്പി എന്ന ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ സര്വ്വീസ് പായ്ക്ക് രണ്ടിലാണ് മലയാളത്തിന്റെ കോഡുകള് മൈക്രോസോഫ്റ്റ് ആദ്യമായി ഉള്ക്കൊള്ളിക്കുന്നത്। ഈ ഓപ്പറേറ്റിംഗ് സിസ്റ്റം അതിന്റെ രണ്ടാമത്തെ സര്വ്വീസ് പായ്ക്ക് സഹിതം ഇന്സ്റ്റള് ചെയ്ത കമ്പ്യൂട്ടറില് മറ്റൊരു ഭാഷാസോഫ്റ്റ്വേറുമില്ലാതെ മലയാളം ഉപയോഗിക്കാന് സാധിക്കും. ഗ്നു ലിനക്സിന്റെ ഒട്ടുമിക്ക ഡിസ്ട്രിബ്യൂഷനുകളിലും മലയാളം ഉള്ക്കൊള്ളിച്ചിട്ടുണ്ട്. ഐടി @ സ്കൂള് ഉപയോഗിക്കുന്ന ഡെബിയാന്റെ കസ്റ്റമൈസ്ഡ് വേര്ഷന്, തികച്ചും സൗജന്യമായി ലഭിക്കുന്ന ഉബന്തു, പ്രശസ്തമായ ഫെഡോറ എന്നിവയെല്ലാം പ്രയാസമില്ലാതെ മലയാളം ഉപയോഗിക്കാന് സാധിക്കുന്ന ലിനക്സ് ഡിസ്ട്രിബ്യൂഷനുകളാണ്.
മലയാളത്തിന് ഇന്ന് യൂനിക്കോഡില് നിലവിലിരിക്കുന്ന കോഡ് പേജ് പരിഷ്കരിക്കണമെന്ന നിര്ദ്ദേശത്തെ തുടര്ന്നാണ് തര്ക്കങ്ങള് ഉടലെടുത്തത്। യൂനിക്കോഡില് ചില്ല് അക്ഷരമില്ല എന്നും ചില്ലക്ഷരം മലയാളത്തിന് ആവശ്യമില്ല എന്ന് ചിലര് വാദിക്കുന്നു എന്നെല്ലാം പ്രചരിപ്പിക്കുന്നത് ഈ തര്ക്കത്തിന്റെ അടിസ്ഥാനത്തിലാണ്. എന്താണ് ഇതിന്റെ വാസ്തവം എന്നു മനസ്സിലാക്കേണ്ടതുണ്ട്. മലയാളിസമൂഹത്തിന്റെ ഭാഷയെ സംബന്ധിക്കുന്ന ജീവല്പ്രധാനമായ ഒരു കാര്യം കാലിഫോര്ണിയയില് ലോകത്തിലെ കുത്തക കമ്പ്യൂട്ടര്നിര്മ്മാതാക്കളും സോഫ്റ്റ്വേര്കമ്പനികളും കേരളത്തിലെ ജനങ്ങള് അറിയാതെ തീരുമാനിക്കുന്നുവെന്നത് വിവരം നിഗൂഢവത്കരിക്കുന്നതിനെ എതിക്കുന്നവരെങ്കിലും പുറത്തറിയിക്കേണ്ടതാണ്. ഭാരതീയഭാഷകളുടെ യൂനിക്കോഡ് എന്കോഡിംഗിനെക്കുറിച്ച് അഭിപ്രായം പറയാന് ഇന്ഡി മെയിലിംഗ് ലിസ്റ്റ് എന്ന ഒരു സംവിധാനം യൂനിക്കോഡ് കണ്സോര്ഷ്യത്തിനുണ്ട്. അവിടെ അഭിപ്രായം പറയാമെന്നല്ലാതെ അത് യൂനിക്കോഡ് സ്വീകരിച്ചുകൊള്ളും എന്ന വ്യവസ്ഥയൊന്നുമില്ല. തീരുമാനങ്ങള് കൈക്കൊള്ളുന്നത് അതിനായി നിയോഗിച്ചിട്ടുള്ള കമ്മിറ്റിയാണ്. മെയിലിംഗ് ലിസ്റ്റില് കേരളത്തിലെ ഭാഷാപണ്ഢിതന്മാരില് ഒരാളും ഇക്കാലത്തിനിടയില് അഭിപ്രായം പറയാന് എത്തിയിട്ടില്ല. കാരണം ലളിതമാണ്. അവര് ആരും ഈ സംവിധാനത്തെക്കുറിച്ചോ അവിടെ നടക്കുന്ന ചര്ച്ചയെക്കുറിച്ചോ അറിഞ്ഞിട്ടില്ല. കടുത്ത കമ്പ്യൂട്ടര്വിരുദ്ധനിലപാടുണ്ടായിരുന്ന കേരളത്തില് ഇന്നും മഹാഭൂരിപക്ഷം ബുദ്ധീജീവികളും കമ്പ്യൂട്ടറുമായോ ഇന്റര്നെറ്റുമായോ പരിചയം നേടിയിട്ടില്ലാത്തവരാണ്. ഇത് ഒരു ഐ.ടി പ്രശ്നം എന്ന നിലയില് ഭാഷാവിദഗ്ദ്ധരും ഇതൊരു ഭാഷാപ്രശ്നം എന്ന നിലയില് ഐ.ടി വിദഗ്ദ്ധരും കണക്കാക്കുന്നു. ചുരുക്കത്തില് കേരളത്തില് ആരുടേയും പരിഗണനയില് വരാതെ കിടന്ന പ്രശ്നമാണിത്. അതിനാല് ഇന്ഡി മെയിലിംഗ് ലിസ്റ്റില് ചര്ച്ച ചെയ്ത മലയാളഭാഷാപ്രശ്നം ലഘുവായി ഇവിടെ പരാമര്ശിക്കാം.
പ്രധാന തര്ക്കവിഷയം മലയാളത്തിലെ ചില്ലക്ഷരങ്ങള്ക്ക് പ്രത്യേകം കോഡ് പോയിന്റുകള് നല്കേണ്ടതുണ്ടോ എന്നതാണ്। പ്രത്യേകം കോഡ് പോയിന്റ് നല്കണം എന്നു വാദിക്കുവാന് കാരണം എന്ത്? പ്രത്യേകം കോഡ് പോയിന്റ് നല്കിയാല് എന്തെങ്കിലും ദോഷമുണ്ടോ? ചില്ലക്ഷരങ്ങള്ക്ക് കോഡ് പോയിന്റുകള് നല്കുന്നത് എതിര്ക്കുവാന് കാരണമെന്ത്? ഇക്കാര്യം മനസ്സിലാക്കാന് അല്പം സാങ്കേതികജ്ഞാനം ആവശ്യമാണ്.
ടൈപ്പ്റൈറ്ററിന്റേതു പോലുള്ള കീബോര്ഡാണ് കമ്പ്യൂട്ടറിനും ഉള്ളത്। എങ്കിലും പ്രവര്ത്തനരീതി വ്യത്യസ്തമാണ്. കീബോര്ഡിലെ ഒരു കീ അമര്ത്തുമ്പോള് കമ്പ്യൂട്ടറിനകത്ത് സൂക്ഷിച്ചിട്ടുള്ള വിവരങ്ങളില് നിന്ന് ആ കീയുമായി ബന്ധപ്പെടുത്തി സൂക്ഷിച്ചിട്ടുള്ള വിവരം അനുസരിച്ച് പ്രവര്ത്തിക്കുകയാണ് കമ്പ്യൂട്ടര് ചെയ്യുന്നത്. ഒരു അക്ഷരം ടൈപ്പ് ചെയ്യുമ്പോഴും സംഭവിക്കുന്നത് ഇതു തന്നെയാണ്. കമ്പ്യൂട്ടറിനകത്ത് വിവരങ്ങള് കോഡുരൂപത്തിലാണ് സംഭരിച്ചു സൂക്ഷിക്കുന്നത്. ഇതിനായി 0,1 എന്നീ സംഖ്യകളുടെ ഒരു ശൃംഖലയാണ് കമ്പ്യൂട്ടര് ആന്തരികമായി ഉപയോഗിക്കുന്നത്. ഭാരതീയഭാഷകള് കമ്പ്യൂട്ടറില് ഉപയോഗിക്കാന് ആവശ്യമായ ഇത്തരം വിവരങ്ങള് ഓരോ സോഫ്റ്റ്വേര് നിര്മ്മാതാവും സ്വന്തം യുക്തിക്ക് അനുസൃതമായി ചിട്ടപ്പെടുത്തി ഉപയോഗിക്കുകയാണ് ചെയ്തിരുന്നത്. ഇക്കാരണത്താല് കോഡുകളുടെ നിരവധി വ്യവസ്ഥകള് നിലവിലുണ്ടായിരുന്നു. അക്കാരണത്താല്, ഒരു സോഫ്റ്റ്വേര് ഉപയോഗിച്ച് മലയാളം ഉള്പ്പെടെയുള്ള ഭാരതീയഭാഷയില് ടൈപ്പുചെയ്ത ഒരു രചന മറ്റൊരു സോഫ്റ്റ്വേര് ഉപയോഗിക്കുന്ന കമ്പ്യൂട്ടറില് വായിക്കാന് സാധിക്കുമായിരുന്നില്ല. ഈ പ്രശ്നം പരിഹരിക്കണമെങ്കില് എല്ലാ കമ്പ്യൂട്ടറും ഒരേ കോഡുകള് തന്നെ ഉപയോഗിക്കണം. കമ്പ്യൂട്ടറുകള്ക്കിടയില് വിവരവിനിമയം സാധിക്കുന്നതിന് മാനകീകരിച്ച കോഡുകള് ഉപയോഗിച്ച് ഭാഷാസോഫ്റ്റുവേറുകള് നിര്മ്മിക്കേണ്ടിയിരുന്നു. കേന്ദ്രസര്ക്കാരിന്റെ ഇലട്രോണിസ് വിഭാഗം 1986-88 കാലത്താണ് ഭാരതീയഭാഷകളുടെ കോഡുകളുടെ മാനകീകരണം നടത്തിയത്. ഈ വ്യവസ്ഥ പിന്തുരുന്നതാണ് കമ്പ്യൂട്ടര് ടൈപ്പ്സെറ്റിംഗിനായി ഇന്ന് ഉപയോഗിക്കുന്ന ഭാരതീയഭാഷാ സോഫ്റ്റുവേറുകള്.
എന്നാല് ഇത് ഉപയോഗിച്ച് ഇന്റര്നെറ്റില് അനായാസമായി വിവരവിനിമയം സാധിക്കുകയില്ലായിരുന്നു। വെബ് ഫോണ്ടുകളും ബിറ്റ്സ്ട്രീം സാങ്കേതികവിദ്യയും ഉപയോഗിച്ചാണ് അക്കാലത്ത് ഇന്റര്നെറ്റില് മലയാളം ഉപയോഗിച്ചിരുന്നത്. ഓരോ പത്രവും അവരുടെ സ്വന്തം ഫോണ്ട് ഉപയോഗിക്കുന്നു. പ്രസ്തുത ഫോണ്ട് നമ്മുടെ കമ്പ്യൂട്ടറില് ഇന്സ്റ്റള് ചെയ്താലേ ആ പത്രം നമ്മുക്ക് വായിക്കാനാകൂ. നാലു പത്രം വായിക്കാന് നാല് ഫോണ്ട്!
ഫോണ്ടിനെ ആശ്രയിച്ചും അതിന്റെ സാങ്കേതികവിദ്യയ്ക്ക് വിധേയമായും ഭാഷ ഉപയോഗിക്കുന്ന പ്രയാസം ഇല്ലാതാക്കിയത് യൂനിക്കോഡ് എന്കോഡിംഗാണ്. ഒരു യൂനിക്കോഡ് ഫോണ്ട് കമ്പ്യൂട്ടറില് ഉണ്ടായാല് യൂനിക്കോഡ് കോഡിംഗ് വ്യവസ്ഥ പിന്തുടരുന്ന രചന നമ്മുക്ക് അത് തയ്യാറാക്കിയവര് ഉപയോഗിച്ച ഫോണ്ട് നമ്മള് ഉപയോഗിക്കുന്നില്ലെങ്കിലും വായിക്കാം. കോഡുകള്ക്ക് കമ്പ്യൂട്ടറിലെ ഭാഷാരചനയില് നിര്ണ്ണായകമായ പ്രാധാന്യമാണുള്ളത്. ഒരു ഭാഷയിലെ അടിസ്ഥാനാക്ഷരങ്ങള്ക്കാണ് കോഡുകള് നല്കുന്നത്. അക്ഷരങ്ങളുടെ ഇരട്ടിപ്പ്, കൂട്ടക്ഷരങ്ങള് തുടങ്ങിയവ അടിസ്ഥാനാക്ഷരങ്ങള് ചേര്ന്ന് ഉണ്ടാകുന്നവയാണ് എന്നതിനാല് അവ ഏതൊക്കെ കൂട്ടക്ഷരങ്ങള് ചേര്ന്നാണോ രൂപപ്പെടുന്നത് അവ ചേര്ത്ത് രൂപപ്പെടുത്തുയാണ് ടൈപ്പു ചെയ്യുമ്പോള് ചെയ്യുന്നത്. ഉദാഹരണമായി ത,ചന്ദ്രക്കല എന്നിവ ഉണ്ടെങ്കില് തത്ത എന്ന് ടൈപ്പ് ചെയ്യാം. ത,ത,ചന്ദ്രക്കല,ത എന്നു ടൈപ്പു ചെയ്താല് മതി. ചന്ദ്രക്കല അക്ഷരങ്ങളെ യോജിപ്പിക്കുവാനുള്ള കോഡിനെ പ്രതിനിധാനം ചെയ്യുന്നു. ചില്ലുകളും ഇങ്ങനെ ഉണ്ടാക്കിയെടുക്കുയാണ് ചെയ്യുന്നത്. കാരണം, ഓരോ ചില്ലക്ഷരവും ചില അടിസ്ഥാനാക്ഷരവുമായി ബന്ധപ്പെട്ടതാണ് എന്നതു തന്നെ.
ഭാരതീയഭാഷകളുടെ കോഡുകള് നിശ്ചയിക്കുന്ന പ്രക്രിയയില് ശ്രദ്ധേയമായ സംഭാവനയാണ് ഇസ്കി എന്കോഡിംഗ് അടിസ്ഥാനമാക്കിയ ഇസ്ഫോ കോഡില് സിഡാക്ക് നല്കിയത്। എല്ലാ ഭാരതീയഭാഷകളും അക്ഷരമാലയില് ഒരേ ക്രമം പിന്തുടരുന്നവയാണല്ലോ. അക്ഷരങ്ങളുടെ എണ്ണവും സാദൃശ്യവും ഇവയുടെ ക്രമവും എല്ലാ ഇന്ത്യന്ഭാഷകളും ഒരേ കോഡിംഗിന്റെ അടിസ്ഥാനത്തില് ഉപയോഗിക്കാമെന്ന പൂര്വ്വാനുമാനത്തിനു അടിസ്ഥാനമായി॥ അതിനാല് ഭാഷ മാറ്റി എല്ലാ ഭാരതീയഭാഷകളും ഒരേ രീതിയില് ഉപയോഗിക്കാവുന്ന ഒരു വ്യവസ്ഥ അവര് രൂപീകരിച്ചു. ഇവ ടൈപ്പ് ചെയ്യാന് എല്ലാ ഭാഷകള്ക്കും ഒരേ കീബോര്ഡ് എന്നതും അവര് യാഥാര്ത്ഥ്യമാക്കി. അതിനാല് സിഡാക്കിന്റെ ഐ എസ് എം പരമ്പരയില്പ്പെട്ട സോഫ്റ്റ്വേര് ഉപയോഗിക്കുന്ന പക്ഷം മലയാളം ടൈപ്പുചെയ്യുന്നതിനിടയില് ഭാഷ ഹിന്ദിയോ ബംഗാളിയോ മറ്റേതെങ്കിലും ഭാരതീയഭാഷയോ ആക്കി മാറ്റി ആ ഭാഷയിലെ വാക്ക് ടൈപ്പു ചെയ്യാം. അതിനു വേണ്ടി ആ ഭാഷയുടെ കീബോര്ഡ് പരിശീലിക്കേണ്ടതില്ല. ഈ കീബോര്ഡ് ലേഔട്ട് ഇന്സ്ക്രിപ്റ്റ് കീബോര്ഡ് എന്ന പേരില് അറിയപ്പെടുന്നു. ഭാരതീയഭാഷകളുടെ സ്വനപരവും ലിപിപരവുമായ സവിശേഷതകള് അടിസ്ഥാനമാക്കി ചിട്ടപ്പെടുത്തിയ യുക്തിഭദ്രവും സൗകര്യപ്രദവുമായ വ്യവസ്ഥയാണ് സിഡാക്ക് നല്കിയിട്ടുള്ളത്.
ഭാരതീയഭാഷളുടെ മാനകീകരണത്തിന് സിഡാക്ക് ഉപയോഗിച്ച വ്യവസ്ഥ അതേപടി ഉപയോഗിച്ചാണ് യൂനിക്കോഡിന്റെ കോഡുകള് നിശ്ചയിച്ചത്. അതിനാല് ചില്ല്, അക്ഷരങ്ങളുടെ ഇരട്ടിപ്പ്, കൂട്ടക്ഷരം എന്നിവ അടിസ്ഥാനാക്ഷരത്തില് നിന്നും ഉണ്ടാക്കിയെടുക്കുകയാണ് യൂനിക്കോഡില് ചെയ്യുന്നത്. നേരത്തെ ഇന്ത്യന് ഭാഷകളുടെ കോഡിനെ പ്രാവര്ത്തികമാക്കാന് ഉണ്ടാക്കിയ ഇസേ്ഫാക്ക് എന്ന എന്കോഡിംഗിന്റെ ഭാഗമായി നുക്ത എന്ന സംവിധാനം ഉപയോഗിച്ചായിരുന്നു ചില്ലുകള് ഉണ്ടാക്കിയിരുന്നത്. യൂനിക്കോഡില് സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ) എന്ന സംവിധാനമാണ് നുക്തയ്ക്കു പകരം ഉപയോഗിക്കുന്നത്. അതാവട്ടെ ഇന്ത്യന് ഭാഷകള്ക്കു മാത്രമല്ല ലോകത്തിലെ നിരവധി ഭാഷകളുടെ കാര്യത്തില് ഉപയോഗിക്കുന്ന സംവിധാനമാണ്. അടിസ്ഥാനാക്ഷരവും വിരാമ എന്ന് പേരിട്ടിരിക്കുന്ന ചന്ദ്രക്കലയും സീറോ വിഡ്ത്ത് ജോയിനറുമാണ് ചില്ലക്ഷരം ഉണ്ടാക്കിയെടുക്കാനായി ഉപയോഗിക്കുന്നത്. ഉദാഹരണമായി ന് എന്ന ചില്ലക്ഷരം ന, ചന്ദ്രക്കല, സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ) എന്നിവ ടൈപ്പു ചെയ്താണ് ഉണ്ടാക്കുന്നത്. ഇക്കാരണത്താല് അക്ഷരമാലയില് കാണുന്ന ചില്ലക്ഷരങ്ങള് മലയാളത്തിന്റെ കോഡ് പേജില് കാണില്ല. അത് അടിസ്ഥാനാക്ഷരമായല്ല ഇവിടെ പരിഗണിക്കപ്പെടുന്നത് എന്നതിനാലാണത്. ഈ രീതിക്കു പകരം ചില്ലിന് പ്രത്യേകം കോഡ് വേണം എന്നാണ് ഒരു വിഭാഗം വാദിക്കുന്നത്. ഈ വാദത്തെ മറ്റൊരു വിഭാഗം നിരവധി ന്യായങ്ങള് ഉന്നയിച്ച് എതിര്ക്കുന്നു. ഇതാണ് ഇന്ന് യൂനിക്കോഡിലെ മലയാളം എന്കോഡിംഗ് സംബന്ധമായ ഏറ്റവും വലിയ തര്ക്കം.
ഒരു ഭാഷ ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ ഭാഗമാകുന്നതോടെ കമ്പ്യൂട്ടറിന്റെ അടിസ്ഥാനപരമായ ഭാഷാശേഷിയില് പ്രസ്തുതഭാഷകൂടി ഉള്പ്പെടുന്നുവെന്നതിനാലാണ് യൂനിക്കോഡിലെ മലയാളത്തിന്റെ കോഡുകള് വമ്പിച്ച ഒരു പ്രശ്നമാകുന്നത്. ഡി.ടി.പി യുടെ തലത്തില് നടത്തുന്ന പ്രവര്ത്തനത്തിനപ്പുറം കമ്പ്യൂട്ടര് ഉപയോഗിച്ചു ചെയ്യുന്ന എല്ലാ പ്രവര്ത്തനങ്ങള്ക്കും പ്രസ്തുതഭാഷ ഉപയോഗിക്കാം എന്നു വരുമ്പോള് തെറ്റില്ലാതെ അനായാസം ഭാഷ കൈകാര്യം ചെയ്യാനാകേണ്ടതുണ്ട്. ചില്ലക്ഷരത്തിന് പ്രത്യേക കോഡ് നല്കുകയും ഭാഷയിലെ അടിസ്ഥാനാക്ഷരമായി പരിഗണിക്കുകയും ചെയ്യുമ്പോള് സംഭവിക്കുന്ന പ്രശ്നങ്ങളെക്കുറിച്ച് ഉന്നയിക്കപ്പെട്ട വാദമുഖങ്ങള് മനസ്സിലാക്കേണ്ടത് ഇക്കാരണത്താല് പ്രാധാന്യമുള്ള കാര്യമാണ്.
യൂനിക്കോഡ് എന്കോഡിംഗ് വ്യവസ്ഥയനുസരിച്ച് കമ്പ്യൂട്ടറില് മലയാളം ടൈപ്പുചെയ്യാന് അടിസ്ഥാനാക്ഷരങ്ങളും വിരമ എന്നു പേരിട്ടിരിക്കുന്ന ചന്ദ്രക്കലയും സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ), സീറോ വിഡ്ത്ത് നോണ്ജോയിനര് (ZWNJ) എന്നീ ഒരു ക്രമീകരണങ്ങളും ഉപയോഗിക്കുന്നു। ചില്ലക്ഷരം നിര്മ്മിച്ചെടുക്കാന് സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ) ഉപയോഗിക്കുന്നതിനെക്കുറിച്ച് നേരത്തെ പറഞ്ഞിട്ടുണ്ടല്ലോ. ഓരോ അക്ഷരത്തിനും ഒരു നിശ്ചിത വലുപ്പം ഉണ്ട്. എന്നാല് അങ്ങനെയല്ലാത്തതും അക്ഷരത്തിന്റെ രൂപത്തില് മാറ്റം വരുത്തുന്നതുമായ ക്രമീകരണമാണ് ജോയിനര്. നോണ് ജോയിനര് ആവട്ടെ, പേര് സൂചിപ്പിക്കുന്നതു പോലെ അക്ഷരങ്ങള് കൂടിച്ചേരുന്നതിനെ തടയുവാനുള്ള ക്രമീകരണമാണ് എന്നു ചുരുക്കി പറയാം. ജോയിനറും നോണ് ജോയിനറും കണ്ട്രോള് ഫോര്മാറ്റിംഗ് ക്യാറക്ടേഴ്സ് ആണ് എന്നാണ് സാങ്കേതികമായി പറയുക. ടൈപ്പ് ചെയ്ത ഒരു രചനയില് അക്ഷരങ്ങള് ചെരിഞ്ഞതാക്കുക ( ഇറ്റാലിസ്), കട്ടിയുള്ളതാക്കുക (ബോള്ഡ് ഫെയ്സ്) എന്നിങ്ങനെയുള്ള കാര്യങ്ങള് ഫോര്മാറ്റിംഗിന്റെ ഭാഗമായി ചെയ്യുന്ന പ്രവര്ത്തനങ്ങളാണ്. ഇത്തരം പ്രവര്ത്തനമാണ് ജോയിനര് ചെയ്യുന്നതെന്നും അതിനാല് ചില പ്രശ്നങ്ങള് ഉണ്ടാകാനിടയുണ്ടെന്നുമാണ് ചില്ലക്ഷരത്തിന് കോഡ് പോയിന്റ് വേണം എന്നു വാദിക്കുന്നവര് ഉന്നയിക്കുന്ന പ്രധാനയുക്തി.
ഇപ്പോഴത്തെ നിലയില് യൂനിക്കോഡിന്റെ കോഡ് പേജില് വ്യവസ്ഥചെയ്യപ്പെട്ട വിധത്തില് മലയാളം തെറ്റു കൂടാതെ ഉപയോഗിക്കാന് സാധിക്കും। ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടറുകളാണ് ജോയിനറുകള് എന്നത് ഒരു നിലയിലും ഇന്നത്തെ അവസ്ഥയില് അച്ചടിയിലും വെബ്ബിലുമുള്ള ഭാഷോപയോഗത്തെ പ്രശ്നത്തിലാക്കുന്നില്ല. പത്രം അച്ചടിക്കുക, പുസ്തകങ്ങള് തയ്യാറാക്കുക എന്നിങ്ങനെയുള്ള പ്രവര്ത്തനങ്ങള്ക്കൊന്നും ഇപ്പോഴത്തെ വ്യവസ്ഥ ഒരു തടസ്സവുമല്ല. സാങ്കേതികമായ ഭാഷയില് പറഞ്ഞാല് ടെസ്റ്റ് എഡിറ്റിംഗിന്റെ തലത്തിലോ വെബ്ബിലോ ഇപ്പോള് യൂനിക്കോഡില് നിലവിലുള്ള വ്യവസ്ഥയ്ക്ക് ഒരു പ്രശ്നവുമില്ല. ഒരു ചില്ലക്ഷരം ടൈപ്പ് ചെയ്യാന് മൂന്ന് കീകള് അമര്ത്തേണ്ടിവരും എന്നു തോന്നാം. കൂട്ടക്ഷരങ്ങള്, ഇരട്ടിപ്പുകള് എന്നിവ ടൈപ്പു ചെയ്യാനും മൂന്ന് കീകള് തന്നെ ഉപയോഗിക്കുന്നു. വേണമെങ്കില് ഇത് കീബോര്ഡ് വിന്യസനത്തില് പരിഹരിക്കാവുന്ന പ്രശ്നം മാത്രമാണ്. അത് പരിഹരിച്ചിട്ടുമുണ്ട്. ഉദാഹരണമായി, ഐടി @ സ്കൂള് ഉപയോഗിക്കുന്ന ഡബിയാന് ലിനക്സിന്റെ കസ്റ്റമൈസ്ഡ് വേര്ഷനില് നുക്ത എന്ന് ഇന്സ്ക്രിപ്റ്റ് കീബോര്ഡില് വിളിക്കുന്ന ഒരു കീയില് ചില്ല് രൂപപ്പെടുത്തുവാന് ക്രമപ്പെടുത്തിയിട്ടുണ്ട്. മലയാളത്തിന്റെ കാര്യത്തില് കീബോര്ഡില് ഓരോ അക്ഷരത്തിനും സുനിശ്ചിതമായ സ്ഥാനം എന്നത് വളരെ ഗുരുതരമായ പ്രശ്നമല്ല. നിലവില് ഏറ്റവുമധികം പ്രൊഫഷനല് ടൈപ്പിസ്റ്റുകള് ഉപയോഗിക്കുന്നത് സിഡാക് എന്ന സ്ഥാപനം ചിട്ടപ്പെടുത്തിയ ഇന്സ്ക്രിപ്റ്റ് കീ ബോര്ഡാണ്. അതില് മാത്രമേ നുക്ത എന്ന സങ്കല്പം തന്നെയുള്ളൂ. വിദേശമലയാളികള് മഹാഭൂരിപക്ഷവും ട്രാന്സ്ലിറ്ററേഷന് കീബോര്ഡ് എന്ന ഒരു ക്രമീകരണമാണ് പിന്തുടരുന്നത്. അതാകട്ടെ, ഇംഗ്ലീഷില് ടൈപ്പ് ചെയ്താല് മലയാളം കിട്ടാവുന്ന ക്രമീകരണമാണ്. അതില് തന്നെ നിരവധി വ്യത്യസ്തങ്ങളായ രീതികള് നിലവിലുണ്ട്.
ചില്ലക്ഷരത്തിന് കോഡ് പേജില് അടിസ്ഥാനാക്ഷരങ്ങളോടൊപ്പം സ്ഥാനം വേണം എന്ന് വാദിക്കുന്നവര് ചില ഉദാഹരണങ്ങള് കാണിച്ചാണ് തങ്ങളുടെ വാദമുഖം അവതരിപ്പിക്കുന്നത്। അതില് പ്രധാനം വന്യവനിക - വന്യവനിക എന്ന ദ്വന്ദമാണ്. വലിയ യവനിക എന്ന അര്ത്ഥത്തിലുള്ള ആദ്യത്തെ വാക്കും അതല്ലാത്ത അര്ത്ഥമുള്ള രണ്ടാമത്തെ വാക്കും (എന്താണ് അതിന്റെ അര്ത്ഥമെന്ന് എനിക്ക് മനസ്സിലായിട്ടില്ല. വന്യമായ വനിക എന്നാല് എന്തായിരിക്കാം?) ടൈപ്പു ചെയ്യുമ്പോള് ഉള്ള വ്യത്യാസം ആദ്യത്തെ വാക്കില് ന, ചന്ദ്രക്കല എന്നിവയ്ക്കു ശേഷം ZWJ ഉണ്ട് എന്നതാണ്. എന്നാല് ഇത് അവഗണിക്കപ്പെടുന്ന ഒരു സന്ദര്ഭം ഉണ്ടെങ്കില് ഈ രണ്ട് വാക്കുകളും തമ്മില് യാതൊരു വ്യത്യാസവും ഉണ്ടാകില്ല. കാരണം ന, ചന്ദ്രക്കല, യ എന്നിവ ചേര്ന്നാല് ന്യ എന്നാണ് കമ്പ്യൂട്ടര് കാണിക്കുക. ഇതു പോലെ വേറെ ചില ദ്വന്ദങ്ങളും വാദത്തിന് ഉപോദ്ബലകമായി അവര് അവതരിപ്പിക്കുന്നുണ്ട്. മന്വിക്ഷോഭം - മന്വിക്ഷോഭം(മന: + വിക്ഷോഭം എന്നത് എങ്ങനെയാണ് ഈ പദമാകുന്നത് എന്ന് എനിക്ക് മനസ്സിലായിട്ടില്ല), കണ്വലയം - കണ്വലയം (കണ്വലയത്തിന് എന്താണ് അര്ത്ഥം എന്നും മനസ്സിലായിട്ടില്ല) എന്നിവയാണ് പ്രശസ്തമായ ഉദാഹരണങ്ങള്. ഉദാഹരണമായി കാണിച്ച പദങ്ങളില് പലതും മലയാളത്തില് നിരര്ത്ഥകങ്ങളും കുസന്ധികളുമാണ്. എന്നിരുന്നാലും വാദത്തിന് ഈ ഉദാഹരണങ്ങള് സ്വീകരിച്ച് പരിശോധിക്കാവുന്നതാണ്. ഇതില് എല്ലാ സന്ദര്ഭത്തിലും അനൈച്ഛികമായ അക്ഷരസംയോഗം ഉണ്ടാകുന്നത് തടയാന് സാധിക്കും. അനൈച്ഛികമായ അക്ഷരസംയോഗമാണ് ഇവിടങ്ങളിലെല്ലാം സംഭവിക്കുന്നത്. താഴ്വാരം എന്ന വാക്ക് ടൈപ്പു ചെയ്യുമ്പോള് താഴ്വാരം എന്നാവാതിരിക്കാന് ഴ, ചന്ദ്രക്കല എന്നിവയ്ക്കു ശേഷം ZWNJ ടൈപ്പു ചെയ്യേണ്ടതാണ്. നോണ്ജോയിനര് അക്ഷരങ്ങള് കൂടിച്ചേരുന്നത് തടയും. ജോയിനര് ഇടയില് ഉള്ളിടത്തോളം ഇങ്ങനെ അനൈച്ഛികപദസംയോഗം സംഭവിക്കുകയുമില്ല. ജോയിനര് ഉപയോഗിക്കാതിരുന്നാലേ പ്രശ്നം ഉണ്ടാകുന്നുള്ളൂ. ആകയാല് ജോയിനറുകള് ഉപയോഗിക്കുന്ന രീതി അനുവര്ത്തിച്ചാല് നേരത്തെ ചൂണ്ടിക്കാണിച്ച ഉദാഹരണദ്വന്ദങ്ങളിലെ അനൈച്ഛികപദസംയോഗം തടയാവുന്നതാണ്. ഇത് ചില്ലക്ഷരത്തിന് കോഡ് പേജില് സ്ഥാനം വേണം എന്ന വാദത്തിന് മതിയായ ന്യായീകരണമാകുന്നില്ല. മലയാളത്തില് നിരര്ത്ഥകമായ വാക്കുകള് കാണിച്ചുള്ള ഈ യുക്തിവാദത്തിന് യാതൊരു സാധൂകരണവുമില്ല.
മലയാളം ടൈപ്പ് ചെയ്യുമ്പോള് ജോയിനറുകളുടെ ഉപയോഗം ഒഴിച്ചുകൂടാനാകാത്തതാണ്। ലോസഭ എന്ന വാക്ക് ടൈപ്പു ചെയ്യുമ്പോള് ലോക്സഭ എന്നാവാതിരിക്കാന്, ശ്രേയാംസ്കുമാര് എന്നത് ശ്രേയാംസ്കുമാര് എന്നാവാതിരിക്കാന് ZWNJ മലയാളത്തില് ഉപയോഗിക്കേണ്ടി വരും. ഇവിടെ ചില്ലക്ഷരമില്ല എന്നത് ശ്രദ്ധിക്കുക. ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടേഴ്സ് എന്നു കണക്കാക്കി അവഗണിക്കാനാകാത്ത പ്രാധാന്യം മലയാളത്തിന്റെ കാര്യത്തില് ZWJ, ZWNJ എന്നിവയ്ക്കുണ്ട് എന്ന് ഇതില് നിന്ന് മനസ്സിലാക്കാവുന്നതാണ്. അങ്ങനെയല്ലെങ്കില് വരാവുന്ന ചില മാതൃകകള് കാണിക്കാം: ജോസേ്താമസ്, രമേശ്ചെന്നിത്തല. പേരിനും സര്നെയിമിനുമിടയില് ഒരു സെ്പയ്സ് ഇടുന്നില്ലെങ്കില് ഈ പേരുകള് ഇങ്ങനെയാകും രൂപപ്പെടുക.
ചില്ലുകള്ക്ക് പ്രത്യേകം കോഡ് പോയിന്റ് നല്കണം എന്ന് വാദിക്കാന് കാരണം അവയ്ക്ക് സ്വതന്ത്രമായ നില്പില്ല എന്നതാണ്। അവ ഫോര്മാറ്റിംഗ് ക്യാരക്ടറുകളെ ആശ്രയിച്ചാണ് നില്ക്കുന്നത്. ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടറുകള്ക്ക് പരിമിതമായ സ്ഥാനമേയുള്ളൂ എന്നും അവഗണിക്കാവുന്നത് എന്ന് ഒരു ആപ്ലിക്കേഷന് ഇതിനെ പരിഗണിക്കാം എന്നുമുള്ള മുന്വിധിയില് നിന്നാണ് ഈ വാദമുഖം അവതരിപ്പിച്ചിട്ടുള്ളത്. സെര്ച്ച് എന്ജിനുകള് സാധാരണനിലയില് ഇറ്റാലിസ്, ബോള്ഡ് എന്നിങ്ങനെയുള്ള ഫോര്മാറ്റിംഗ് ഘടകങ്ങളെ അവഗണിക്കുകയാണ് പതിവ്. ഈ വാദം യുക്തിസഹമാണ് എന്ന് ഇതിന്റെ അടിസ്ഥാനത്തില് തോന്നാവുന്നതാണ്. എന്നാല് ലോകത്തിലെ പല ഭാഷകളും ഫോര്മാറ്റ് കണ്ട്രോള് ക്യാറക്ടറുകള് ഉപയോഗിക്കുന്നുണ്ട് എന്നതിനാല് അവയെ മലയാളത്തിന്റെ കാര്യത്തില് മാത്രം ഒരു ആപ്ലിക്കേഷന് അവഗണിക്കാവുന്നവ എന്ന് മാറ്റി നിറുത്താന് സാദ്ധ്യമല്ല.
ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടറുകള് അവഗണിക്കപ്പെടാവുന്നവയായി പരിഗണിക്കപ്പെടും എന്നു കണക്കാക്കി ചില്ലിന് യൂനിക്കോഡ് കോഡ് പേജില് സ്ഥാനം നല്കിയാല് അത് പ്രശ്നം പരിഹരിക്കുകയല്ല കൂടുതല് പ്രശ്നങ്ങള് സൃഷ്ടിക്കുകയാണ് ചെയ്യുക। യൂനിക്കോഡിന്റെ വ്യവസ്ഥയനുസരിച്ച് ഒരിക്കല് ചെയ്ത വ്യവസ്ഥ പിന്നീട് മാറ്റുകയില്ല. അതിനാല് ജോയിനറുകള് ഉപയോഗിച്ചും ചില്ലുകള്ക്കായി നല്കിയിട്ടുള്ള പുതിയ കോഡ് ഉപയോഗിച്ചും ചില്ലക്ഷരം ടൈപ്പു ചെയ്യാന് സാധിക്കുന്ന അവസ്ഥയാണ് ഇതിന്റെ ഫലമായി ഉണ്ടാവുക. ഒരു അക്ഷരത്തിന് രണ്ടു കോഡുകള് എന്ന അവസ്ഥയാണത്. കോഡുകള് മാനകീകരിക്കുന്നതും അത് എല്ലാവരും ഒരു പോലെ പിന്തുടരുകയും ചെയ്യുന്നത് അതോടെ അവസാനിക്കും. ചില്ലക്ഷരം പലര് പലരീതിയില് ടൈപ്പു ചെയ്യുന്നത് അച്ചടിയുടെ തലത്തില് ഒരു ഗുരുതരമായ പ്രശ്നമല്ല. എന്നാല് ഇന്റര്നെറ്റ് കാലത്തെ ഭാഷാപ്രയോഗം അച്ചടിക്കാലത്തിലേതില് നിന്ന് വ്യത്യസ്തമായി നിരവധി മണ്ഡലങ്ങളില് വ്യാപിച്ചു കിടക്കുന്നതാണ്. അവിടെയെല്ലാം രണ്ട് രീതിയില് ചില്ലക്ഷരം ഉണ്ടാക്കാവുന്ന അവസ്ഥയുണ്ടാകും. യൂനിക്കോഡിന്റെ നയം അനുസരിച്ച് നേരത്തെയുണ്ടായിരുന്ന കോഡുകള് അതേ പടി നിലനിറുത്തുകയാണ് അവര് ചെയ്യുകയെന്ന് നേരത്തെ പറഞ്ഞല്ലോ. അതിനാല് ഞാന് എന്ന വാക്ക് രണ്ട് രീതിയില് ടൈപ്പു ചെയ്യാനാകും. ഞ, ദീര്ഘം, ന, ചന്ദ്രക്കല, ZWJ എന്ന് ഒരാളും വേറൊരാള് ഞ, ദീര്ഘം, ചില്ല് ന് എന്നും. രണ്ടും കാഴ്ചയില് ഒരു പോലെയാണെങ്കിലും കമ്പ്യൂട്ടറിന്റെ ആന്തരികമായ വിവരത്തില് ഇത് രണ്ട് വാക്കുകളായിരിക്കും. അര്ത്ഥവ്യത്യാസമില്ലാതെ ഒരു വാക്ക് രണ്ടു രീതിയില് എഴുതുന്ന എഴുത്തു രീതി ഇന്ന് മലയാളത്തില് നിലവിലുണ്ട്. പുതിയലിപിയുടെ അടിസ്ഥാനത്തില് നിലവില് വന്ന പ്രസ്തുതരീതി ഇന്റര്നെറ്റ് കാലത്ത് മലയാളത്തിന്റെ അന്തകനായിത്തീരും.
ഇന്റര്നെറ്റുകാലത്തെ മലയാളത്തിന് ടൈപ്പ്റൈറ്റിംഗ് കാലത്തിലേതില് നിന്ന് വ്യത്യസ്തമായ പല ധര്മ്മങ്ങളും നിര്വ്വഹിക്കാനുണ്ട്। ഇന്റര്നെറ്റിലെ വെബ്ബ് വിലാസം മലയാളത്തില് നല്കാനാകുന്ന സാഹചര്യം ഇതില് ഒന്നാണ്. ഇവിടെ കൃത്യത പാലിക്കാനാകാത്ത ഒരു ഭാഷ ഈ മണ്ഡലത്തില് വമ്പിച്ച പ്രശ്നങ്ങള് സൃഷ്ടിക്കും. ഒരു ഉദാഹരണത്തിലൂടെ ഇത് വ്യക്തമാക്കാം. ഞാന് ഡോട്ട് കോം എന്ന പേരില് ഒരാള് വെബ് വിലാസം ഉണ്ടാക്കുന്നവെന്നു കരുതുക. യുനിക്കോഡില് ഇപ്പോഴുള്ള വ്യവസ്ഥയനുസരിച്ച് ZWJ ഉപയോഗിച്ചായിരിക്കും ആ വിലാസം ഉണ്ടാക്കിയിരിക്കുക. ചില്ലിന് കോഡ് പോയിന്റ് നിലവില് വന്നാല് മറ്റൊരാള്ക്ക് അതേ വിലാസം ചില്ലിന്റെ കോഡ് ഉപയോഗിച്ച് ഉണ്ടാക്കാനാകും. രണ്ടും കാഴ്ചയില് ഒരേ പേരാണ്. എന്നാല് കമ്പ്യൂട്ടറിന്റെ ആന്തരികമായ വ്യവസ്ഥയില് രണ്ടും വ്യത്യസ്തമാണ് എന്നതിനാല് ഇങ്ങനെ ഒരു വ്യാജനെ സൃഷ്ടിക്കുക എളുപ്പമാണ്. ചില്ലക്ഷരമുള്ള ഏത് വിലാസത്തിനും ഇങ്ങനെ വ്യാജന്മാര് വരാവുന്നതാണ്. കേരളസര്ക്കാര് എന്ന പേരിലുള്ള വെബ് സൈറ്റ് നാലു രീതിയില് റജിസ്റ്റര് ചെയ്യാന് സാധിക്കും. സര്ക്കാര് സെറ്റിന്റെ വ്യാജന് ഉണ്ടായാല് സംഭവിക്കാവുന്ന അപകടം വിസ്തരിക്കേണ്ടതില്ല. ഇങ്ങനെ വ്യാജന്മാരെ സൃഷ്ടിച്ച് വെബ്ബ് തെരയുന്നവരെ വഴിതെറ്റിച്ച് കൊണ്ടുപോകുന്ന രീതി ഇംഗ്ലീഷിന്റെയും മറ്റു ഭാഷകളുടേയും കാര്യത്തില് ഇപ്പോള് തന്നെ നിലവിലുണ്ട്. ഇതിനെ സ്പൂഫിംഗ് എന്നാണ് പറയുക. ഇങ്ങനെ ചെയ്യുന്നതിലൂടെ ഇന്റര്നെറ്റില് തെരയുന്ന ഒരാളെ വഴിതെറ്റിക്കുന്നതിനപ്പുറം നിയമവിരുദ്ധമായ പ്രവര്ത്തനങ്ങളാണ് സ്പൂഫ് ചെയ്യുന്നവര് നടത്തുന്നത്.ചില്ലിന്റെ കോഡു ഉപയോഗിച്ച് അങ്ങനെ ചെയ്യാവുന്ന അവസ്ഥ തടയുക എന്നത് മലയാളത്തിന്റെ ആവശ്യമാണ്.
ബാങ്കിംഗ് ഉള്പ്പെടെയുള്ള രംഗത്ത് ഇക്കാരണത്താല് തന്നെ പലരീതിയില് എഴുതുന്ന ഭാഷ ഉപയോഗിക്കാന് സാദ്ധ്യമാവില്ല। സെക്യൂറിറ്റി ആവശ്യമായ ഒരു പ്രവര്ത്തനവും ഡുവല് എന്കോഡിംഗ് എന്ന പേരില് അറിയപ്പെടുന്ന ഇരട്ട എഴുത്തു സാദ്ധ്യമാകുന്ന ഭാഷയില് നിര്വ്വഹിക്കുവാന് സാദ്ധ്യമല്ല. വ്യാജവിലാസം ഉപയോഗിച്ച് അക്കൗണ്ടുകളില് വ്യാജന്മാര് നുഴഞ്ഞുകയറിയാല് എന്തു തന്നെ സംഭവിക്കുകയില്ല! ചുരുക്കിപ്പറഞ്ഞാല് ഇന്റര്നെറ്റുകാലത്തെ മലയാളം പുതിയലിപിക്കാലത്തെ അവ്യവസ്ഥിതത്വം താങ്ങാനാകാത്ത ഭാഷയാണ്. അതിനാല് ഭാഷയുടെ കോഡ് പേജില് ഇപ്പോള് നിലനില്ക്കുന്ന പ്രശ്നരഹിതമായ അവസ്ഥയില് നിന്ന് പ്രശ്നസങ്കുലമായ അവസ്ഥയിലേക്ക് പോകേണ്ടതുണ്ടോ എന്നതാണ് ഇപ്പോള് ഈ വിവാദങ്ങളുടെ പശ്ചാത്തലത്തിലുള്ള കാതലായ ചോദ്യം.
ചില്ലക്ഷരത്തിന് കോഡ് പോയിന്റ് നിശ്ചയിച്ചാല് ഉണ്ടാകുന്ന പ്രശ്നം വിദ്യാര്ത്ഥികളുടെ സന്ദേഹത്തിനപ്പുറം പ്രാധാന്യമുള്ളതാണ്. കൃത്യമായി പറഞ്ഞാല് പുതിയലിപി മലയാളഭാഷയില് ഉണ്ടാക്കിയതിന്റെ നൂറ് മടങ്ങ് പ്രശ്നം അത് സൃഷ്ടിക്കും. ടൈപ്പ് റൈറ്റിംഗ് മെഷീനിനു വേണ്ടി ഉണ്ടാക്കിയ ലിപിസമ്പ്രദായം മലയാളത്തിന്റെ ലിപിയായി ഔദ്യോഗികമായി സര്ക്കാര് ഉത്തരവിലൂടെ അംഗീകരിക്കപ്പെട്ടുവെങ്കിലും ഇന്ന് അത് എവിടെയും നിലവിലില്ല. മലയാളത്തിലെ ഏറ്റവും പ്രധാനപ്പെട്ട പത്രങ്ങളില് ഒന്നായ മാതൃഭൂമി പുതിയലിപിയിലെ ഉകാരം മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ. ഋ കാരം ഉള്പ്പെടെ എല്ലാ അക്ഷരങ്ങളും അതിന്റെ തനതുരൂപത്തില് വീണ്ടെടുക്കാന് മാതൃഭൂമിക്ക് സാധിച്ചു. എന്നു മാത്രമല്ല വായനാസമൂഹം ഒരു എതിര്പ്പുമില്ലാതെ അത് സ്വീകരിക്കുകയും ചെയ്തു.
ഇക്കാര്യത്തില് കൗതുകാവഹമായ ഒരു സംഭവം ഉണ്ട്। സമകാലീനമലയാളം വാരികയില് പ്രസിദ്ധീകരിച്ചിരുന്ന സാഹിത്യവാരഫലം എന്ന പംക്തി മലയാളത്തിന്റെ തനതുലിപിയില് പ്രസിദ്ധീകരിച്ചു കാണാന് എഴുത്തുകാരനായ പ്രൊഫ. എം. കൃഷ്ണന്നായര് ആഗ്രഹം പ്രകടിപ്പിച്ചതിന്റെ അടിസ്ഥാനത്തില് പ്രസാധകര് അത് തനതുലിപിയിലേക്ക് മാറ്റി. ഈ മാറ്റം വലിയ ആകര്ഷണമാകുമെന്ന് പത്രാധിപസമിതി പ്രതീക്ഷിച്ചുവെങ്കിലും വായനക്കാരില് നിന്നും ഒരു പ്രതികരണവും ഉണ്ടായില്ലത്രെ. കാരണം ലിപി വിഷയത്തില് മലയാളികള് തനതുലിപി സ്വാഭാവികം എന്ന നിലയില് സ്വീകരിക്കുന്നുവെന്നതാണ്. മറ്റൊരു ഉദാഹരണം കൂടി പറയാം: വൃത്തസഹായി എന്ന പേരില് വൃത്തം കണ്ടുപിടിക്കാന് സഹായിക്കുന്ന ഒരു സോഫ്റ്റ്വേര് അമേരിക്കയില് ജോലി ചെയ്യുന്ന സുഷെന് കുമാര്, സഞ്ജീവ്കുമാര് എന്നിവര് ചേര്ന്ന് ഉണ്ടാക്കിയിട്ടുണ്ട്. അതിന്റെ നിര്ദ്ദേശം ഇതില് പുതിയലിപി ഉപയോഗിക്കരുത് എന്നാണ്. മാത്രമല്ല, വിസര്ഗ്ഗം, സംവൃതോകാരം എന്നിവയെല്ലാം ഉപയോഗിക്കണമെന്നുകൂടിയാണ്. അല്ലെങ്കില് മാത്ര ഗണിക്കാനാകാതെ വരികയും വൃത്തം നിര്ണ്ണയിക്കുന്നതില് പിഴവ് സംഭവിക്കുകയും ചെയ്യും. ലിപിപരിഷ്കരണത്തിന്റെ ഭാഗമായി തകര്ത്തെറിയപ്പെട്ടത് ഭാഷയുടെ ആന്തരികമായ യുക്തിയാണ് എന്നു മനസ്സിലാക്കാന് വൃത്തശാസ്ത്രത്തെക്കുറിച്ചുള്ള ഈ നിര്ദ്ദേശം സഹായകമാകും. മലയാളഭാഷയുടെ ആന്തരമായ യുക്തിയെ തകര്ത്ത് കൃത്രിമമായി ഉണ്ടാക്കിയ പുതിയലിപി ഇന്റര്നെറ്റ് കാലത്ത് സ്വാഭാവികമായിത്തന്നെ കാലഗതിയടഞ്ഞു. ബ്ലോഗെഴുത്തുകാരും വിക്കിപീഡിയ എഡിറ്റു ചെയ്യുന്നവരും ചിന്ത.കോമിലെ തര്ജ്ജനി മാസിക വായനക്കാരും ഉപയോഗിക്കുന്നത ഒന്നുകില് അഞ്ജലി ഓള്ഡ് ലിപിയോ രചനW01 എന്ന ഫോണ്ടോ ആണ്. ഇതു രണ്ടും മലയാളത്തിന്റെ തനതുലിപിസഞ്ചയം ഉപയോഗപ്പെടുത്തുന്ന ഫോണ്ടുകളാണ്.
ഇന്റര്നെറ്റു കാലത്തെ മലയാളം അച്ചടിക്കാലത്തെ ആധിപത്യങ്ങളെ നിരാകരിച്ച് സ്വതന്ത്രമായി മുന്നേറുന്ന ഘട്ടത്തിലാണ് യൂനിക്കോഡില് ഇപ്പോള് നിലവിലുള്ള കോഡ് പേജില് ചില്ലക്ഷരങ്ങള്ക്കും സ്ഥാനം വേണം എന്ന വാദം ഉയരുന്നത്. ഇത് ന്യായമായും സംശയാസ്പദമായിത്തീരുന്നു. ചില്ലിന് കോഡ് പോയിന്റ് വേണം എന്നു വാദിക്കുന്നവര് പല ന്യായങ്ങളും പല രീതിയില് ഉന്നയിക്കുന്നവെങ്കിലും എന്താണ് ഇതു കൊണ്ട് പ്രയോജനം എന്ന ചോദ്യത്തിനു മുമ്പില് മൗനികളാണ്. ഏത് പ്രശ്നമാണ് അത് പരിഹരിക്കുക എന്നതിനും ഉത്തരമില്ല. അത് വേറെ പ്രശ്നങ്ങളുണ്ടാക്കുമെങ്കില് അതിനെന്തു പ്രതിവിധി എന്നതിനും ഉത്തരമില്ല. ഇന്ഡിക് മെയിലിംഗ് ലിസ്റ്റിലും ബ്ലോഗിലും നടന്ന ചര്ച്ചകള് അവസാനം വരെ കാത്തിരുന്നു വായിച്ച ഒരാള് എന്ന നിലയില് ചില്ലക്ഷരത്തിന്റെ എന്കോഡിംഗ് എന്തിനെന്ന് എനിക്ക് മനസ്സിലാക്കാനായിട്ടില്ല. ഒരു പ്രശ്നവും പരിഹരിക്കാതിരിക്കുകയും പുതിയ പ്രശ്നങ്ങള് സൃഷ്ടിക്കുകയും ചെയ്യും ചില്ലിന്റെ എന്കോഡിംഗ് എന്നാണ് ഞാന് ഈ സംവാദങ്ങളില് നിന്ന് മനസ്സിലാക്കിയിട്ടുള്ളത്.
ആദ്യത്തെ മലയാളം ബ്ലോഗ് 2003 ഏപ്രില് മാസത്തിലാണ് പ്രസിദ്ധീകരിക്കപ്പെട്ടത്। അതിനു ശേഷം ഈ മാദ്ധ്യമത്തിന്റെ സാദ്ധ്യതകള് തിരിച്ചറിഞ്ഞ നിരവധി പേര് ബ്ലോഗുകള് ഉണ്ടാക്കി. തുടക്കത്തില് പതുക്കെയായിരുന്നുവെങ്കിലും ഇപ്പോള് ഓരോ ആഴ്ചയിലും ഇരുന്നൂറോളം പുതിയ ബ്ലോഗുകള് ഉണ്ടാകുന്നുണ്ട്. അവയില് ഏറെയും നിരന്തരമായി പുതിയ പോസ്റ്റുകള് പ്രസിദ്ധീകരിച്ച് സജീവമായി നില്ക്കുന്നവയുമാണ്. ബ്ലോഗു പോലെ സജീവമാണ് മലയാളം വിക്കിപീഡിയയും. താല്പര്യമുള്ള ആര്ക്കും ലേഖനങ്ങള് എഴുതാവുന്നതും തിരുത്തലുകളിലൂടെ ലേഖനങ്ങള് മെച്ചപ്പെടുത്താവുന്നതുമായ സ്വതന്ത്രവിജ്ഞാനകോശമാണ് വിക്കിപീഡിയ. ഇക്കഴിഞ്ഞ ഡിസംബറില് അഞ്ചു വയസ്സു പൂര്ത്തിയാക്കിയ മലയാളം വിക്കിപീഡിയയില് അയ്യായിരത്തിലധികം ലേഖനങ്ങള് ഉണ്ട്. ഒരു ലക്ഷം തിരുത്തലുകള് വിക്കിപീഡിയയില് ഇതിനകം നടന്നു കഴിഞ്ഞിട്ടുണ്ട്. ഇന്റര്നെറ്റിലെ മലയാളത്തിന്റെ സജീവത വ്യക്തമാക്കാന് ഈ കണക്കുകള് പര്യാപ്തമാണ് . ഈ അവസ്ഥയിലും ഇത്തരം സാദ്ധ്യതകള് ഉപയോഗിക്കുന്നതില് നമ്മുടെ സര്ക്കാര് വകുപ്പുകള് തികഞ്ഞ അലംഭാവമാണ് കാണിക്കുന്നത്. കേരള സര്ക്കാരിന്റെ ഔദ്യോഗിക വെബ്സൈറ്റ് ഇപ്പോഴും ആംഗലത്തിലാണ്. ഭരണഭാഷ മലയാളമാക്കുന്നതില് നാം പുലര്ത്തുന്ന നിഷ്കര്ഷയുടെ മികച്ച ഉദാഹരണമാണിത്.
ഇന്റര്നെറ്റിലെ മലയാളം അനായാസമായത് യൂനിക്കോഡ് എന്കോഡിംഗിനെത്തുടര്ന്നാണ്. മലയാളത്തിന്റെ യൂനിക്കോഡ് എന്കോഡിംഗിനെക്കുറിച്ച് ഇപ്പോള് ചില തര്ക്കങ്ങള് നിലവിലുണ്ട്. ഭാഷാപരവും സാങ്കേതികവുമായ പരിജ്ഞാനം ഈ പ്രശ്നങ്ങള് മനസ്സിലാക്കാനും അവയ്ക്ക് പരിഹാരം കാണാനും ആവശ്യമാണ്. എന്നാല് കേരളത്തിലെ ഭാഷാപണ്ഡിതന്മാരോ വിവരസാങ്കേതികതാ വിദഗ്ദ്ധരോ ഈ പ്രശ്നത്തെക്കുറിച്ച് സഗൗരവം പഠിക്കുകയോ അഭിപ്രായം രൂപീകരിക്കുകയോ ചെയ്തിട്ടില്ല. എന്താണ് ഈ പ്രശ്നം എന്നു പോലും ശരിയായ രീതിയില് മനസ്സിലാക്കാന് ഔദ്യോഗികഭാഷാസ്ഥാപനങ്ങള്ക്ക് ഇനിയും കഴിഞ്ഞിട്ടില്ല. എന്താണ് യൂനിക്കോഡ് എന്കോഡിംഗിലെ പ്രശ്നം എന്ന് വിശദീകരിക്കാനുള്ള ഒരു ശ്രമമാണ് ഈ ലേഖനം.
ലോകത്തിലെ പ്രമുഖ കമ്പ്യൂട്ടര്നിര്മ്മാണക്കമ്പനികളും സോഫ്റ്റ്വേര്കമ്പനികളും ചേര്ന്ന് രൂപീകരിച്ച ഒരു സംഘടനയാണ് കാലിഫോര്ണിയ ആസ്ഥാനമായ യൂനിക്കോഡ് കണ്സോര്ഷ്യം। ലോകത്തിലെ എല്ലാ ഭാഷകളും അനായാസം ഫലപ്രദമായി കമ്പ്യൂട്ടറില് ഉപയോഗിക്കാനും ഇന്റര്നെറ്റ് വഴി ഈ ഭാഷകളില് വിവരവിനിമയം അനായാസമാക്കാനും സഹായകമായ സാങ്കേതികവിദ്യ രൂപപ്പെടുത്തുക എന്നതാണ് ഈ കണ്സോര്ഷ്യത്തിന്റെ ഉദ്ദേശ്യലക്ഷ്യം. അതിനായി അവര് ചിട്ടപ്പെടുത്തിയ ഭാഷാകോഡുകളാണ് യൂനിക്കോഡ് എന്ന പേരില് അറിയപ്പെടുന്നത്. ലോകത്തിലെ ഭാഷകള്ക്കെല്ലാം ഓരോ കോഡ് പേജുകള് യൂനിക്കോഡില് നല്കിയിട്ടുണ്ട്. മലയാളത്തിന്റെ യൂനിക്കോഡ് കോഡ്പേജ് നിലവില് വരികയും സോഫ്റ്റ്വേര് നിര്മ്മാതാക്കള് ഇത് പിന്തുടരുകയും ചെയ്തതിനാലാണ് ഇന്ന് ഇന്റര്നെറ്റില് നേരത്തെ പറഞ്ഞതു പോലെ മലയാളം ഉപയോഗിക്കാന് സാധിക്കുന്നത്.
വിന്ഡോസ് എക്സ്പി എന്ന ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ സര്വ്വീസ് പായ്ക്ക് രണ്ടിലാണ് മലയാളത്തിന്റെ കോഡുകള് മൈക്രോസോഫ്റ്റ് ആദ്യമായി ഉള്ക്കൊള്ളിക്കുന്നത്। ഈ ഓപ്പറേറ്റിംഗ് സിസ്റ്റം അതിന്റെ രണ്ടാമത്തെ സര്വ്വീസ് പായ്ക്ക് സഹിതം ഇന്സ്റ്റള് ചെയ്ത കമ്പ്യൂട്ടറില് മറ്റൊരു ഭാഷാസോഫ്റ്റ്വേറുമില്ലാതെ മലയാളം ഉപയോഗിക്കാന് സാധിക്കും. ഗ്നു ലിനക്സിന്റെ ഒട്ടുമിക്ക ഡിസ്ട്രിബ്യൂഷനുകളിലും മലയാളം ഉള്ക്കൊള്ളിച്ചിട്ടുണ്ട്. ഐടി @ സ്കൂള് ഉപയോഗിക്കുന്ന ഡെബിയാന്റെ കസ്റ്റമൈസ്ഡ് വേര്ഷന്, തികച്ചും സൗജന്യമായി ലഭിക്കുന്ന ഉബന്തു, പ്രശസ്തമായ ഫെഡോറ എന്നിവയെല്ലാം പ്രയാസമില്ലാതെ മലയാളം ഉപയോഗിക്കാന് സാധിക്കുന്ന ലിനക്സ് ഡിസ്ട്രിബ്യൂഷനുകളാണ്.
മലയാളത്തിന് ഇന്ന് യൂനിക്കോഡില് നിലവിലിരിക്കുന്ന കോഡ് പേജ് പരിഷ്കരിക്കണമെന്ന നിര്ദ്ദേശത്തെ തുടര്ന്നാണ് തര്ക്കങ്ങള് ഉടലെടുത്തത്। യൂനിക്കോഡില് ചില്ല് അക്ഷരമില്ല എന്നും ചില്ലക്ഷരം മലയാളത്തിന് ആവശ്യമില്ല എന്ന് ചിലര് വാദിക്കുന്നു എന്നെല്ലാം പ്രചരിപ്പിക്കുന്നത് ഈ തര്ക്കത്തിന്റെ അടിസ്ഥാനത്തിലാണ്. എന്താണ് ഇതിന്റെ വാസ്തവം എന്നു മനസ്സിലാക്കേണ്ടതുണ്ട്. മലയാളിസമൂഹത്തിന്റെ ഭാഷയെ സംബന്ധിക്കുന്ന ജീവല്പ്രധാനമായ ഒരു കാര്യം കാലിഫോര്ണിയയില് ലോകത്തിലെ കുത്തക കമ്പ്യൂട്ടര്നിര്മ്മാതാക്കളും സോഫ്റ്റ്വേര്കമ്പനികളും കേരളത്തിലെ ജനങ്ങള് അറിയാതെ തീരുമാനിക്കുന്നുവെന്നത് വിവരം നിഗൂഢവത്കരിക്കുന്നതിനെ എതിക്കുന്നവരെങ്കിലും പുറത്തറിയിക്കേണ്ടതാണ്. ഭാരതീയഭാഷകളുടെ യൂനിക്കോഡ് എന്കോഡിംഗിനെക്കുറിച്ച് അഭിപ്രായം പറയാന് ഇന്ഡി മെയിലിംഗ് ലിസ്റ്റ് എന്ന ഒരു സംവിധാനം യൂനിക്കോഡ് കണ്സോര്ഷ്യത്തിനുണ്ട്. അവിടെ അഭിപ്രായം പറയാമെന്നല്ലാതെ അത് യൂനിക്കോഡ് സ്വീകരിച്ചുകൊള്ളും എന്ന വ്യവസ്ഥയൊന്നുമില്ല. തീരുമാനങ്ങള് കൈക്കൊള്ളുന്നത് അതിനായി നിയോഗിച്ചിട്ടുള്ള കമ്മിറ്റിയാണ്. മെയിലിംഗ് ലിസ്റ്റില് കേരളത്തിലെ ഭാഷാപണ്ഢിതന്മാരില് ഒരാളും ഇക്കാലത്തിനിടയില് അഭിപ്രായം പറയാന് എത്തിയിട്ടില്ല. കാരണം ലളിതമാണ്. അവര് ആരും ഈ സംവിധാനത്തെക്കുറിച്ചോ അവിടെ നടക്കുന്ന ചര്ച്ചയെക്കുറിച്ചോ അറിഞ്ഞിട്ടില്ല. കടുത്ത കമ്പ്യൂട്ടര്വിരുദ്ധനിലപാടുണ്ടായിരുന്ന കേരളത്തില് ഇന്നും മഹാഭൂരിപക്ഷം ബുദ്ധീജീവികളും കമ്പ്യൂട്ടറുമായോ ഇന്റര്നെറ്റുമായോ പരിചയം നേടിയിട്ടില്ലാത്തവരാണ്. ഇത് ഒരു ഐ.ടി പ്രശ്നം എന്ന നിലയില് ഭാഷാവിദഗ്ദ്ധരും ഇതൊരു ഭാഷാപ്രശ്നം എന്ന നിലയില് ഐ.ടി വിദഗ്ദ്ധരും കണക്കാക്കുന്നു. ചുരുക്കത്തില് കേരളത്തില് ആരുടേയും പരിഗണനയില് വരാതെ കിടന്ന പ്രശ്നമാണിത്. അതിനാല് ഇന്ഡി മെയിലിംഗ് ലിസ്റ്റില് ചര്ച്ച ചെയ്ത മലയാളഭാഷാപ്രശ്നം ലഘുവായി ഇവിടെ പരാമര്ശിക്കാം.
പ്രധാന തര്ക്കവിഷയം മലയാളത്തിലെ ചില്ലക്ഷരങ്ങള്ക്ക് പ്രത്യേകം കോഡ് പോയിന്റുകള് നല്കേണ്ടതുണ്ടോ എന്നതാണ്। പ്രത്യേകം കോഡ് പോയിന്റ് നല്കണം എന്നു വാദിക്കുവാന് കാരണം എന്ത്? പ്രത്യേകം കോഡ് പോയിന്റ് നല്കിയാല് എന്തെങ്കിലും ദോഷമുണ്ടോ? ചില്ലക്ഷരങ്ങള്ക്ക് കോഡ് പോയിന്റുകള് നല്കുന്നത് എതിര്ക്കുവാന് കാരണമെന്ത്? ഇക്കാര്യം മനസ്സിലാക്കാന് അല്പം സാങ്കേതികജ്ഞാനം ആവശ്യമാണ്.
ടൈപ്പ്റൈറ്ററിന്റേതു പോലുള്ള കീബോര്ഡാണ് കമ്പ്യൂട്ടറിനും ഉള്ളത്। എങ്കിലും പ്രവര്ത്തനരീതി വ്യത്യസ്തമാണ്. കീബോര്ഡിലെ ഒരു കീ അമര്ത്തുമ്പോള് കമ്പ്യൂട്ടറിനകത്ത് സൂക്ഷിച്ചിട്ടുള്ള വിവരങ്ങളില് നിന്ന് ആ കീയുമായി ബന്ധപ്പെടുത്തി സൂക്ഷിച്ചിട്ടുള്ള വിവരം അനുസരിച്ച് പ്രവര്ത്തിക്കുകയാണ് കമ്പ്യൂട്ടര് ചെയ്യുന്നത്. ഒരു അക്ഷരം ടൈപ്പ് ചെയ്യുമ്പോഴും സംഭവിക്കുന്നത് ഇതു തന്നെയാണ്. കമ്പ്യൂട്ടറിനകത്ത് വിവരങ്ങള് കോഡുരൂപത്തിലാണ് സംഭരിച്ചു സൂക്ഷിക്കുന്നത്. ഇതിനായി 0,1 എന്നീ സംഖ്യകളുടെ ഒരു ശൃംഖലയാണ് കമ്പ്യൂട്ടര് ആന്തരികമായി ഉപയോഗിക്കുന്നത്. ഭാരതീയഭാഷകള് കമ്പ്യൂട്ടറില് ഉപയോഗിക്കാന് ആവശ്യമായ ഇത്തരം വിവരങ്ങള് ഓരോ സോഫ്റ്റ്വേര് നിര്മ്മാതാവും സ്വന്തം യുക്തിക്ക് അനുസൃതമായി ചിട്ടപ്പെടുത്തി ഉപയോഗിക്കുകയാണ് ചെയ്തിരുന്നത്. ഇക്കാരണത്താല് കോഡുകളുടെ നിരവധി വ്യവസ്ഥകള് നിലവിലുണ്ടായിരുന്നു. അക്കാരണത്താല്, ഒരു സോഫ്റ്റ്വേര് ഉപയോഗിച്ച് മലയാളം ഉള്പ്പെടെയുള്ള ഭാരതീയഭാഷയില് ടൈപ്പുചെയ്ത ഒരു രചന മറ്റൊരു സോഫ്റ്റ്വേര് ഉപയോഗിക്കുന്ന കമ്പ്യൂട്ടറില് വായിക്കാന് സാധിക്കുമായിരുന്നില്ല. ഈ പ്രശ്നം പരിഹരിക്കണമെങ്കില് എല്ലാ കമ്പ്യൂട്ടറും ഒരേ കോഡുകള് തന്നെ ഉപയോഗിക്കണം. കമ്പ്യൂട്ടറുകള്ക്കിടയില് വിവരവിനിമയം സാധിക്കുന്നതിന് മാനകീകരിച്ച കോഡുകള് ഉപയോഗിച്ച് ഭാഷാസോഫ്റ്റുവേറുകള് നിര്മ്മിക്കേണ്ടിയിരുന്നു. കേന്ദ്രസര്ക്കാരിന്റെ ഇലട്രോണിസ് വിഭാഗം 1986-88 കാലത്താണ് ഭാരതീയഭാഷകളുടെ കോഡുകളുടെ മാനകീകരണം നടത്തിയത്. ഈ വ്യവസ്ഥ പിന്തുരുന്നതാണ് കമ്പ്യൂട്ടര് ടൈപ്പ്സെറ്റിംഗിനായി ഇന്ന് ഉപയോഗിക്കുന്ന ഭാരതീയഭാഷാ സോഫ്റ്റുവേറുകള്.
എന്നാല് ഇത് ഉപയോഗിച്ച് ഇന്റര്നെറ്റില് അനായാസമായി വിവരവിനിമയം സാധിക്കുകയില്ലായിരുന്നു। വെബ് ഫോണ്ടുകളും ബിറ്റ്സ്ട്രീം സാങ്കേതികവിദ്യയും ഉപയോഗിച്ചാണ് അക്കാലത്ത് ഇന്റര്നെറ്റില് മലയാളം ഉപയോഗിച്ചിരുന്നത്. ഓരോ പത്രവും അവരുടെ സ്വന്തം ഫോണ്ട് ഉപയോഗിക്കുന്നു. പ്രസ്തുത ഫോണ്ട് നമ്മുടെ കമ്പ്യൂട്ടറില് ഇന്സ്റ്റള് ചെയ്താലേ ആ പത്രം നമ്മുക്ക് വായിക്കാനാകൂ. നാലു പത്രം വായിക്കാന് നാല് ഫോണ്ട്!
ഫോണ്ടിനെ ആശ്രയിച്ചും അതിന്റെ സാങ്കേതികവിദ്യയ്ക്ക് വിധേയമായും ഭാഷ ഉപയോഗിക്കുന്ന പ്രയാസം ഇല്ലാതാക്കിയത് യൂനിക്കോഡ് എന്കോഡിംഗാണ്. ഒരു യൂനിക്കോഡ് ഫോണ്ട് കമ്പ്യൂട്ടറില് ഉണ്ടായാല് യൂനിക്കോഡ് കോഡിംഗ് വ്യവസ്ഥ പിന്തുടരുന്ന രചന നമ്മുക്ക് അത് തയ്യാറാക്കിയവര് ഉപയോഗിച്ച ഫോണ്ട് നമ്മള് ഉപയോഗിക്കുന്നില്ലെങ്കിലും വായിക്കാം. കോഡുകള്ക്ക് കമ്പ്യൂട്ടറിലെ ഭാഷാരചനയില് നിര്ണ്ണായകമായ പ്രാധാന്യമാണുള്ളത്. ഒരു ഭാഷയിലെ അടിസ്ഥാനാക്ഷരങ്ങള്ക്കാണ് കോഡുകള് നല്കുന്നത്. അക്ഷരങ്ങളുടെ ഇരട്ടിപ്പ്, കൂട്ടക്ഷരങ്ങള് തുടങ്ങിയവ അടിസ്ഥാനാക്ഷരങ്ങള് ചേര്ന്ന് ഉണ്ടാകുന്നവയാണ് എന്നതിനാല് അവ ഏതൊക്കെ കൂട്ടക്ഷരങ്ങള് ചേര്ന്നാണോ രൂപപ്പെടുന്നത് അവ ചേര്ത്ത് രൂപപ്പെടുത്തുയാണ് ടൈപ്പു ചെയ്യുമ്പോള് ചെയ്യുന്നത്. ഉദാഹരണമായി ത,ചന്ദ്രക്കല എന്നിവ ഉണ്ടെങ്കില് തത്ത എന്ന് ടൈപ്പ് ചെയ്യാം. ത,ത,ചന്ദ്രക്കല,ത എന്നു ടൈപ്പു ചെയ്താല് മതി. ചന്ദ്രക്കല അക്ഷരങ്ങളെ യോജിപ്പിക്കുവാനുള്ള കോഡിനെ പ്രതിനിധാനം ചെയ്യുന്നു. ചില്ലുകളും ഇങ്ങനെ ഉണ്ടാക്കിയെടുക്കുയാണ് ചെയ്യുന്നത്. കാരണം, ഓരോ ചില്ലക്ഷരവും ചില അടിസ്ഥാനാക്ഷരവുമായി ബന്ധപ്പെട്ടതാണ് എന്നതു തന്നെ.
ഭാരതീയഭാഷകളുടെ കോഡുകള് നിശ്ചയിക്കുന്ന പ്രക്രിയയില് ശ്രദ്ധേയമായ സംഭാവനയാണ് ഇസ്കി എന്കോഡിംഗ് അടിസ്ഥാനമാക്കിയ ഇസ്ഫോ കോഡില് സിഡാക്ക് നല്കിയത്। എല്ലാ ഭാരതീയഭാഷകളും അക്ഷരമാലയില് ഒരേ ക്രമം പിന്തുടരുന്നവയാണല്ലോ. അക്ഷരങ്ങളുടെ എണ്ണവും സാദൃശ്യവും ഇവയുടെ ക്രമവും എല്ലാ ഇന്ത്യന്ഭാഷകളും ഒരേ കോഡിംഗിന്റെ അടിസ്ഥാനത്തില് ഉപയോഗിക്കാമെന്ന പൂര്വ്വാനുമാനത്തിനു അടിസ്ഥാനമായി॥ അതിനാല് ഭാഷ മാറ്റി എല്ലാ ഭാരതീയഭാഷകളും ഒരേ രീതിയില് ഉപയോഗിക്കാവുന്ന ഒരു വ്യവസ്ഥ അവര് രൂപീകരിച്ചു. ഇവ ടൈപ്പ് ചെയ്യാന് എല്ലാ ഭാഷകള്ക്കും ഒരേ കീബോര്ഡ് എന്നതും അവര് യാഥാര്ത്ഥ്യമാക്കി. അതിനാല് സിഡാക്കിന്റെ ഐ എസ് എം പരമ്പരയില്പ്പെട്ട സോഫ്റ്റ്വേര് ഉപയോഗിക്കുന്ന പക്ഷം മലയാളം ടൈപ്പുചെയ്യുന്നതിനിടയില് ഭാഷ ഹിന്ദിയോ ബംഗാളിയോ മറ്റേതെങ്കിലും ഭാരതീയഭാഷയോ ആക്കി മാറ്റി ആ ഭാഷയിലെ വാക്ക് ടൈപ്പു ചെയ്യാം. അതിനു വേണ്ടി ആ ഭാഷയുടെ കീബോര്ഡ് പരിശീലിക്കേണ്ടതില്ല. ഈ കീബോര്ഡ് ലേഔട്ട് ഇന്സ്ക്രിപ്റ്റ് കീബോര്ഡ് എന്ന പേരില് അറിയപ്പെടുന്നു. ഭാരതീയഭാഷകളുടെ സ്വനപരവും ലിപിപരവുമായ സവിശേഷതകള് അടിസ്ഥാനമാക്കി ചിട്ടപ്പെടുത്തിയ യുക്തിഭദ്രവും സൗകര്യപ്രദവുമായ വ്യവസ്ഥയാണ് സിഡാക്ക് നല്കിയിട്ടുള്ളത്.
ഭാരതീയഭാഷളുടെ മാനകീകരണത്തിന് സിഡാക്ക് ഉപയോഗിച്ച വ്യവസ്ഥ അതേപടി ഉപയോഗിച്ചാണ് യൂനിക്കോഡിന്റെ കോഡുകള് നിശ്ചയിച്ചത്. അതിനാല് ചില്ല്, അക്ഷരങ്ങളുടെ ഇരട്ടിപ്പ്, കൂട്ടക്ഷരം എന്നിവ അടിസ്ഥാനാക്ഷരത്തില് നിന്നും ഉണ്ടാക്കിയെടുക്കുകയാണ് യൂനിക്കോഡില് ചെയ്യുന്നത്. നേരത്തെ ഇന്ത്യന് ഭാഷകളുടെ കോഡിനെ പ്രാവര്ത്തികമാക്കാന് ഉണ്ടാക്കിയ ഇസേ്ഫാക്ക് എന്ന എന്കോഡിംഗിന്റെ ഭാഗമായി നുക്ത എന്ന സംവിധാനം ഉപയോഗിച്ചായിരുന്നു ചില്ലുകള് ഉണ്ടാക്കിയിരുന്നത്. യൂനിക്കോഡില് സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ) എന്ന സംവിധാനമാണ് നുക്തയ്ക്കു പകരം ഉപയോഗിക്കുന്നത്. അതാവട്ടെ ഇന്ത്യന് ഭാഷകള്ക്കു മാത്രമല്ല ലോകത്തിലെ നിരവധി ഭാഷകളുടെ കാര്യത്തില് ഉപയോഗിക്കുന്ന സംവിധാനമാണ്. അടിസ്ഥാനാക്ഷരവും വിരാമ എന്ന് പേരിട്ടിരിക്കുന്ന ചന്ദ്രക്കലയും സീറോ വിഡ്ത്ത് ജോയിനറുമാണ് ചില്ലക്ഷരം ഉണ്ടാക്കിയെടുക്കാനായി ഉപയോഗിക്കുന്നത്. ഉദാഹരണമായി ന് എന്ന ചില്ലക്ഷരം ന, ചന്ദ്രക്കല, സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ) എന്നിവ ടൈപ്പു ചെയ്താണ് ഉണ്ടാക്കുന്നത്. ഇക്കാരണത്താല് അക്ഷരമാലയില് കാണുന്ന ചില്ലക്ഷരങ്ങള് മലയാളത്തിന്റെ കോഡ് പേജില് കാണില്ല. അത് അടിസ്ഥാനാക്ഷരമായല്ല ഇവിടെ പരിഗണിക്കപ്പെടുന്നത് എന്നതിനാലാണത്. ഈ രീതിക്കു പകരം ചില്ലിന് പ്രത്യേകം കോഡ് വേണം എന്നാണ് ഒരു വിഭാഗം വാദിക്കുന്നത്. ഈ വാദത്തെ മറ്റൊരു വിഭാഗം നിരവധി ന്യായങ്ങള് ഉന്നയിച്ച് എതിര്ക്കുന്നു. ഇതാണ് ഇന്ന് യൂനിക്കോഡിലെ മലയാളം എന്കോഡിംഗ് സംബന്ധമായ ഏറ്റവും വലിയ തര്ക്കം.
ഒരു ഭാഷ ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിന്റെ ഭാഗമാകുന്നതോടെ കമ്പ്യൂട്ടറിന്റെ അടിസ്ഥാനപരമായ ഭാഷാശേഷിയില് പ്രസ്തുതഭാഷകൂടി ഉള്പ്പെടുന്നുവെന്നതിനാലാണ് യൂനിക്കോഡിലെ മലയാളത്തിന്റെ കോഡുകള് വമ്പിച്ച ഒരു പ്രശ്നമാകുന്നത്. ഡി.ടി.പി യുടെ തലത്തില് നടത്തുന്ന പ്രവര്ത്തനത്തിനപ്പുറം കമ്പ്യൂട്ടര് ഉപയോഗിച്ചു ചെയ്യുന്ന എല്ലാ പ്രവര്ത്തനങ്ങള്ക്കും പ്രസ്തുതഭാഷ ഉപയോഗിക്കാം എന്നു വരുമ്പോള് തെറ്റില്ലാതെ അനായാസം ഭാഷ കൈകാര്യം ചെയ്യാനാകേണ്ടതുണ്ട്. ചില്ലക്ഷരത്തിന് പ്രത്യേക കോഡ് നല്കുകയും ഭാഷയിലെ അടിസ്ഥാനാക്ഷരമായി പരിഗണിക്കുകയും ചെയ്യുമ്പോള് സംഭവിക്കുന്ന പ്രശ്നങ്ങളെക്കുറിച്ച് ഉന്നയിക്കപ്പെട്ട വാദമുഖങ്ങള് മനസ്സിലാക്കേണ്ടത് ഇക്കാരണത്താല് പ്രാധാന്യമുള്ള കാര്യമാണ്.
യൂനിക്കോഡ് എന്കോഡിംഗ് വ്യവസ്ഥയനുസരിച്ച് കമ്പ്യൂട്ടറില് മലയാളം ടൈപ്പുചെയ്യാന് അടിസ്ഥാനാക്ഷരങ്ങളും വിരമ എന്നു പേരിട്ടിരിക്കുന്ന ചന്ദ്രക്കലയും സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ), സീറോ വിഡ്ത്ത് നോണ്ജോയിനര് (ZWNJ) എന്നീ ഒരു ക്രമീകരണങ്ങളും ഉപയോഗിക്കുന്നു। ചില്ലക്ഷരം നിര്മ്മിച്ചെടുക്കാന് സീറോ വിഡ്ത്ത് ജോയിനര് (ZWJ) ഉപയോഗിക്കുന്നതിനെക്കുറിച്ച് നേരത്തെ പറഞ്ഞിട്ടുണ്ടല്ലോ. ഓരോ അക്ഷരത്തിനും ഒരു നിശ്ചിത വലുപ്പം ഉണ്ട്. എന്നാല് അങ്ങനെയല്ലാത്തതും അക്ഷരത്തിന്റെ രൂപത്തില് മാറ്റം വരുത്തുന്നതുമായ ക്രമീകരണമാണ് ജോയിനര്. നോണ് ജോയിനര് ആവട്ടെ, പേര് സൂചിപ്പിക്കുന്നതു പോലെ അക്ഷരങ്ങള് കൂടിച്ചേരുന്നതിനെ തടയുവാനുള്ള ക്രമീകരണമാണ് എന്നു ചുരുക്കി പറയാം. ജോയിനറും നോണ് ജോയിനറും കണ്ട്രോള് ഫോര്മാറ്റിംഗ് ക്യാറക്ടേഴ്സ് ആണ് എന്നാണ് സാങ്കേതികമായി പറയുക. ടൈപ്പ് ചെയ്ത ഒരു രചനയില് അക്ഷരങ്ങള് ചെരിഞ്ഞതാക്കുക ( ഇറ്റാലിസ്), കട്ടിയുള്ളതാക്കുക (ബോള്ഡ് ഫെയ്സ്) എന്നിങ്ങനെയുള്ള കാര്യങ്ങള് ഫോര്മാറ്റിംഗിന്റെ ഭാഗമായി ചെയ്യുന്ന പ്രവര്ത്തനങ്ങളാണ്. ഇത്തരം പ്രവര്ത്തനമാണ് ജോയിനര് ചെയ്യുന്നതെന്നും അതിനാല് ചില പ്രശ്നങ്ങള് ഉണ്ടാകാനിടയുണ്ടെന്നുമാണ് ചില്ലക്ഷരത്തിന് കോഡ് പോയിന്റ് വേണം എന്നു വാദിക്കുന്നവര് ഉന്നയിക്കുന്ന പ്രധാനയുക്തി.
ഇപ്പോഴത്തെ നിലയില് യൂനിക്കോഡിന്റെ കോഡ് പേജില് വ്യവസ്ഥചെയ്യപ്പെട്ട വിധത്തില് മലയാളം തെറ്റു കൂടാതെ ഉപയോഗിക്കാന് സാധിക്കും। ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടറുകളാണ് ജോയിനറുകള് എന്നത് ഒരു നിലയിലും ഇന്നത്തെ അവസ്ഥയില് അച്ചടിയിലും വെബ്ബിലുമുള്ള ഭാഷോപയോഗത്തെ പ്രശ്നത്തിലാക്കുന്നില്ല. പത്രം അച്ചടിക്കുക, പുസ്തകങ്ങള് തയ്യാറാക്കുക എന്നിങ്ങനെയുള്ള പ്രവര്ത്തനങ്ങള്ക്കൊന്നും ഇപ്പോഴത്തെ വ്യവസ്ഥ ഒരു തടസ്സവുമല്ല. സാങ്കേതികമായ ഭാഷയില് പറഞ്ഞാല് ടെസ്റ്റ് എഡിറ്റിംഗിന്റെ തലത്തിലോ വെബ്ബിലോ ഇപ്പോള് യൂനിക്കോഡില് നിലവിലുള്ള വ്യവസ്ഥയ്ക്ക് ഒരു പ്രശ്നവുമില്ല. ഒരു ചില്ലക്ഷരം ടൈപ്പ് ചെയ്യാന് മൂന്ന് കീകള് അമര്ത്തേണ്ടിവരും എന്നു തോന്നാം. കൂട്ടക്ഷരങ്ങള്, ഇരട്ടിപ്പുകള് എന്നിവ ടൈപ്പു ചെയ്യാനും മൂന്ന് കീകള് തന്നെ ഉപയോഗിക്കുന്നു. വേണമെങ്കില് ഇത് കീബോര്ഡ് വിന്യസനത്തില് പരിഹരിക്കാവുന്ന പ്രശ്നം മാത്രമാണ്. അത് പരിഹരിച്ചിട്ടുമുണ്ട്. ഉദാഹരണമായി, ഐടി @ സ്കൂള് ഉപയോഗിക്കുന്ന ഡബിയാന് ലിനക്സിന്റെ കസ്റ്റമൈസ്ഡ് വേര്ഷനില് നുക്ത എന്ന് ഇന്സ്ക്രിപ്റ്റ് കീബോര്ഡില് വിളിക്കുന്ന ഒരു കീയില് ചില്ല് രൂപപ്പെടുത്തുവാന് ക്രമപ്പെടുത്തിയിട്ടുണ്ട്. മലയാളത്തിന്റെ കാര്യത്തില് കീബോര്ഡില് ഓരോ അക്ഷരത്തിനും സുനിശ്ചിതമായ സ്ഥാനം എന്നത് വളരെ ഗുരുതരമായ പ്രശ്നമല്ല. നിലവില് ഏറ്റവുമധികം പ്രൊഫഷനല് ടൈപ്പിസ്റ്റുകള് ഉപയോഗിക്കുന്നത് സിഡാക് എന്ന സ്ഥാപനം ചിട്ടപ്പെടുത്തിയ ഇന്സ്ക്രിപ്റ്റ് കീ ബോര്ഡാണ്. അതില് മാത്രമേ നുക്ത എന്ന സങ്കല്പം തന്നെയുള്ളൂ. വിദേശമലയാളികള് മഹാഭൂരിപക്ഷവും ട്രാന്സ്ലിറ്ററേഷന് കീബോര്ഡ് എന്ന ഒരു ക്രമീകരണമാണ് പിന്തുടരുന്നത്. അതാകട്ടെ, ഇംഗ്ലീഷില് ടൈപ്പ് ചെയ്താല് മലയാളം കിട്ടാവുന്ന ക്രമീകരണമാണ്. അതില് തന്നെ നിരവധി വ്യത്യസ്തങ്ങളായ രീതികള് നിലവിലുണ്ട്.
ചില്ലക്ഷരത്തിന് കോഡ് പേജില് അടിസ്ഥാനാക്ഷരങ്ങളോടൊപ്പം സ്ഥാനം വേണം എന്ന് വാദിക്കുന്നവര് ചില ഉദാഹരണങ്ങള് കാണിച്ചാണ് തങ്ങളുടെ വാദമുഖം അവതരിപ്പിക്കുന്നത്। അതില് പ്രധാനം വന്യവനിക - വന്യവനിക എന്ന ദ്വന്ദമാണ്. വലിയ യവനിക എന്ന അര്ത്ഥത്തിലുള്ള ആദ്യത്തെ വാക്കും അതല്ലാത്ത അര്ത്ഥമുള്ള രണ്ടാമത്തെ വാക്കും (എന്താണ് അതിന്റെ അര്ത്ഥമെന്ന് എനിക്ക് മനസ്സിലായിട്ടില്ല. വന്യമായ വനിക എന്നാല് എന്തായിരിക്കാം?) ടൈപ്പു ചെയ്യുമ്പോള് ഉള്ള വ്യത്യാസം ആദ്യത്തെ വാക്കില് ന, ചന്ദ്രക്കല എന്നിവയ്ക്കു ശേഷം ZWJ ഉണ്ട് എന്നതാണ്. എന്നാല് ഇത് അവഗണിക്കപ്പെടുന്ന ഒരു സന്ദര്ഭം ഉണ്ടെങ്കില് ഈ രണ്ട് വാക്കുകളും തമ്മില് യാതൊരു വ്യത്യാസവും ഉണ്ടാകില്ല. കാരണം ന, ചന്ദ്രക്കല, യ എന്നിവ ചേര്ന്നാല് ന്യ എന്നാണ് കമ്പ്യൂട്ടര് കാണിക്കുക. ഇതു പോലെ വേറെ ചില ദ്വന്ദങ്ങളും വാദത്തിന് ഉപോദ്ബലകമായി അവര് അവതരിപ്പിക്കുന്നുണ്ട്. മന്വിക്ഷോഭം - മന്വിക്ഷോഭം(മന: + വിക്ഷോഭം എന്നത് എങ്ങനെയാണ് ഈ പദമാകുന്നത് എന്ന് എനിക്ക് മനസ്സിലായിട്ടില്ല), കണ്വലയം - കണ്വലയം (കണ്വലയത്തിന് എന്താണ് അര്ത്ഥം എന്നും മനസ്സിലായിട്ടില്ല) എന്നിവയാണ് പ്രശസ്തമായ ഉദാഹരണങ്ങള്. ഉദാഹരണമായി കാണിച്ച പദങ്ങളില് പലതും മലയാളത്തില് നിരര്ത്ഥകങ്ങളും കുസന്ധികളുമാണ്. എന്നിരുന്നാലും വാദത്തിന് ഈ ഉദാഹരണങ്ങള് സ്വീകരിച്ച് പരിശോധിക്കാവുന്നതാണ്. ഇതില് എല്ലാ സന്ദര്ഭത്തിലും അനൈച്ഛികമായ അക്ഷരസംയോഗം ഉണ്ടാകുന്നത് തടയാന് സാധിക്കും. അനൈച്ഛികമായ അക്ഷരസംയോഗമാണ് ഇവിടങ്ങളിലെല്ലാം സംഭവിക്കുന്നത്. താഴ്വാരം എന്ന വാക്ക് ടൈപ്പു ചെയ്യുമ്പോള് താഴ്വാരം എന്നാവാതിരിക്കാന് ഴ, ചന്ദ്രക്കല എന്നിവയ്ക്കു ശേഷം ZWNJ ടൈപ്പു ചെയ്യേണ്ടതാണ്. നോണ്ജോയിനര് അക്ഷരങ്ങള് കൂടിച്ചേരുന്നത് തടയും. ജോയിനര് ഇടയില് ഉള്ളിടത്തോളം ഇങ്ങനെ അനൈച്ഛികപദസംയോഗം സംഭവിക്കുകയുമില്ല. ജോയിനര് ഉപയോഗിക്കാതിരുന്നാലേ പ്രശ്നം ഉണ്ടാകുന്നുള്ളൂ. ആകയാല് ജോയിനറുകള് ഉപയോഗിക്കുന്ന രീതി അനുവര്ത്തിച്ചാല് നേരത്തെ ചൂണ്ടിക്കാണിച്ച ഉദാഹരണദ്വന്ദങ്ങളിലെ അനൈച്ഛികപദസംയോഗം തടയാവുന്നതാണ്. ഇത് ചില്ലക്ഷരത്തിന് കോഡ് പേജില് സ്ഥാനം വേണം എന്ന വാദത്തിന് മതിയായ ന്യായീകരണമാകുന്നില്ല. മലയാളത്തില് നിരര്ത്ഥകമായ വാക്കുകള് കാണിച്ചുള്ള ഈ യുക്തിവാദത്തിന് യാതൊരു സാധൂകരണവുമില്ല.
മലയാളം ടൈപ്പ് ചെയ്യുമ്പോള് ജോയിനറുകളുടെ ഉപയോഗം ഒഴിച്ചുകൂടാനാകാത്തതാണ്। ലോസഭ എന്ന വാക്ക് ടൈപ്പു ചെയ്യുമ്പോള് ലോക്സഭ എന്നാവാതിരിക്കാന്, ശ്രേയാംസ്കുമാര് എന്നത് ശ്രേയാംസ്കുമാര് എന്നാവാതിരിക്കാന് ZWNJ മലയാളത്തില് ഉപയോഗിക്കേണ്ടി വരും. ഇവിടെ ചില്ലക്ഷരമില്ല എന്നത് ശ്രദ്ധിക്കുക. ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടേഴ്സ് എന്നു കണക്കാക്കി അവഗണിക്കാനാകാത്ത പ്രാധാന്യം മലയാളത്തിന്റെ കാര്യത്തില് ZWJ, ZWNJ എന്നിവയ്ക്കുണ്ട് എന്ന് ഇതില് നിന്ന് മനസ്സിലാക്കാവുന്നതാണ്. അങ്ങനെയല്ലെങ്കില് വരാവുന്ന ചില മാതൃകകള് കാണിക്കാം: ജോസേ്താമസ്, രമേശ്ചെന്നിത്തല. പേരിനും സര്നെയിമിനുമിടയില് ഒരു സെ്പയ്സ് ഇടുന്നില്ലെങ്കില് ഈ പേരുകള് ഇങ്ങനെയാകും രൂപപ്പെടുക.
ചില്ലുകള്ക്ക് പ്രത്യേകം കോഡ് പോയിന്റ് നല്കണം എന്ന് വാദിക്കാന് കാരണം അവയ്ക്ക് സ്വതന്ത്രമായ നില്പില്ല എന്നതാണ്। അവ ഫോര്മാറ്റിംഗ് ക്യാരക്ടറുകളെ ആശ്രയിച്ചാണ് നില്ക്കുന്നത്. ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടറുകള്ക്ക് പരിമിതമായ സ്ഥാനമേയുള്ളൂ എന്നും അവഗണിക്കാവുന്നത് എന്ന് ഒരു ആപ്ലിക്കേഷന് ഇതിനെ പരിഗണിക്കാം എന്നുമുള്ള മുന്വിധിയില് നിന്നാണ് ഈ വാദമുഖം അവതരിപ്പിച്ചിട്ടുള്ളത്. സെര്ച്ച് എന്ജിനുകള് സാധാരണനിലയില് ഇറ്റാലിസ്, ബോള്ഡ് എന്നിങ്ങനെയുള്ള ഫോര്മാറ്റിംഗ് ഘടകങ്ങളെ അവഗണിക്കുകയാണ് പതിവ്. ഈ വാദം യുക്തിസഹമാണ് എന്ന് ഇതിന്റെ അടിസ്ഥാനത്തില് തോന്നാവുന്നതാണ്. എന്നാല് ലോകത്തിലെ പല ഭാഷകളും ഫോര്മാറ്റ് കണ്ട്രോള് ക്യാറക്ടറുകള് ഉപയോഗിക്കുന്നുണ്ട് എന്നതിനാല് അവയെ മലയാളത്തിന്റെ കാര്യത്തില് മാത്രം ഒരു ആപ്ലിക്കേഷന് അവഗണിക്കാവുന്നവ എന്ന് മാറ്റി നിറുത്താന് സാദ്ധ്യമല്ല.
ഫോര്മാറ്റിംഗ് കണ്ട്രോള് ക്യാറക്ടറുകള് അവഗണിക്കപ്പെടാവുന്നവയായി പരിഗണിക്കപ്പെടും എന്നു കണക്കാക്കി ചില്ലിന് യൂനിക്കോഡ് കോഡ് പേജില് സ്ഥാനം നല്കിയാല് അത് പ്രശ്നം പരിഹരിക്കുകയല്ല കൂടുതല് പ്രശ്നങ്ങള് സൃഷ്ടിക്കുകയാണ് ചെയ്യുക। യൂനിക്കോഡിന്റെ വ്യവസ്ഥയനുസരിച്ച് ഒരിക്കല് ചെയ്ത വ്യവസ്ഥ പിന്നീട് മാറ്റുകയില്ല. അതിനാല് ജോയിനറുകള് ഉപയോഗിച്ചും ചില്ലുകള്ക്കായി നല്കിയിട്ടുള്ള പുതിയ കോഡ് ഉപയോഗിച്ചും ചില്ലക്ഷരം ടൈപ്പു ചെയ്യാന് സാധിക്കുന്ന അവസ്ഥയാണ് ഇതിന്റെ ഫലമായി ഉണ്ടാവുക. ഒരു അക്ഷരത്തിന് രണ്ടു കോഡുകള് എന്ന അവസ്ഥയാണത്. കോഡുകള് മാനകീകരിക്കുന്നതും അത് എല്ലാവരും ഒരു പോലെ പിന്തുടരുകയും ചെയ്യുന്നത് അതോടെ അവസാനിക്കും. ചില്ലക്ഷരം പലര് പലരീതിയില് ടൈപ്പു ചെയ്യുന്നത് അച്ചടിയുടെ തലത്തില് ഒരു ഗുരുതരമായ പ്രശ്നമല്ല. എന്നാല് ഇന്റര്നെറ്റ് കാലത്തെ ഭാഷാപ്രയോഗം അച്ചടിക്കാലത്തിലേതില് നിന്ന് വ്യത്യസ്തമായി നിരവധി മണ്ഡലങ്ങളില് വ്യാപിച്ചു കിടക്കുന്നതാണ്. അവിടെയെല്ലാം രണ്ട് രീതിയില് ചില്ലക്ഷരം ഉണ്ടാക്കാവുന്ന അവസ്ഥയുണ്ടാകും. യൂനിക്കോഡിന്റെ നയം അനുസരിച്ച് നേരത്തെയുണ്ടായിരുന്ന കോഡുകള് അതേ പടി നിലനിറുത്തുകയാണ് അവര് ചെയ്യുകയെന്ന് നേരത്തെ പറഞ്ഞല്ലോ. അതിനാല് ഞാന് എന്ന വാക്ക് രണ്ട് രീതിയില് ടൈപ്പു ചെയ്യാനാകും. ഞ, ദീര്ഘം, ന, ചന്ദ്രക്കല, ZWJ എന്ന് ഒരാളും വേറൊരാള് ഞ, ദീര്ഘം, ചില്ല് ന് എന്നും. രണ്ടും കാഴ്ചയില് ഒരു പോലെയാണെങ്കിലും കമ്പ്യൂട്ടറിന്റെ ആന്തരികമായ വിവരത്തില് ഇത് രണ്ട് വാക്കുകളായിരിക്കും. അര്ത്ഥവ്യത്യാസമില്ലാതെ ഒരു വാക്ക് രണ്ടു രീതിയില് എഴുതുന്ന എഴുത്തു രീതി ഇന്ന് മലയാളത്തില് നിലവിലുണ്ട്. പുതിയലിപിയുടെ അടിസ്ഥാനത്തില് നിലവില് വന്ന പ്രസ്തുതരീതി ഇന്റര്നെറ്റ് കാലത്ത് മലയാളത്തിന്റെ അന്തകനായിത്തീരും.
ഇന്റര്നെറ്റുകാലത്തെ മലയാളത്തിന് ടൈപ്പ്റൈറ്റിംഗ് കാലത്തിലേതില് നിന്ന് വ്യത്യസ്തമായ പല ധര്മ്മങ്ങളും നിര്വ്വഹിക്കാനുണ്ട്। ഇന്റര്നെറ്റിലെ വെബ്ബ് വിലാസം മലയാളത്തില് നല്കാനാകുന്ന സാഹചര്യം ഇതില് ഒന്നാണ്. ഇവിടെ കൃത്യത പാലിക്കാനാകാത്ത ഒരു ഭാഷ ഈ മണ്ഡലത്തില് വമ്പിച്ച പ്രശ്നങ്ങള് സൃഷ്ടിക്കും. ഒരു ഉദാഹരണത്തിലൂടെ ഇത് വ്യക്തമാക്കാം. ഞാന് ഡോട്ട് കോം എന്ന പേരില് ഒരാള് വെബ് വിലാസം ഉണ്ടാക്കുന്നവെന്നു കരുതുക. യുനിക്കോഡില് ഇപ്പോഴുള്ള വ്യവസ്ഥയനുസരിച്ച് ZWJ ഉപയോഗിച്ചായിരിക്കും ആ വിലാസം ഉണ്ടാക്കിയിരിക്കുക. ചില്ലിന് കോഡ് പോയിന്റ് നിലവില് വന്നാല് മറ്റൊരാള്ക്ക് അതേ വിലാസം ചില്ലിന്റെ കോഡ് ഉപയോഗിച്ച് ഉണ്ടാക്കാനാകും. രണ്ടും കാഴ്ചയില് ഒരേ പേരാണ്. എന്നാല് കമ്പ്യൂട്ടറിന്റെ ആന്തരികമായ വ്യവസ്ഥയില് രണ്ടും വ്യത്യസ്തമാണ് എന്നതിനാല് ഇങ്ങനെ ഒരു വ്യാജനെ സൃഷ്ടിക്കുക എളുപ്പമാണ്. ചില്ലക്ഷരമുള്ള ഏത് വിലാസത്തിനും ഇങ്ങനെ വ്യാജന്മാര് വരാവുന്നതാണ്. കേരളസര്ക്കാര് എന്ന പേരിലുള്ള വെബ് സൈറ്റ് നാലു രീതിയില് റജിസ്റ്റര് ചെയ്യാന് സാധിക്കും. സര്ക്കാര് സെറ്റിന്റെ വ്യാജന് ഉണ്ടായാല് സംഭവിക്കാവുന്ന അപകടം വിസ്തരിക്കേണ്ടതില്ല. ഇങ്ങനെ വ്യാജന്മാരെ സൃഷ്ടിച്ച് വെബ്ബ് തെരയുന്നവരെ വഴിതെറ്റിച്ച് കൊണ്ടുപോകുന്ന രീതി ഇംഗ്ലീഷിന്റെയും മറ്റു ഭാഷകളുടേയും കാര്യത്തില് ഇപ്പോള് തന്നെ നിലവിലുണ്ട്. ഇതിനെ സ്പൂഫിംഗ് എന്നാണ് പറയുക. ഇങ്ങനെ ചെയ്യുന്നതിലൂടെ ഇന്റര്നെറ്റില് തെരയുന്ന ഒരാളെ വഴിതെറ്റിക്കുന്നതിനപ്പുറം നിയമവിരുദ്ധമായ പ്രവര്ത്തനങ്ങളാണ് സ്പൂഫ് ചെയ്യുന്നവര് നടത്തുന്നത്.ചില്ലിന്റെ കോഡു ഉപയോഗിച്ച് അങ്ങനെ ചെയ്യാവുന്ന അവസ്ഥ തടയുക എന്നത് മലയാളത്തിന്റെ ആവശ്യമാണ്.
ബാങ്കിംഗ് ഉള്പ്പെടെയുള്ള രംഗത്ത് ഇക്കാരണത്താല് തന്നെ പലരീതിയില് എഴുതുന്ന ഭാഷ ഉപയോഗിക്കാന് സാദ്ധ്യമാവില്ല। സെക്യൂറിറ്റി ആവശ്യമായ ഒരു പ്രവര്ത്തനവും ഡുവല് എന്കോഡിംഗ് എന്ന പേരില് അറിയപ്പെടുന്ന ഇരട്ട എഴുത്തു സാദ്ധ്യമാകുന്ന ഭാഷയില് നിര്വ്വഹിക്കുവാന് സാദ്ധ്യമല്ല. വ്യാജവിലാസം ഉപയോഗിച്ച് അക്കൗണ്ടുകളില് വ്യാജന്മാര് നുഴഞ്ഞുകയറിയാല് എന്തു തന്നെ സംഭവിക്കുകയില്ല! ചുരുക്കിപ്പറഞ്ഞാല് ഇന്റര്നെറ്റുകാലത്തെ മലയാളം പുതിയലിപിക്കാലത്തെ അവ്യവസ്ഥിതത്വം താങ്ങാനാകാത്ത ഭാഷയാണ്. അതിനാല് ഭാഷയുടെ കോഡ് പേജില് ഇപ്പോള് നിലനില്ക്കുന്ന പ്രശ്നരഹിതമായ അവസ്ഥയില് നിന്ന് പ്രശ്നസങ്കുലമായ അവസ്ഥയിലേക്ക് പോകേണ്ടതുണ്ടോ എന്നതാണ് ഇപ്പോള് ഈ വിവാദങ്ങളുടെ പശ്ചാത്തലത്തിലുള്ള കാതലായ ചോദ്യം.
ചില്ലക്ഷരത്തിന് കോഡ് പോയിന്റ് നിശ്ചയിച്ചാല് ഉണ്ടാകുന്ന പ്രശ്നം വിദ്യാര്ത്ഥികളുടെ സന്ദേഹത്തിനപ്പുറം പ്രാധാന്യമുള്ളതാണ്. കൃത്യമായി പറഞ്ഞാല് പുതിയലിപി മലയാളഭാഷയില് ഉണ്ടാക്കിയതിന്റെ നൂറ് മടങ്ങ് പ്രശ്നം അത് സൃഷ്ടിക്കും. ടൈപ്പ് റൈറ്റിംഗ് മെഷീനിനു വേണ്ടി ഉണ്ടാക്കിയ ലിപിസമ്പ്രദായം മലയാളത്തിന്റെ ലിപിയായി ഔദ്യോഗികമായി സര്ക്കാര് ഉത്തരവിലൂടെ അംഗീകരിക്കപ്പെട്ടുവെങ്കിലും ഇന്ന് അത് എവിടെയും നിലവിലില്ല. മലയാളത്തിലെ ഏറ്റവും പ്രധാനപ്പെട്ട പത്രങ്ങളില് ഒന്നായ മാതൃഭൂമി പുതിയലിപിയിലെ ഉകാരം മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ. ഋ കാരം ഉള്പ്പെടെ എല്ലാ അക്ഷരങ്ങളും അതിന്റെ തനതുരൂപത്തില് വീണ്ടെടുക്കാന് മാതൃഭൂമിക്ക് സാധിച്ചു. എന്നു മാത്രമല്ല വായനാസമൂഹം ഒരു എതിര്പ്പുമില്ലാതെ അത് സ്വീകരിക്കുകയും ചെയ്തു.
ഇക്കാര്യത്തില് കൗതുകാവഹമായ ഒരു സംഭവം ഉണ്ട്। സമകാലീനമലയാളം വാരികയില് പ്രസിദ്ധീകരിച്ചിരുന്ന സാഹിത്യവാരഫലം എന്ന പംക്തി മലയാളത്തിന്റെ തനതുലിപിയില് പ്രസിദ്ധീകരിച്ചു കാണാന് എഴുത്തുകാരനായ പ്രൊഫ. എം. കൃഷ്ണന്നായര് ആഗ്രഹം പ്രകടിപ്പിച്ചതിന്റെ അടിസ്ഥാനത്തില് പ്രസാധകര് അത് തനതുലിപിയിലേക്ക് മാറ്റി. ഈ മാറ്റം വലിയ ആകര്ഷണമാകുമെന്ന് പത്രാധിപസമിതി പ്രതീക്ഷിച്ചുവെങ്കിലും വായനക്കാരില് നിന്നും ഒരു പ്രതികരണവും ഉണ്ടായില്ലത്രെ. കാരണം ലിപി വിഷയത്തില് മലയാളികള് തനതുലിപി സ്വാഭാവികം എന്ന നിലയില് സ്വീകരിക്കുന്നുവെന്നതാണ്. മറ്റൊരു ഉദാഹരണം കൂടി പറയാം: വൃത്തസഹായി എന്ന പേരില് വൃത്തം കണ്ടുപിടിക്കാന് സഹായിക്കുന്ന ഒരു സോഫ്റ്റ്വേര് അമേരിക്കയില് ജോലി ചെയ്യുന്ന സുഷെന് കുമാര്, സഞ്ജീവ്കുമാര് എന്നിവര് ചേര്ന്ന് ഉണ്ടാക്കിയിട്ടുണ്ട്. അതിന്റെ നിര്ദ്ദേശം ഇതില് പുതിയലിപി ഉപയോഗിക്കരുത് എന്നാണ്. മാത്രമല്ല, വിസര്ഗ്ഗം, സംവൃതോകാരം എന്നിവയെല്ലാം ഉപയോഗിക്കണമെന്നുകൂടിയാണ്. അല്ലെങ്കില് മാത്ര ഗണിക്കാനാകാതെ വരികയും വൃത്തം നിര്ണ്ണയിക്കുന്നതില് പിഴവ് സംഭവിക്കുകയും ചെയ്യും. ലിപിപരിഷ്കരണത്തിന്റെ ഭാഗമായി തകര്ത്തെറിയപ്പെട്ടത് ഭാഷയുടെ ആന്തരികമായ യുക്തിയാണ് എന്നു മനസ്സിലാക്കാന് വൃത്തശാസ്ത്രത്തെക്കുറിച്ചുള്ള ഈ നിര്ദ്ദേശം സഹായകമാകും. മലയാളഭാഷയുടെ ആന്തരമായ യുക്തിയെ തകര്ത്ത് കൃത്രിമമായി ഉണ്ടാക്കിയ പുതിയലിപി ഇന്റര്നെറ്റ് കാലത്ത് സ്വാഭാവികമായിത്തന്നെ കാലഗതിയടഞ്ഞു. ബ്ലോഗെഴുത്തുകാരും വിക്കിപീഡിയ എഡിറ്റു ചെയ്യുന്നവരും ചിന്ത.കോമിലെ തര്ജ്ജനി മാസിക വായനക്കാരും ഉപയോഗിക്കുന്നത ഒന്നുകില് അഞ്ജലി ഓള്ഡ് ലിപിയോ രചനW01 എന്ന ഫോണ്ടോ ആണ്. ഇതു രണ്ടും മലയാളത്തിന്റെ തനതുലിപിസഞ്ചയം ഉപയോഗപ്പെടുത്തുന്ന ഫോണ്ടുകളാണ്.
ഇന്റര്നെറ്റു കാലത്തെ മലയാളം അച്ചടിക്കാലത്തെ ആധിപത്യങ്ങളെ നിരാകരിച്ച് സ്വതന്ത്രമായി മുന്നേറുന്ന ഘട്ടത്തിലാണ് യൂനിക്കോഡില് ഇപ്പോള് നിലവിലുള്ള കോഡ് പേജില് ചില്ലക്ഷരങ്ങള്ക്കും സ്ഥാനം വേണം എന്ന വാദം ഉയരുന്നത്. ഇത് ന്യായമായും സംശയാസ്പദമായിത്തീരുന്നു. ചില്ലിന് കോഡ് പോയിന്റ് വേണം എന്നു വാദിക്കുന്നവര് പല ന്യായങ്ങളും പല രീതിയില് ഉന്നയിക്കുന്നവെങ്കിലും എന്താണ് ഇതു കൊണ്ട് പ്രയോജനം എന്ന ചോദ്യത്തിനു മുമ്പില് മൗനികളാണ്. ഏത് പ്രശ്നമാണ് അത് പരിഹരിക്കുക എന്നതിനും ഉത്തരമില്ല. അത് വേറെ പ്രശ്നങ്ങളുണ്ടാക്കുമെങ്കില് അതിനെന്തു പ്രതിവിധി എന്നതിനും ഉത്തരമില്ല. ഇന്ഡിക് മെയിലിംഗ് ലിസ്റ്റിലും ബ്ലോഗിലും നടന്ന ചര്ച്ചകള് അവസാനം വരെ കാത്തിരുന്നു വായിച്ച ഒരാള് എന്ന നിലയില് ചില്ലക്ഷരത്തിന്റെ എന്കോഡിംഗ് എന്തിനെന്ന് എനിക്ക് മനസ്സിലാക്കാനായിട്ടില്ല. ഒരു പ്രശ്നവും പരിഹരിക്കാതിരിക്കുകയും പുതിയ പ്രശ്നങ്ങള് സൃഷ്ടിക്കുകയും ചെയ്യും ചില്ലിന്റെ എന്കോഡിംഗ് എന്നാണ് ഞാന് ഈ സംവാദങ്ങളില് നിന്ന് മനസ്സിലാക്കിയിട്ടുള്ളത്.