ஒருங்குறி குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள்

இன்று ஒருங்குறி குறியாக்கத்தில் அமைந்த தமிழ்த் தளம் ஒன்றில் Firefox உலாவி கொண்டு தேடுகையில் பின்வரும் வழுவைக் கண்டேன்.

உண்ட என்று தேடினால் உண்டு, உண்டான் உண்ட் என்ற எல்லா உண்+டகர வரிசைச்சொற்களையும் காட்டுகிறது. ஒருங்குறி குறியாக்கத்துக்கு  டா, டு, டி இவையெல்லாம் வேறு வேறு எழுத்துக்கள் என்று தெரியவில்லை. 

ஒருங்குறி குறியாக்கம் கணினியில் தமிழைக் காட்ட உதவும் அளவு கணித்தல் வேலைகளைச் செய்ய உதவவில்லை. எடுத்துக்காட்டுக்கு, திருக்குறளில் எத்தனை இடங்களில் உண்ட என்று வருகிறது என்று கணிக்க வேண்டுமானால் ஒருங்குறி குறியாக்கம் உதவப் போவதில்லை. match whole word என்று சொன்னால் தான் கொஞ்சமாவது துல்லியமான முடிவு கிடைக்கும். அதுவும் செய்யுள்களில் உரைநடை போல் ஒவ்வொரு சொல்லும் தெளிவாக முடியாமல் அடுத்த சொல்லுடன் இணைந்து இருக்கும் என்பதால், match whole word பல இடங்களில் உதவாமல் போகலாம்.

ஒரு ஆவணத்தில் பல இடங்களில் உள்ள ஒரே பிழையைக் கண்டு replace all கொடுக்கும்போதும் சிக்கல் வரும். எடுத்துக்காட்டுக்கு,
உண்ட உண்டு உண்டா என்று எழுதி

உண்ட வரும் இடங்களில் எல்லாம் உண்டா என்று மாற்றச் சொன்னால்,

உண்டா உண்டாு உண்டாா என்று தான் மாற்றங்கள் வரும்.

இந்த இடத்தில் match whole word only என்று கொடுக்க மறக்காமல் இருந்தால் சரியான முடிவுகள் வரும். ஆனால், இதுவும் செய்யுளில் உதை வாங்கலாம்.

ஒருங்குறி் குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள், போதாமைகள் குறித்த அதிகாரப்பூர்வ விளக்கங்கள் இங்கு.

இந்தப் போதாமைகளில் சிலவற்றை வேறு இடங்களிலும் பார்த்த நினைவு. ஆனால், ஒரு குறிப்புக்காக இங்கு பதிகிறேன்.

தொடர்புடைய சில இடுகைகள்:

* ஒருங்குறிச் செருப்பு.

* கீதா கயீதா ஆன கதை.

* தமிழ் ஒருங்குறி – தேட்டைச் சிக்கல்

* தமிழ் எழுத்துக்கள் வரிசைப்படுத்தல்.

ஒருங்குறி, எ-கலப்பை, விசைப்பலகை – ஒரு குட்டிக் கதை

பலரிடமும் நீங்கள் எந்த விசைப்பலகையில் கணினியில் தமிழில் எழுதுகிறீர்கள் என்று கேட்டால், “எ-கலப்பை” அல்லது “ஒருங்குறித் தமிழ்” என்று பதில் வருகிறது. குறியேற்றம் வேறு, மென்பொருள் வேறு, விசைப்பலகை வேறு என்ற புரிதல் வியக்கத்தக்க அளவில் மிகக் குறைவாகவே இருக்கிறது.

இது குறித்து தெளிவாக, விரிவாகப் புரிந்து கொள்ள மயூரனின் கட்டுரையைப் படிக்கப் பரிந்துரைக்கிறேன்.

தற்போதைக்கு, இது குறித்து எளிமையாக விளக்க ஒரு குட்டிக் கதை / உவமை இருந்தால் நன்றாக இருக்குமே என்று யோசித்துப் பார்த்தேன் 🙂

குறிப்பு ஒன்றை எழுதி, அதை ஒரு பெட்டிக்குள் வைத்துப் பூட்டி, அதை ஊர்ப் பொதுவில் வைத்து விடுகிறீர்கள் என்று வைத்துக் கொள்வோம். ஒவ்வொருவரும் பெட்டியைத் தனித்தனியாகத் தான் படிக்க முடியும்; அதுவும் ஒவ்வொருவரிடமும் சாவி இருக்க வேண்டும். உங்கள் பூட்டுக்கான சாவியை ஒவ்வொருவருக்கும் தர வேண்டிய பொறுப்பு உங்களைச் சேர்கிறது. சாவி இல்லாதவர்கள், நீங்கள் சாவி செய்து தரும் வரை பொறுமை இல்லாதவர்கள் பெட்டியைத் திறக்காமலேயே போய் விடுவார்கள்.

நீங்கள் எழுதும் குறிப்பை மூன்று முறைகளில் எழுதலாம்:

– கரித்துண்டு – தாள் முறை.

– marker பேனா – தாள் முறை.

– fountain பேனா – தாள் முறை.
——————————–
உவமைகள் போதும். இனி உவமேயங்களைப் பார்ப்போம்.
——————————–

தமிங்கில விசைப்பலகை – கரித்துண்டு.

பழைய-புதிய தட்டச்சு விசைப்பலகை, பாமினி விசைப்பலகை – marker பேனா.

தமிழ் 99 விசைப்பலகை – fountain பேனா.

குறியேற்றம் (encoding), decoding – பூட்டும் சாவியும்.

பல்வகைப் பேனா தயாரிப்பாளர் – எ-கலப்பை, சுரதா, தமிழ்விசை நீட்சி.

இப்பொழுது பின் வரும் கேள்விக்கு பதில்களைப் பாருங்கள்:

1. எப்படி தமிழ் எழுதுகிறீர்கள்?

விடை: fountain பேனா / கரித்துண்டு கொண்டு எழுதுகிறேன் என்று சொல்வது போல் தமிழ்99 விசைப்பலகை / தமிங்கிலத் தட்டச்சு விசைப்பலகை கொண்டு எழுதுகிறேன் என்று எளிதாக சொல்லலாம் அல்லவா?

எ-கலப்பை என்பது கடைக்காரர் பெயர். ஒருங்குறி என்பது பூட்டு சாவி பெயர். பூட்டு, சாவி, கடைக்காரரைக் கொண்டு எழுத முடியாது அல்லவா? அது போலவே எ-கலப்பையில் தமிழ் எழுதுகிறேன், ஒருங்குறி முறையில் தமிழ் எழுதுகிறேன் என்று சொல்வதும் தவறு.

2. எந்த விசைப்பலகை சிறந்தது?

<<இது ஒரு தமிழ்99 விழிப்புணர்வு விளம்பரம். ஏற்கனவே தமிழ்99 பயன்படுத்துபவர்கள், இந்த விடையைப் படிக்க அவசியமில்லை 😉 >>

உங்களுக்கு முதன் முதல் எழுதக் கற்றுக் கொடுத்தவர் கரித்துண்டு கொண்டே எழுதக் கற்றுக் கொடுத்தார் அல்லது அவசரத்துக்கு கரித்துண்டு தான் முதலில் கிடைத்தது என்று வைத்துக் கொள்வோம். அதே வேளை தினமும் நீங்கள் பல பக்கங்கள் இப்படி குறிப்புகள் எழுத வேண்டுமானால், இப்படி எத்தனை காலத்துக்கு கரித்துண்டு வைத்து வசதிக்குறைவாக எழுதுவீர்கள் சொல்லுங்கள்? நீங்கள் கற்றுக் கொண்ட முறை பிழை, திறன் குறைந்தது என்று அறியும்போது அதை மாற்றிக் கொள்ள வேண்டும் தானே? கரித்துண்டு மட்டுமே பார்த்தவருக்கு fountain பேனா கொண்டு தாளில் எழுதுவதின் எளிமை புரியாது. பயன்படுத்திப் பாருங்கள். புரியும். தமிழுக்கென சிறப்பாக விசைப்பலகை இல்லாத / தெரியாத காலத்தில், அவசரத்துக்குப் பயின்ற முறை தமிங்கிலத் தட்டச்சு முறை. தமிழுக்கு என்று தனி சிறப்பான விசைப்பலகை இருப்பது அறிந்த பிறகும் கற்கால முறையிலேயே இருப்பது தகுமா?

Marker பேனா கொண்டு தாளில் எழுதுவது கரித்துண்டு கொண்டு எழுதுவதைக் காட்டிலும் எளிது தான். ஆனால், marker பேனா தாளில் எழுதுவதற்காக வடிவமைக்கப்பட்டது அல்ல என்பதை நினைவில் கொள்ளுங்கள். அது போலவே பழைய-புதிய தட்டச்சு முறை தட்டச்சுப் பொறிக்காக வடிவமைக்கப்பட்டது. கணினிக்காக அல்ல. எனவே, தட்டச்சுப் பொறி விசைப்பலகையின் தேவையற்ற வசதிக் குறைவுகளை அப்படியே கணினிக்கும் கொண்டு வர வேண்டும் என்று இல்லை. பாமினி போன்ற பிற விசைப்பலகை முறைகள் கணினியில் உள்ள விசைகள் அமைப்பைக் கருத்தில் கொண்டு வடிவமைக்கப்படவில்லை. அவற்றின் உருவாக்கமும் அடிப்படையும் குறியேற்றங்களைப் பின்பற்றி வந்தது. எனவே, marker பேனா வகையறாக்கள் யாவும் கணினி / தமிழுக்கென தனிச்சிறப்பாக வடிவமைக்கப்படவில்லை என்பதால் திறம் குறைந்தவை என்பதை உணர வேண்டும்.

தமிழ்99 விசைப்பலகை மட்டுமே கணினி விசை அமைப்புகள் / தமிழின் சொல் இலக்கணம் ஆகியவற்றைக் கருத்தில் கொண்டு வடிவமைக்கப்பட்ட புத்திசாலித்தனமான விசைப்பலகையாகும். அதைக் கற்றுக் கொள்ள முன்வாருங்கள்.

3. ஏன் ஒருங்குறி சிறந்தது?

பூட்டின் சாவி தனித்துவமாக இருந்தால், அச்சாவிகள் இல்லாதவர்கள் பெட்டியைத் திறந்து படிக்காமலேயே போய் விடுவார்கள் அல்லவா? ஆனால், ஒருங்குறி என்ற சாவி எல்லார் வீட்டிலும் ஏற்கனவே இருக்கக் கூடியது என்று வைத்துக் கொள்வோம். அந்தச் சாவிக்கேற்ற ஒருங்குறிப் பூட்டை போட்டால், எல்லாராலும் பூட்டைத் திறந்து படிக்க முடியும் தானே? தினம் ஒரு பூட்டு போட்டு மக்களை சாவி வாங்கச் சொல்வதற்குப் பதில், மக்களிடம் உள்ள சாவிக்கு ஏற்ற மாதிரி பூட்டு போடுவது தான் ஒருங்குறி முறை. இதுவே ஒருங்குறி முறையின் நன்மை.


பேனா, பூட்டு-சாவி என்ற உவமைகளை மட்டும் மனதில் வைத்துக் கொண்டால் ஒருங்குறி, எ-கலப்பை, விசைப்பலகை ஆகியவற்றை ஒன்றுடன் ஒன்று குழப்பிக் கொள்ளாமல் இருக்கலாம்.

குட்டிக் கதை சொல்லப் புகுந்து பெரிய கதையாகிப் போச்சு 😉 பரவாயில்லை. நாலு பேருக்கு நல்லது நடந்தா எவ்வளவு பெரிய கதையும் குட்டிக் கதை தான் 😉