இன்று ஒருங்குறி குறியாக்கத்தில் அமைந்த தமிழ்த் தளம் ஒன்றில் Firefox உலாவி கொண்டு தேடுகையில் பின்வரும் வழுவைக் கண்டேன்.
உண்ட என்று தேடினால் உண்டு, உண்டான் உண்ட் என்ற எல்லா உண்+டகர வரிசைச்சொற்களையும் காட்டுகிறது. ஒருங்குறி குறியாக்கத்துக்கு டா, டு, டி இவையெல்லாம் வேறு வேறு எழுத்துக்கள் என்று தெரியவில்லை.
ஒருங்குறி குறியாக்கம் கணினியில் தமிழைக் காட்ட உதவும் அளவு கணித்தல் வேலைகளைச் செய்ய உதவவில்லை. எடுத்துக்காட்டுக்கு, திருக்குறளில் எத்தனை இடங்களில் உண்ட என்று வருகிறது என்று கணிக்க வேண்டுமானால் ஒருங்குறி குறியாக்கம் உதவப் போவதில்லை. match whole word என்று சொன்னால் தான் கொஞ்சமாவது துல்லியமான முடிவு கிடைக்கும். அதுவும் செய்யுள்களில் உரைநடை போல் ஒவ்வொரு சொல்லும் தெளிவாக முடியாமல் அடுத்த சொல்லுடன் இணைந்து இருக்கும் என்பதால், match whole word பல இடங்களில் உதவாமல் போகலாம்.
ஒரு ஆவணத்தில் பல இடங்களில் உள்ள ஒரே பிழையைக் கண்டு replace all கொடுக்கும்போதும் சிக்கல் வரும். எடுத்துக்காட்டுக்கு,
உண்ட உண்டு உண்டா என்று எழுதி
உண்ட வரும் இடங்களில் எல்லாம் உண்டா என்று மாற்றச் சொன்னால்,
உண்டா உண்டாு உண்டாா என்று தான் மாற்றங்கள் வரும்.
இந்த இடத்தில் match whole word only என்று கொடுக்க மறக்காமல் இருந்தால் சரியான முடிவுகள் வரும். ஆனால், இதுவும் செய்யுளில் உதை வாங்கலாம்.
ஒருங்குறி் குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள், போதாமைகள் குறித்த அதிகாரப்பூர்வ விளக்கங்கள் இங்கு.
இந்தப் போதாமைகளில் சிலவற்றை வேறு இடங்களிலும் பார்த்த நினைவு. ஆனால், ஒரு குறிப்புக்காக இங்கு பதிகிறேன்.
தொடர்புடைய சில இடுகைகள்:
* தமிழ் ஒருங்குறி – தேட்டைச் சிக்கல்
* தமிழ் எழுத்துக்கள் வரிசைப்படுத்தல்.
{ 4 comments… read them below or add one }
ஒருங்குறித் தமிழ் பற்றி முன்னர் எழுதிய பதிவு இராம.கி ஐயா, வாய்ஸ் ஆன் விங்ஸ் இவர்கள் எழுதியதற்கும் இங்கிருந்து சுட்டி பிடித்துக் கொள்ளலாம். யக்ஞாவும் அதே சமயத்தில் இது பற்றி எழுதியிருக்கிறார்.
நன்றி, செல்வராஜ். சுட்டிகளைச் சேர்த்து இருக்கிறேன்.
ரவி
நீங்கள் குறிப்பிட்டுள்ளவற்றில் தேடல் வழு தவிர மற்றவை பயர்பாக்சின் பிழைகள் அல்லவா? எனினும் ஒருங்குறிப் பிழைகளினால் தான் இவை பயர்பாக்சில் ஏற்படுகின்றன. ஐஈ இதை சரி செய்து கொள்கிறது. அது போலவே தேடல் பொறி நுட்பமும் மேம்படும்போது/ தமிழுக்கேற்ற முறையில் ஆக்கப் படும்போது இப்பிரச்சினை தீர்க்கப் படலாம் அல்லவா?
ஒருங்குறிக்கான தீர்வு அல்லது பிழைகள் குறித்து பலரும் பேசி வந்தாலும் அதற்கான நிரந்தர தீர்வு எதுவும் சமீபத்தில் கிட்டுவதாகவோ. ஒருங்குறி அமைப்பில் மாற்றம் செய்யப் படுவதற்கான சாத்தியங்களோ இப்போதைக்கு சாத்தியமானதாக தோன்றவில்லை. ஒட்டு மொத்தமாக தமிழர்களுக்குள் கருத்து ஒற்றுமை ஏற்பட்டால் மட்டுமே அது சாத்தியம்.
மாறாக ஒருங்குறி பயன்பாட்டு நுட்பம் மூலமே இப்பிரச்சினைகள் இப்போதைக்கு தீர்க்கப் பட்ட முடியும் . தேடல் பொறிகள் தமிழுக்கான இலக்கண, எழுத்து அமைப்பை புரிந்து கொள்ளும் விதத்தில் வடிவமைக்கப் படுவதும் பயர்பாக்சில் வழு சரி செய்யப் படுவதும் அதை விட எளிதானதாக இருக்கக் கூடும்.
சிந்தாநதி – ஒருங்குறியைப் புறக்கணிக்கச் சொல்லவில்லை. புறக்கணிக்கவும் முடியாது. ஆவணப்படுத்தலுக்காகவே இங்கு இட்டு வைத்திருக்கிறேன். Internet explorerஐக் காட்டிலும் Firefox வலை சீர்தரங்களுக்குட்பட்ட (web standards) உலாவி என்றே நம்புகிறேன். Firefoxல் ஒழுங்காகத் தெரியாத தளங்களின் வடிவமைப்பு வலை அடவு சீர்தரங்களுக்கு (web design standards) உட்படவில்லை என்றே நினைக்கிறேன். அதனாலேயே Firefoxல் சில சமயம் தமிழ் ஒழுங்காகத் தெரியாதது கவலையளிக்கிறது.
நிலை தாழ்வாக இருந்தாலும் குனிந்தவாறு வீட்டுக்குள் நுழைய முடியும் தான். ஆனால், காலத்துக்கும் எல்லாரும் குனிந்து செல்வதை விட, நிலையை இன்னும் உயரமாக மாற்றலாம் அல்லவா? ஒவ்வொரு செயலியிலும் தமிழுக்கு ஏற்றவாறு நிரல் எழுத முடியும் என்றாலும் மூலப்பிரச்சினையையே சரி செய்து விட்டால், நாமும் தமிழ் ஒரு செயலியில் ஒழுங்காகத் தெரியுமா தெரியாதா என்று கவலைப்படாமல் இருக்கலாம் அல்லவா?