இன்று ஒருங்குறி குறியாக்கத்தில் அமைந்த தமிழ்த் தளம் ஒன்றில் Firefox உலாவி கொண்டு தேடுகையில் பின்வரும் வழுவைக் கண்டேன்.
உண்ட என்று தேடினால் உண்டு, உண்டான் உண்ட் என்ற எல்லா உண்+டகர வரிசைச்சொற்களையும் காட்டுகிறது. ஒருங்குறி குறியாக்கத்துக்கு டா, டு, டி இவையெல்லாம் வேறு வேறு எழுத்துக்கள் என்று தெரியவில்லை.
ஒருங்குறி குறியாக்கம் கணினியில் தமிழைக் காட்ட உதவும் அளவு கணித்தல் வேலைகளைச் செய்ய உதவவில்லை. எடுத்துக்காட்டுக்கு, திருக்குறளில் எத்தனை இடங்களில் உண்ட என்று வருகிறது என்று கணிக்க வேண்டுமானால் ஒருங்குறி குறியாக்கம் உதவப் போவதில்லை. match whole word என்று சொன்னால் தான் கொஞ்சமாவது துல்லியமான முடிவு கிடைக்கும். அதுவும் செய்யுள்களில் உரைநடை போல் ஒவ்வொரு சொல்லும் தெளிவாக முடியாமல் அடுத்த சொல்லுடன் இணைந்து இருக்கும் என்பதால், match whole word பல இடங்களில் உதவாமல் போகலாம்.
ஒரு ஆவணத்தில் பல இடங்களில் உள்ள ஒரே பிழையைக் கண்டு replace all கொடுக்கும்போதும் சிக்கல் வரும். எடுத்துக்காட்டுக்கு,
உண்ட உண்டு உண்டா என்று எழுதி
உண்ட வரும் இடங்களில் எல்லாம் உண்டா என்று மாற்றச் சொன்னால்,
உண்டா உண்டாு உண்டாா என்று தான் மாற்றங்கள் வரும்.
இந்த இடத்தில் match whole word only என்று கொடுக்க மறக்காமல் இருந்தால் சரியான முடிவுகள் வரும். ஆனால், இதுவும் செய்யுளில் உதை வாங்கலாம்.
ஒருங்குறி் குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள், போதாமைகள் குறித்த அதிகாரப்பூர்வ விளக்கங்கள் இங்கு.
இந்தப் போதாமைகளில் சிலவற்றை வேறு இடங்களிலும் பார்த்த நினைவு. ஆனால், ஒரு குறிப்புக்காக இங்கு பதிகிறேன்.
தொடர்புடைய சில இடுகைகள்:
Comments
4 responses to “ஒருங்குறி குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள்”
ஒருங்குறித் தமிழ் பற்றி முன்னர் எழுதிய பதிவு இராம.கி ஐயா, வாய்ஸ் ஆன் விங்ஸ் இவர்கள் எழுதியதற்கும் இங்கிருந்து சுட்டி பிடித்துக் கொள்ளலாம். யக்ஞாவும் அதே சமயத்தில் இது பற்றி எழுதியிருக்கிறார்.
நன்றி, செல்வராஜ். சுட்டிகளைச் சேர்த்து இருக்கிறேன்.
ரவி
நீங்கள் குறிப்பிட்டுள்ளவற்றில் தேடல் வழு தவிர மற்றவை பயர்பாக்சின் பிழைகள் அல்லவா? எனினும் ஒருங்குறிப் பிழைகளினால் தான் இவை பயர்பாக்சில் ஏற்படுகின்றன. ஐஈ இதை சரி செய்து கொள்கிறது. அது போலவே தேடல் பொறி நுட்பமும் மேம்படும்போது/ தமிழுக்கேற்ற முறையில் ஆக்கப் படும்போது இப்பிரச்சினை தீர்க்கப் படலாம் அல்லவா?
ஒருங்குறிக்கான தீர்வு அல்லது பிழைகள் குறித்து பலரும் பேசி வந்தாலும் அதற்கான நிரந்தர தீர்வு எதுவும் சமீபத்தில் கிட்டுவதாகவோ. ஒருங்குறி அமைப்பில் மாற்றம் செய்யப் படுவதற்கான சாத்தியங்களோ இப்போதைக்கு சாத்தியமானதாக தோன்றவில்லை. ஒட்டு மொத்தமாக தமிழர்களுக்குள் கருத்து ஒற்றுமை ஏற்பட்டால் மட்டுமே அது சாத்தியம்.
மாறாக ஒருங்குறி பயன்பாட்டு நுட்பம் மூலமே இப்பிரச்சினைகள் இப்போதைக்கு தீர்க்கப் பட்ட முடியும் . தேடல் பொறிகள் தமிழுக்கான இலக்கண, எழுத்து அமைப்பை புரிந்து கொள்ளும் விதத்தில் வடிவமைக்கப் படுவதும் பயர்பாக்சில் வழு சரி செய்யப் படுவதும் அதை விட எளிதானதாக இருக்கக் கூடும்.
சிந்தாநதி – ஒருங்குறியைப் புறக்கணிக்கச் சொல்லவில்லை. புறக்கணிக்கவும் முடியாது. ஆவணப்படுத்தலுக்காகவே இங்கு இட்டு வைத்திருக்கிறேன். Internet explorerஐக் காட்டிலும் Firefox வலை சீர்தரங்களுக்குட்பட்ட (web standards) உலாவி என்றே நம்புகிறேன். Firefoxல் ஒழுங்காகத் தெரியாத தளங்களின் வடிவமைப்பு வலை அடவு சீர்தரங்களுக்கு (web design standards) உட்படவில்லை என்றே நினைக்கிறேன். அதனாலேயே Firefoxல் சில சமயம் தமிழ் ஒழுங்காகத் தெரியாதது கவலையளிக்கிறது.
நிலை தாழ்வாக இருந்தாலும் குனிந்தவாறு வீட்டுக்குள் நுழைய முடியும் தான். ஆனால், காலத்துக்கும் எல்லாரும் குனிந்து செல்வதை விட, நிலையை இன்னும் உயரமாக மாற்றலாம் அல்லவா? ஒவ்வொரு செயலியிலும் தமிழுக்கு ஏற்றவாறு நிரல் எழுத முடியும் என்றாலும் மூலப்பிரச்சினையையே சரி செய்து விட்டால், நாமும் தமிழ் ஒரு செயலியில் ஒழுங்காகத் தெரியுமா தெரியாதா என்று கவலைப்படாமல் இருக்கலாம் அல்லவா?