ஒருங்குறி குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள்

இன்று ஒருங்குறி குறியாக்கத்தில் அமைந்த தமிழ்த் தளம் ஒன்றில் Firefox உலாவி கொண்டு தேடுகையில் பின்வரும் வழுவைக் கண்டேன்.

உண்ட என்று தேடினால் உண்டு, உண்டான் உண்ட் என்ற எல்லா உண்+டகர வரிசைச்சொற்களையும் காட்டுகிறது. ஒருங்குறி குறியாக்கத்துக்கு  டா, டு, டி இவையெல்லாம் வேறு வேறு எழுத்துக்கள் என்று தெரியவில்லை. 

ஒருங்குறி குறியாக்கம் கணினியில் தமிழைக் காட்ட உதவும் அளவு கணித்தல் வேலைகளைச் செய்ய உதவவில்லை. எடுத்துக்காட்டுக்கு, திருக்குறளில் எத்தனை இடங்களில் உண்ட என்று வருகிறது என்று கணிக்க வேண்டுமானால் ஒருங்குறி குறியாக்கம் உதவப் போவதில்லை. match whole word என்று சொன்னால் தான் கொஞ்சமாவது துல்லியமான முடிவு கிடைக்கும். அதுவும் செய்யுள்களில் உரைநடை போல் ஒவ்வொரு சொல்லும் தெளிவாக முடியாமல் அடுத்த சொல்லுடன் இணைந்து இருக்கும் என்பதால், match whole word பல இடங்களில் உதவாமல் போகலாம்.

ஒரு ஆவணத்தில் பல இடங்களில் உள்ள ஒரே பிழையைக் கண்டு replace all கொடுக்கும்போதும் சிக்கல் வரும். எடுத்துக்காட்டுக்கு,
உண்ட உண்டு உண்டா என்று எழுதி

உண்ட வரும் இடங்களில் எல்லாம் உண்டா என்று மாற்றச் சொன்னால்,

உண்டா உண்டாு உண்டாா என்று தான் மாற்றங்கள் வரும்.

இந்த இடத்தில் match whole word only என்று கொடுக்க மறக்காமல் இருந்தால் சரியான முடிவுகள் வரும். ஆனால், இதுவும் செய்யுளில் உதை வாங்கலாம்.

ஒருங்குறி் குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள், போதாமைகள் குறித்த அதிகாரப்பூர்வ விளக்கங்கள் இங்கு.

இந்தப் போதாமைகளில் சிலவற்றை வேறு இடங்களிலும் பார்த்த நினைவு. ஆனால், ஒரு குறிப்புக்காக இங்கு பதிகிறேன்.

தொடர்புடைய சில இடுகைகள்:

* ஒருங்குறிச் செருப்பு.

* கீதா கயீதா ஆன கதை.

* தமிழ் ஒருங்குறி – தேட்டைச் சிக்கல்

* தமிழ் எழுத்துக்கள் வரிசைப்படுத்தல்.


Comments

4 responses to “ஒருங்குறி குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள்”

  1. ஒருங்குறித் தமிழ் பற்றி முன்னர் எழுதிய பதிவு இராம.கி ஐயா, வாய்ஸ் ஆன் விங்ஸ் இவர்கள் எழுதியதற்கும் இங்கிருந்து சுட்டி பிடித்துக் கொள்ளலாம். யக்ஞாவும் அதே சமயத்தில் இது பற்றி எழுதியிருக்கிறார்.

  2. நன்றி, செல்வராஜ். சுட்டிகளைச் சேர்த்து இருக்கிறேன்.

  3. ரவி

    நீங்கள் குறிப்பிட்டுள்ளவற்றில் தேடல் வழு தவிர மற்றவை பயர்பாக்சின் பிழைகள் அல்லவா? எனினும் ஒருங்குறிப் பிழைகளினால் தான் இவை பயர்பாக்சில் ஏற்படுகின்றன. ஐஈ இதை சரி செய்து கொள்கிறது. அது போலவே தேடல் பொறி நுட்பமும் மேம்படும்போது/ தமிழுக்கேற்ற முறையில் ஆக்கப் படும்போது இப்பிரச்சினை தீர்க்கப் படலாம் அல்லவா?

    ஒருங்குறிக்கான தீர்வு அல்லது பிழைகள் குறித்து பலரும் பேசி வந்தாலும் அதற்கான நிரந்தர தீர்வு எதுவும் சமீபத்தில் கிட்டுவதாகவோ. ஒருங்குறி அமைப்பில் மாற்றம் செய்யப் படுவதற்கான சாத்தியங்களோ இப்போதைக்கு சாத்தியமானதாக தோன்றவில்லை. ஒட்டு மொத்தமாக தமிழர்களுக்குள் கருத்து ஒற்றுமை ஏற்பட்டால் மட்டுமே அது சாத்தியம்.

    மாறாக ஒருங்குறி பயன்பாட்டு நுட்பம் மூலமே இப்பிரச்சினைகள் இப்போதைக்கு தீர்க்கப் பட்ட முடியும் . தேடல் பொறிகள் தமிழுக்கான இலக்கண, எழுத்து அமைப்பை புரிந்து கொள்ளும் விதத்தில் வடிவமைக்கப் படுவதும் பயர்பாக்சில் வழு சரி செய்யப் படுவதும் அதை விட எளிதானதாக இருக்கக் கூடும்.

  4. சிந்தாநதி – ஒருங்குறியைப் புறக்கணிக்கச் சொல்லவில்லை. புறக்கணிக்கவும் முடியாது. ஆவணப்படுத்தலுக்காகவே இங்கு இட்டு வைத்திருக்கிறேன். Internet explorerஐக் காட்டிலும் Firefox வலை சீர்தரங்களுக்குட்பட்ட (web standards) உலாவி என்றே நம்புகிறேன். Firefoxல் ஒழுங்காகத் தெரியாத தளங்களின் வடிவமைப்பு வலை அடவு சீர்தரங்களுக்கு (web design standards) உட்படவில்லை என்றே நினைக்கிறேன். அதனாலேயே Firefoxல் சில சமயம் தமிழ் ஒழுங்காகத் தெரியாதது கவலையளிக்கிறது.

    நிலை தாழ்வாக இருந்தாலும் குனிந்தவாறு வீட்டுக்குள் நுழைய முடியும் தான். ஆனால், காலத்துக்கும் எல்லாரும் குனிந்து செல்வதை விட, நிலையை இன்னும் உயரமாக மாற்றலாம் அல்லவா? ஒவ்வொரு செயலியிலும் தமிழுக்கு ஏற்றவாறு நிரல் எழுத முடியும் என்றாலும் மூலப்பிரச்சினையையே சரி செய்து விட்டால், நாமும் தமிழ் ஒரு செயலியில் ஒழுங்காகத் தெரியுமா தெரியாதா என்று கவலைப்படாமல் இருக்கலாம் அல்லவா?