ஒருங்குறி குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள்

இன்று ஒருங்குறி குறியாக்கத்தில் அமைந்த தமிழ்த் தளம் ஒன்றில் Firefox உலாவி கொண்டு தேடுகையில் பின்வரும் வழுவைக் கண்டேன்.

உண்ட என்று தேடினால் உண்டு, உண்டான் உண்ட் என்ற எல்லா உண்+டகர வரிசைச்சொற்களையும் காட்டுகிறது. ஒருங்குறி குறியாக்கத்துக்கு  டா, டு, டி இவையெல்லாம் வேறு வேறு எழுத்துக்கள் என்று தெரியவில்லை. 

ஒருங்குறி குறியாக்கம் கணினியில் தமிழைக் காட்ட உதவும் அளவு கணித்தல் வேலைகளைச் செய்ய உதவவில்லை. எடுத்துக்காட்டுக்கு, திருக்குறளில் எத்தனை இடங்களில் உண்ட என்று வருகிறது என்று கணிக்க வேண்டுமானால் ஒருங்குறி குறியாக்கம் உதவப் போவதில்லை. match whole word என்று சொன்னால் தான் கொஞ்சமாவது துல்லியமான முடிவு கிடைக்கும். அதுவும் செய்யுள்களில் உரைநடை போல் ஒவ்வொரு சொல்லும் தெளிவாக முடியாமல் அடுத்த சொல்லுடன் இணைந்து இருக்கும் என்பதால், match whole word பல இடங்களில் உதவாமல் போகலாம்.

ஒரு ஆவணத்தில் பல இடங்களில் உள்ள ஒரே பிழையைக் கண்டு replace all கொடுக்கும்போதும் சிக்கல் வரும். எடுத்துக்காட்டுக்கு,
உண்ட உண்டு உண்டா என்று எழுதி

உண்ட வரும் இடங்களில் எல்லாம் உண்டா என்று மாற்றச் சொன்னால்,

உண்டா உண்டாு உண்டாா என்று தான் மாற்றங்கள் வரும்.

இந்த இடத்தில் match whole word only என்று கொடுக்க மறக்காமல் இருந்தால் சரியான முடிவுகள் வரும். ஆனால், இதுவும் செய்யுளில் உதை வாங்கலாம்.

ஒருங்குறி் குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள், போதாமைகள் குறித்த அதிகாரப்பூர்வ விளக்கங்கள் இங்கு.

இந்தப் போதாமைகளில் சிலவற்றை வேறு இடங்களிலும் பார்த்த நினைவு. ஆனால், ஒரு குறிப்புக்காக இங்கு பதிகிறேன்.

தொடர்புடைய சில இடுகைகள்:

* ஒருங்குறிச் செருப்பு.

* கீதா கயீதா ஆன கதை.

* தமிழ் ஒருங்குறி – தேட்டைச் சிக்கல்

* தமிழ் எழுத்துக்கள் வரிசைப்படுத்தல்.

Comments

  1. ஒருங்குறித் தமிழ் பற்றி முன்னர் எழுதிய பதிவு இராம.கி ஐயா, வாய்ஸ் ஆன் விங்ஸ் இவர்கள் எழுதியதற்கும் இங்கிருந்து சுட்டி பிடித்துக் கொள்ளலாம். யக்ஞாவும் அதே சமயத்தில் இது பற்றி எழுதியிருக்கிறார்.

  2. ravishankar says:

    நன்றி, செல்வராஜ். சுட்டிகளைச் சேர்த்து இருக்கிறேன்.

  3. ரவி

    நீங்கள் குறிப்பிட்டுள்ளவற்றில் தேடல் வழு தவிர மற்றவை பயர்பாக்சின் பிழைகள் அல்லவா? எனினும் ஒருங்குறிப் பிழைகளினால் தான் இவை பயர்பாக்சில் ஏற்படுகின்றன. ஐஈ இதை சரி செய்து கொள்கிறது. அது போலவே தேடல் பொறி நுட்பமும் மேம்படும்போது/ தமிழுக்கேற்ற முறையில் ஆக்கப் படும்போது இப்பிரச்சினை தீர்க்கப் படலாம் அல்லவா?

    ஒருங்குறிக்கான தீர்வு அல்லது பிழைகள் குறித்து பலரும் பேசி வந்தாலும் அதற்கான நிரந்தர தீர்வு எதுவும் சமீபத்தில் கிட்டுவதாகவோ. ஒருங்குறி அமைப்பில் மாற்றம் செய்யப் படுவதற்கான சாத்தியங்களோ இப்போதைக்கு சாத்தியமானதாக தோன்றவில்லை. ஒட்டு மொத்தமாக தமிழர்களுக்குள் கருத்து ஒற்றுமை ஏற்பட்டால் மட்டுமே அது சாத்தியம்.

    மாறாக ஒருங்குறி பயன்பாட்டு நுட்பம் மூலமே இப்பிரச்சினைகள் இப்போதைக்கு தீர்க்கப் பட்ட முடியும் . தேடல் பொறிகள் தமிழுக்கான இலக்கண, எழுத்து அமைப்பை புரிந்து கொள்ளும் விதத்தில் வடிவமைக்கப் படுவதும் பயர்பாக்சில் வழு சரி செய்யப் படுவதும் அதை விட எளிதானதாக இருக்கக் கூடும்.

  4. ravishankar says:

    சிந்தாநதி – ஒருங்குறியைப் புறக்கணிக்கச் சொல்லவில்லை. புறக்கணிக்கவும் முடியாது. ஆவணப்படுத்தலுக்காகவே இங்கு இட்டு வைத்திருக்கிறேன். Internet explorerஐக் காட்டிலும் Firefox வலை சீர்தரங்களுக்குட்பட்ட (web standards) உலாவி என்றே நம்புகிறேன். Firefoxல் ஒழுங்காகத் தெரியாத தளங்களின் வடிவமைப்பு வலை அடவு சீர்தரங்களுக்கு (web design standards) உட்படவில்லை என்றே நினைக்கிறேன். அதனாலேயே Firefoxல் சில சமயம் தமிழ் ஒழுங்காகத் தெரியாதது கவலையளிக்கிறது.

    நிலை தாழ்வாக இருந்தாலும் குனிந்தவாறு வீட்டுக்குள் நுழைய முடியும் தான். ஆனால், காலத்துக்கும் எல்லாரும் குனிந்து செல்வதை விட, நிலையை இன்னும் உயரமாக மாற்றலாம் அல்லவா? ஒவ்வொரு செயலியிலும் தமிழுக்கு ஏற்றவாறு நிரல் எழுத முடியும் என்றாலும் மூலப்பிரச்சினையையே சரி செய்து விட்டால், நாமும் தமிழ் ஒரு செயலியில் ஒழுங்காகத் தெரியுமா தெரியாதா என்று கவலைப்படாமல் இருக்கலாம் அல்லவா?

Speak Your Mind