ஒருங்குறி குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள்

April 16, 2007

in தமிழ்

இன்று ஒருங்குறி குறியாக்கத்தில் அமைந்த தமிழ்த் தளம் ஒன்றில் Firefox உலாவி கொண்டு தேடுகையில் பின்வரும் வழுவைக் கண்டேன்.

உண்ட என்று தேடினால் உண்டு, உண்டான் உண்ட் என்ற எல்லா உண்+டகர வரிசைச்சொற்களையும் காட்டுகிறது. ஒருங்குறி குறியாக்கத்துக்கு  டா, டு, டி இவையெல்லாம் வேறு வேறு எழுத்துக்கள் என்று தெரியவில்லை. 

ஒருங்குறி குறியாக்கம் கணினியில் தமிழைக் காட்ட உதவும் அளவு கணித்தல் வேலைகளைச் செய்ய உதவவில்லை. எடுத்துக்காட்டுக்கு, திருக்குறளில் எத்தனை இடங்களில் உண்ட என்று வருகிறது என்று கணிக்க வேண்டுமானால் ஒருங்குறி குறியாக்கம் உதவப் போவதில்லை. match whole word என்று சொன்னால் தான் கொஞ்சமாவது துல்லியமான முடிவு கிடைக்கும். அதுவும் செய்யுள்களில் உரைநடை போல் ஒவ்வொரு சொல்லும் தெளிவாக முடியாமல் அடுத்த சொல்லுடன் இணைந்து இருக்கும் என்பதால், match whole word பல இடங்களில் உதவாமல் போகலாம்.

ஒரு ஆவணத்தில் பல இடங்களில் உள்ள ஒரே பிழையைக் கண்டு replace all கொடுக்கும்போதும் சிக்கல் வரும். எடுத்துக்காட்டுக்கு,
உண்ட உண்டு உண்டா என்று எழுதி

உண்ட வரும் இடங்களில் எல்லாம் உண்டா என்று மாற்றச் சொன்னால்,

உண்டா உண்டாு உண்டாா என்று தான் மாற்றங்கள் வரும்.

இந்த இடத்தில் match whole word only என்று கொடுக்க மறக்காமல் இருந்தால் சரியான முடிவுகள் வரும். ஆனால், இதுவும் செய்யுளில் உதை வாங்கலாம்.

ஒருங்குறி் குறியாக்கத்தில் தமிழில் தோன்றும் வழுக்கள், போதாமைகள் குறித்த அதிகாரப்பூர்வ விளக்கங்கள் இங்கு.

இந்தப் போதாமைகளில் சிலவற்றை வேறு இடங்களிலும் பார்த்த நினைவு. ஆனால், ஒரு குறிப்புக்காக இங்கு பதிகிறேன்.

தொடர்புடைய சில இடுகைகள்:

* ஒருங்குறிச் செருப்பு.

* கீதா கயீதா ஆன கதை.

* தமிழ் ஒருங்குறி – தேட்டைச் சிக்கல்

* தமிழ் எழுத்துக்கள் வரிசைப்படுத்தல்.

இக்குறிச்சொற்களில் சிலவற்றைக் கொண்டிருக்கும் பிற இடுகைகள்

{ 4 comments… read them below or add one }

செல்வராஜ் April 18, 2007 at 2:09 am

ஒருங்குறித் தமிழ் பற்றி முன்னர் எழுதிய பதிவு இராம.கி ஐயா, வாய்ஸ் ஆன் விங்ஸ் இவர்கள் எழுதியதற்கும் இங்கிருந்து சுட்டி பிடித்துக் கொள்ளலாம். யக்ஞாவும் அதே சமயத்தில் இது பற்றி எழுதியிருக்கிறார்.

Reply

ravishankar April 19, 2007 at 10:16 am

நன்றி, செல்வராஜ். சுட்டிகளைச் சேர்த்து இருக்கிறேன்.

Reply

☆ சிந்தாநதி May 10, 2007 at 4:30 am

ரவி

நீங்கள் குறிப்பிட்டுள்ளவற்றில் தேடல் வழு தவிர மற்றவை பயர்பாக்சின் பிழைகள் அல்லவா? எனினும் ஒருங்குறிப் பிழைகளினால் தான் இவை பயர்பாக்சில் ஏற்படுகின்றன. ஐஈ இதை சரி செய்து கொள்கிறது. அது போலவே தேடல் பொறி நுட்பமும் மேம்படும்போது/ தமிழுக்கேற்ற முறையில் ஆக்கப் படும்போது இப்பிரச்சினை தீர்க்கப் படலாம் அல்லவா?

ஒருங்குறிக்கான தீர்வு அல்லது பிழைகள் குறித்து பலரும் பேசி வந்தாலும் அதற்கான நிரந்தர தீர்வு எதுவும் சமீபத்தில் கிட்டுவதாகவோ. ஒருங்குறி அமைப்பில் மாற்றம் செய்யப் படுவதற்கான சாத்தியங்களோ இப்போதைக்கு சாத்தியமானதாக தோன்றவில்லை. ஒட்டு மொத்தமாக தமிழர்களுக்குள் கருத்து ஒற்றுமை ஏற்பட்டால் மட்டுமே அது சாத்தியம்.

மாறாக ஒருங்குறி பயன்பாட்டு நுட்பம் மூலமே இப்பிரச்சினைகள் இப்போதைக்கு தீர்க்கப் பட்ட முடியும் . தேடல் பொறிகள் தமிழுக்கான இலக்கண, எழுத்து அமைப்பை புரிந்து கொள்ளும் விதத்தில் வடிவமைக்கப் படுவதும் பயர்பாக்சில் வழு சரி செய்யப் படுவதும் அதை விட எளிதானதாக இருக்கக் கூடும்.

Reply

ravishankar May 10, 2007 at 10:52 am

சிந்தாநதி – ஒருங்குறியைப் புறக்கணிக்கச் சொல்லவில்லை. புறக்கணிக்கவும் முடியாது. ஆவணப்படுத்தலுக்காகவே இங்கு இட்டு வைத்திருக்கிறேன். Internet explorerஐக் காட்டிலும் Firefox வலை சீர்தரங்களுக்குட்பட்ட (web standards) உலாவி என்றே நம்புகிறேன். Firefoxல் ஒழுங்காகத் தெரியாத தளங்களின் வடிவமைப்பு வலை அடவு சீர்தரங்களுக்கு (web design standards) உட்படவில்லை என்றே நினைக்கிறேன். அதனாலேயே Firefoxல் சில சமயம் தமிழ் ஒழுங்காகத் தெரியாதது கவலையளிக்கிறது.

நிலை தாழ்வாக இருந்தாலும் குனிந்தவாறு வீட்டுக்குள் நுழைய முடியும் தான். ஆனால், காலத்துக்கும் எல்லாரும் குனிந்து செல்வதை விட, நிலையை இன்னும் உயரமாக மாற்றலாம் அல்லவா? ஒவ்வொரு செயலியிலும் தமிழுக்கு ஏற்றவாறு நிரல் எழுத முடியும் என்றாலும் மூலப்பிரச்சினையையே சரி செய்து விட்டால், நாமும் தமிழ் ஒரு செயலியில் ஒழுங்காகத் தெரியுமா தெரியாதா என்று கவலைப்படாமல் இருக்கலாம் அல்லவா?

Reply

Leave a Comment

Previous post:

Next post: