கூகுளுக்குத் தமிழ் தெரியாது

இணையத்தில் எழுதும் அனைவரும் தமிழை, அதன் இலக்கணத்தை முறையாகக் கற்றுத் தேர்ந்தவர்கள் அல்லர். எனவே, கூகுள் காட்டும் முடிவுகளை வைத்து ஒரு சொல் எவ்வாறு எல்லாம் எழுதப்படுகிறது, இணையத்தில் ஒருங்குறியில் எழுதுவோரிடம் எச்சொல் அதிகம் புழங்குகிறது என்று அறியலாமே ஒழிய எது சரியான சொல் என்று முடிவு செய்ய இயலாது. பல சமயங்களில் அதிகம் புழங்கும் சொற்கள் சரியானவையாகவும் இருக்க வாய்ப்புண்டு என்றாலும் 100% இப்படிச் சொல்ல இயலாது.

ஆன்மிகம், ஆன்மீகம்.

சன்னதி, சன்னிதி.

கருப்பு, கறுப்பு

– இது போன்ற சொற்களில் எது சரி என்ற குழப்பம் வருகையில் பலரும் கூகுளில் இச்சொற்களைத் தேடி, கூடுதல் முடிவுகளைக் கொண்ட சொற்களைச் சரியெனத் தேர்கிறார்கள்.

ஆனால், இந்த வழிமுறை எப்போதும் சரியாக இருக்கத் தேவை இல்லை.

எடுத்துக்காட்டுக்கு,

முயற்சிக்கிறேன் என்று எழுதுவது தவறு. கூகுள் தேடலில் இதற்கு 15,900 முடிவுகள் கிடைக்கின்றன.

முயல்கிறேன் என்று எழுதுவது சரி. ஆனால், கூகுள் தேடலில் இதற்கு 9,300 முடிவுகள் தான் கிடைக்கின்றன.

இணையத்தில் எழுதும் அனைவரும் தமிழை, அதன் இலக்கணத்தை முறையாகக் கற்றுத் தேர்ந்தவர்கள் அல்லர். எனவே, கூகுள் காட்டும் முடிவுகளை வைத்து ஒரு சொல் எவ்வாறு எல்லாம் எழுதப்படுகிறது, இணையத்தில் ஒருங்குறியில் எழுதுவோரிடம் எச்சொல் அதிகம் புழங்குகிறது என்று அறியலாமே ஒழிய எது சரியான சொல் என்று முடிவு செய்ய இயலாது. அதிகம் புழங்கும் சொற்கள் சரியானவையாகவும் இருக்க வாய்ப்புண்டு என்றாலும் 100% இப்படிச் சொல்ல இயலாது.

சென்ற பத்தியில் “இணையத்தில் ஒருங்குறியில் எழுதுவோரிடம் எச்சொல் அதிகம் புழங்குகிறது” என்பதில் “

    இணையத்தில் ஒருங்குறியில் எழுதுவோரிடம்

” என்பதை அடிக்கோடிட்டு மனதில் இருத்திக் கொள்ளுங்கள். ஒருங்குறியில் இல்லாத பல தமிழ் இணையத்தளங்களை கூகுள் திரட்டுவதில்லை. இன்னும் படிமங்களாகவே கூட தமிழ் எழுத்துக்களைக் காட்டும் வழக்கமும் இருக்கிறது. இவை போக, கூகுளால் அணுகித் திரட்டப்படாத பல தமிழ் இணையத்தளங்களும் இருக்கலாம். திரட்டப்பட்ட பக்கங்களில் இருந்து கூட எல்லா பக்கங்களையும் தேடல் வினவல்களுக்கு கூகுள் பயன்படுத்துவதில்லை. முக்கியமில்லாத பக்கங்கள், ஒரே போல் உள்ள பக்கங்களைத் தவிர்த்து விடுகிறது. இணையத்தில் உள்ள தமிழ் ஒலிப்பதிவுகளில் உள்ள பேச்சுக்களைப் புரிந்து கூகுளால் எழுத்துப்பெயர்க்க முடியாது.

கூகுள் முடிவுகளில் ஒரு சொல் அதிகம் தென்படுகிறது என்பதற்காகத் தமிழ் அச்சு ஊடகங்கள், நூல்கள், மக்கள் பேச்சு வழக்கிலும் அச்சொல் கூடுதலாகப் புழங்குகிறது என்று முடிவுக்கு வர இயலாது. இணையத்தில் முழுமையாக உள்ளடக்கங்களை ஒருங்குறியில் ஏற்றும் தமிழ் அச்சு ஊடகங்கள் குறைவே. தமிழ் மக்களின் வட்டாரப் பேச்சு வழக்குகளோ இன்னும் அச்சு வடிவிலேயே கூட முழுமையாகப் பதிவு செய்யப்படவில்லை. பெரும்பான்மை மக்களின் பேச்சு வழக்கைக் கொச்சையாகக் கருதும் ஆதிக்கப் போக்கு அச்சு ஊடகங்கள் தத்தம் எழுத்து மொழித் தேர்வில் பக்கச் சாய்வுடன் செயல்படும் என்றும் உணரலாம். பேச்சு மொழி வேறாகவும், உரைநடை எழுத்து மொழி வேறாகவும் இருக்கும் தமிழில் இது முக்கியமான விசயமாகும். தமிழைப் பொருத்த வரை எழுத்து மொழி மட்டுமே தமிழின் அதிகாரப்பூர்வ ஆவணம் கிடையாது. கற்றறிந்த தமிழறிஞர்களே தெரியாமல் திணறும் பல கலைச்சொற்கள் மக்கள் வாழ்வில் இலகுவாகப் புழங்குகின்றன. எனவே பேச்சு மொழியின் திறத்தையும் தரத்தையும் குறைத்து மதிப்பிடலாகாது.

தற்போது நன்கு படித்து, கணினி, இணைய அணுக்கம், எழுதுவதற்கான ஓய்வு நேரம், ஆர்வம் கூடியவர்களே தமிழ் இணையத்தில் எழுதுகிறார்கள். மொத்த தமிழ் மக்கள் தொகையில் ஒரு வீதம் கூட இருக்க மாட்டார்கள். இந்த ஒரு வீதத்திற்குக் குறைவான மக்களின் சமூக, பொருளாதார, வாழ்வியல், வயது, கல்வி, தொழில் பின்புலங்களிலும் கூடுதல் ஒற்றுமைகளைக் காணலாம். கணிசமானவர்கள் மென்பொருள் துறையில் இருப்பவர்கள். இளைஞர்கள். வெளிநாட்டில் இருப்பவர்கள். பெண்கள் தொகை குறைவு. இவர்களின் எழுத்துகளிலும் தனித்துவமான, பாசாங்கில்லாத, வட்டார வழக்குகளைக் காண்பது அரிது. ஏற்கனவே வெகுமக்கள் ஊடகங்கள் பின்பற்றும் மொழி நடையை அறிந்தோ அறியாமலோ பின்பற்றுவதற்கான வாய்ப்புகளே அதிகம். எனவே, பெரும்பான்மை தமிழ் மக்களின் பேச்சு, எழுத்து வழக்குகள் உள்ளது உள்ளபடி ஒலி, எழுத்து வடிவில் பதியப்பட்டு ஆயத்தக்க நிலைக்கு வரும் வரை,  இந்த சொற்பத் தமிழ் இணைய மக்கள் தொகையை ஒட்டு மொத்த உலகத் தமிழ் மக்கள் தொகையின் சார்பாகப் பார்க்க இயலாது.

**

மேற்கண்ட சிந்தனைகள் யாவும் தமிழ் விக்கிப்பீடியாவில் நிகழ்ந்த ஒரு சுவையான உரையாடலை அடுத்து எழுந்தவை.

இராமனுசன் என்ற பெயரைக் காட்டிலும் இராமானுஜன் / இராமானுஜம் / ராமானுஜம் என்ற பெயரே இணையத்தில் அதிகம் தென்படுவதால் அவையே சரி என்ற வாதம் ஒருவரால் முன்வைக்கப்பட்டது.

ஸ்ரீலங்கா என்ற பெயரைக் காட்டிலும் சிறீலங்கா என்ற பெயரே இணையத்தில் அதிகம் தென்படுவதால் ஸ்ரீ என்ற எழுத்தை ஒழித்து சிறீ, சிரீ என்றே எழுதத் தொடங்குவோமா என்று எதிர்வாதம் வைத்தால் சரியாக இருக்குமோ 🙂

தொடர்புடைய பக்கங்கள்:

பொறுக்குச் சாய்வு

கூகுள் தமிழ் X விக்கி தமிழ்

தமிழ்க் கணிமை ஆர்வலர்கள்

நான் அறிந்த சில இணையத் தமிழ் நுட்ப ஆர்வலர்கள் பெயரைப் பதிந்து வைக்கிறேன்.

(எந்த வரிசையிலும் இல்லை)

1. முகுந்த்தமிழா! அமைப்பின் முனைப்பான பங்களிப்பாளர்களில் ஒருவர். இவர் உருவாக்கிய எ-கலப்பை பல தமிழர்கள் கணினியில் எளிதாகத் தமிழ் எழுத உதவுகிறது.

2. மாகிர்தமிழூற்று – தமிழர்களின் அறிவுச் சுரங்கம் என்ற பெயரில்  தமிழிணையம் சார்ந்து பல நுட்பப் பணிகள் ஆற்றி வருகிறார். தமிழ் இணையத்தளங்கள், வலைப்பதிவுகள், விக்கி இயக்கங்கள் தொடர்பில் பயனுள்ள தேடு கருவிகள், வழிகாட்டுக் கருவிகள் உருவாக்கி உள்ளார்.

3. கோபி – இந்திய மொழிகள் பலவற்றுக்குமான ஒருங்குறி எழுது கருவிகள் செய்திருக்கிறார். இது தவிர, பல பயனுள்ள தமிழ் சார் Firefox நீட்சிகள் செய்து தந்திருக்கிறார்.

4. ஜெகத்இனியன் என்ற பெயரில் இந்திய மொழிகளுக்கான தமிழ் எழுத்துப் பெயர்ப்புக் கருவியைத் தனி உழைப்பில் கொண்டு வந்திருக்கிறார்.

5. Voice on Wings – முகுந்த், கோபியுடன் இணைந்து Firefox தமிழ்விசை நீட்சியின் உருவாக்கத்தில் பங்கு வகித்தவர். விக்கிப்பீடியா, வலைப்பதிவுகள் தொடர்பான Firefox நீட்சிகளையும் உருவாக்கி இருக்கிறார். இவரது அண்மைய உழைப்பு – மாற்று!.

6. மயூரன் – தமிழில் கட்டற்ற முயற்சிகள் எங்கிருந்தாலும் அங்கு மயூரனும் இருப்பார்! தமிழ் லினக்சு, தமிழ் உபுண்டு, தமிழ்க் கணிமை குழுக்களில் இவரது ஈடுபாடு பலரும் அறிந்தது.

7. காசி – தமிழ் வலைப்பதிவுகள் பெருகத் தொடங்கிய போது அவற்றைக் காட்சிப்படுத்தி, கூடிய வாசக வெளிச்சம் கிடைக்க உதவியாகத் தமிழ்மணம் திரட்டியை உருவாக்கினார்.

8. சுரதா – தமிழிணையக் கருவிகளுக்கு இவர் உருவாக்கிய சுரதா தளம் ஒரு களஞ்சியம் போல். இவருடைய சுரதா ஒருங்குறி எழுதி, பொங்குதமிழ் கருவிகளைப் பயன்படுத்தி இராதவர்கள் மிகக் குறைவே.

9. மறைந்த உமர் தம்பி அவர்கள் – இவரது உழைப்பும் உணர்வும் கோபி, மாஹிர் போன்ற பலரையும் தூண்டி விட்டது பெரும் சிறப்பாகும்.

10. மறைந்த சாகரன் என்னும் கல்யாண் – தேன்கூடு, பெட்டகம் என பல நல்ல இணையத்தளங்களை உருவாக்கினார். ஆனால், இவரது மறைவுக்குப் பிறகு இம்முயற்சிகளும் மறைந்தது சோகம்.

11. சிந்தாநதி – பல தமிழ் இணைய முயற்சிகளில் பின்னணியில் இருந்து செயல்பட்டு ஊக்குவித்தவர். இவரது அகால மறைவு பெரும் இழப்பு.

12. முனைவர் A. G. Ramakrishnan – இவரது குழுவினர் தமிழில் எழுதிய உரையைப் பேச்சுக்கு மாற்றும் செயலியைக் கண்டுபிடித்துள்ளனர்.

13. K. S. Nagarajan – NHM writer, NHM converter என்ற இரண்டு அருமையான மென்பொருள்களை உருவாக்கியவர். தமிழில் தற்போது கிடைக்கும் எழுதிகளில் NHM writer மிக அருமையானது. முழு நேரமாகவே தமிழ்க் கணிமைகளில் ஈடுபட்டிருக்கும் இவரிடம் இருந்து இன்னும் நிறைய எதிர்பார்க்கலாம்.

14. சுந்தர் – தமிழ் இலக்கண கணிமை, விக்கி நுட்பம் ஆகியவற்றில் ஆர்வம் உள்ளவர். தானியங்கியாக தமிழ் விக்சனரியில் ஒரு இலட்சம் சொற்கள் சேர்த்தது சுந்தரின் மிக முக்கியமான பங்களிப்பு.

இணையத் தமிழ் உள்ளடக்க உருவாக்கம் – தமிழ்நாடு அரசு கவனிக்குமா?

என்றாவது, தமிழ் வளர்ச்சித் துறை தொடர்புடைய தமிழக அரசு அமைச்சர் / அதிகாரி கண்ணில் படலாம் என்ற பேராசையில், தமிழக அரசுக்கு சில வேண்டுகோள்கள்.

* தமிழ்நாடு அரசு இணையத்தளத்தின் அனைத்துத் தகவல்களையும் முழுக்கத் தமிழில் தாருங்கள். TSCII வடிவில் இருந்தாலும், கூடவே ஒருங்குறித் தமிழிலும் ஒரு பதிப்பு தாருங்கள். இதன் மூலம் தமிழக அரசுத் தகவல்களை கூகுள் போன்ற தேடுபொறிகளின் மூலம் தேட இயலும்.

* தமிழ்நாடு அரசுப் பள்ளி மற்றும் கல்லூரி பாட நூல்கள் அனைத்தையும் ஒருங்குறி உரையாகவும், Pdf கோப்புகளாகவும் தாருங்கள். ஆங்கில வழியத்தில் படித்தவர்கள், தமிழ் வழியத்தில் படித்திருந்தாலும் அத்தகவல்கள்-தமிழ்க்கலைச்சொற்கள் மறந்தவர்கள், இலங்கை-சிங்கப்பூர்-மலேசியா வாழ் தமிழர்கள் ஆகியோருக்கு உதவும். இந்நாடுகளின் கலைச்சொல்லாக்கத்திலும் தமிழ்நாட்டுடன் இசைவு இருக்கும். தமிழ்நாட்டுப் பாட நூல்கள் நாட்டுடைமை என்பதால் இவற்றைப் பொதுக் களத்தில் எவருக்கும் பயன்படுவது போல் வைக்க வேண்டும்.

செய்தி: தமிழ்நாட்டுப் பள்ளிக்கூடப் பாடநூல்கள் இப்போது இணையத்தில் pdf வடிவில் கிடைக்கின்றன !

* நாட்டுடைமையாக்கப்பட்ட அனைத்துத் தமிழ் நூல்களையும் ஒருங்குறி உரையாகவும், Pdf கோப்புகளாகவும் தாருங்கள். உலகம் முழுக்க எண்ணற்ற ஆர்வலர்கள் மதுரைத் திட்டம் போன்றவை மூலம் தங்கள் பொன்னான நேரத்தைச் செலவிட்டு இந்நூல்களை மென்னூலாக்கி வருகிறார்கள். இது தேவையற்ற காலம் மற்றும் உழைப்பு விரயமாகும்.

* தமிழ் இணையப் பல்கலைக்கழகத்தின் தளத்துக்கும் ஒருங்குறித் தமிழ்ப் பதிப்பு தாருங்கள். அத்தளத்தில் உள்ள தேவையற்ற பயனர் எளிமையைக் குலைக்கும் கூறுகளை நீக்கி, எளிமையான உரை வடிவத் தளமாகத் தாருங்கள்.

* தமிழ்நாட்டுப் பல்கலைக்கழகங்களின் இணையத்தளங்கள் அனைத்திலும் தமிழ்ப் பதிப்பு கொண்டு வரப் பணியுங்கள்.

* கடந்த இரண்டு ஆண்டாகத் தமிழ் இணைய மாநாடு நடைபெறவில்லை. அதனை மீளத் தொடங்குங்கள்.

* தமிழ்நாட்டுத் தமிழ்ப் பாடம், கணினி அறிவியல் பாடங்கள் ஆகியவற்றில் கணினியில் தமிழ்ப் பயன்பாடு குறித்துப் பாடங்களைச் சேருங்கள். பள்ளிகளுக்கு வாங்கும் கணினிகளில் தமிழ்99 தமிழ் விசைப்பலகை அச்சிப்பட்டிருப்பதை உறுதி செய்யுங்கள். பள்ளிக் குழந்தைகளுக்கு கணினியை அறிமுகப்படுத்தும்போதே தமிழ்த் தட்டச்சையும் சேர்த்து அறிமுகப்படுத்துங்கள். தமிழ் லினக்ஸ், தமிழ் Firefox, தமிழ் Open Office என்று திறமூலத் தமிழ் மென்பொருள்களை ஊக்குவியுங்கள். இதனால் அரசுக்குச் செலவும் மிச்சம். குழந்தைகளும் ஆங்கிலம் மீதான மருட்சி இல்லாமல் எளிதில் கணினியைக் கையாளத் தொடங்குவார்கள்.

* தமிழ்நாட்டில் புதிதாகப் படித்து வெளிவரும் தமிழாசிரியர்களின் தரம் மெச்சிக் கொள்ளும் மாதிரி இல்லை. மிகச் சிறந்த மாணவர்களை தமிழ்ப் படிப்புக்கு ஈர்க்க கல்லூரியில் தமிழ்ப்பட்டப்படிப்பு முழுக்க இலவசமாகவும் (விடுதிச் செலவு உட்பட) அதில் பயிலும் மாணவர்களுக்கு சிறப்பு ஊக்கத்தொகையும் வழங்குங்கள். இதனால், தமிழ்ப் படிப்புக்குப் போட்டி ஏற்பட்டுச் சிறந்த மாணவர்கள் அப்படிப்பை நாடுவார்கள்.

தமிழ் அகரமுதலிகள்

* ஆங்கில வழியத்தில் படித்து தமிழில் துறை சார் சொற்கள் அறியாதோர் பயன்படுத்த வேண்டியது தமிழ் இணையப் பல்கலை அகரமுதலி . இதனால், சொற்களைத் திரும்ப கண்டுபிடிக்கும் அசட்டுத்தனத்தையும் பொருத்தமற்ற சொற்களை புதிதாக உருவாக்கும் பிழையையும் தவிர்க்கலாம்.

*  இலக்கியத்தில் உள்ள பழங்காலத் தமிழ்ச் சொற்கள், போன சில நூற்றாண்டுகளில் தமிழில் புழங்கிய பிற மொழிச் சொற்கள் குறித்து அறிய  சென்னைப் பல்கலைக்கழக அகரமுதலி விலை மதிப்பற்ற ஒரு களஞ்சியம். 

வலைப்பதிவு (blog), திரட்டி (aggregator) போன்ற அண்மைய கால நுட்பங்கள், போக்குகளுக்கான தமிழ்ச் சொற்களை அறிய உள்ள ஒரே தளம் தமிழ் விக்சனரி மட்டுமே. அதில் இல்லாத சொற்கள் குறித்து கேட்க, தேவையான இடங்களில் புதுச் சொற்களை உருவாக்க, பழைய பொருத்தமற்ற சொற்கள் குறித்து உரையாட தமிழ் விக்சனரி உரையாடல் குழுமத்தில் சேரலாம்.

4. இந்த முறை நான் இந்தியா சென்று திரும்பிய போது வாங்கி வந்த ஒரே நூல் – க்ரியாவின் தற்காலத் தமிழ் அகராதி. சன்னதியா சன்னிதியா சந்நிதியா? கருப்பா கறுப்பா? சிகப்பா சிவப்பா ? அரைஞாணா அரைஞானா ? – போன்ற அடிக்கடித் தோன்றும் குழப்பங்களைத் தீர்த்துக் கொள்ள உதவும் நல்ல அகரமுதலி இது. இது போன்று அச்சடிக்கப்பட அகரமுதலிகள் இல்லாதோர் பலர், இந்தக் கேள்விகளுக்கான விடையை அறிய கூகுளில் கருப்பு-கறுப்பு என்று இரு சொல்லையும் இட்டு எது அதிகமான முடிவுகளைத் தருகிறதோ அதை சரியெனக் கருதுவது உண்டு. சில சமயம், இது சரியான முடிவுகளைத் தரும் என்றாலும், இது ஒரு பிழையான அணுகுமுறையாகும். மேலும் அறிய கூகுளுக்குத் தமிழ் தெரியாது பாருங்கள்.