மொழித் தொழில்நுட்பப் புலம்

செம்மொழித் தமிழாய்வு மத்திய நிறுவனம் கி.பி.6 ஆம் நூற்றாண்டிற்கு முந்தைய செவ்வியல் இலக்கண இலக்கியங்களை மையமாகக் கொண்டு ஆய்வுப் பணிகளை மேற்க்கொண்டு வருகின்றது. இந்நிறுவனத்துள் இயங்கி வரும் பன்னிரெண்டு புலங்களுள் ஒன்றான மொழித் தொழில்நுட்பப் புலம் வரையறுக்கப்பெற்ற தமிழ்ச் செவ்வியல் இலக்கண, இல்க்கியங்கள் தொடர்பான ஆய்வுகளில் ஈடுபாட்டோடு தொழிற்பட்டு வருகின்றது. இப்புலம் தொழில்நுட்பத்தின் வாயிலாகச் செவ்வியல் இலக்கண, இலக்கியங்களை உலகெங்கும் கொண்டு செல்வதையும் தமிழின் அனைத்து மொழி வளங்களையும் கணினி, இணையம் வழி ஆய்வுலகிற்குக் கொண்டு சேர்ப்பதையும் முதன்மை நோக்கமாகக் கொண்டு இயங்குகின்றது.

  • இந்நோக்கத்தைச் செயல்படுத்தும் வகையில்,

செவ்வியல் இலக்கண, இலக்கிய தரவக உருவாக்கம், இலக்கணம், தொடரியல், சொற்பொருள் மற்றும் பொருண்மை அடிப்படையிலான குறியீட்டுத் தரவக (Tagged Corpus) உருவாக்கம், இணைத் தரவக (Parallel Corpus) உருவாக்கம்

கணினி மொழியியல் (Computational Linguistics) அடிப்படையில் உருபனியல், ஒலியனியல், தொடரியல் ஆய்வுகளை கணினி வழியில் மேற்கொள்ள கருவி உருவாக்கம்

சொல் வளங்கள் (Lexical Resources) அடிப்படையில் சங்க இலக்கியங்களுக்கான சொற்களஞ்சியம், சொல் வலை, தேடுபொறி உருவாக்கம்

கல்வெட்டுத் தரவக (Inscription Corpus Studies) ஆய்வில் பிராமி, கல்வெட்டு, செப்பு தகடு, கிரந்தம் போன்றவற்றில் காணப்பெறும் தரவுகள் இணையத் தரவகமாக உருவாக்கம்

செவ்வியல் தமிழ்த் தொடர்பான அனைத்துத் தரவுகளையும் ஒருங்கிணைத்து ஒரு இணைய தரவுச் சுரங்க (Data Mining) உருவாக்கம்
இயற்கை மொழி ஆய்விற்குப் பயன்படும் பல்வேறு மென்பொருள் உருவாக்கம்

ஆகிய ஆய்வுகளை முன்னெடுத்து வருகின்றது.

முதற்கட்டமாக நாற்பத்தொரு செவ்வியல் தமிழ் நூல்களுக்கான தரவு உருவாக்கப்பெற்று ‘இணையவழி உ.வே.சா செம்மொழித் தமிழ்த் தரவகம் (Online U.Ve.Sa. Classical Tamil Corpus)’ எனப் பெயரிடப்பெற்று இணையத்தளத்தில் பதிவேற்றம் செய்யப்பெற்றுள்ளது.
இயற்கை மொழி ஆய்விற்குப் பயன்படும் பல்வேறு மொழி ஆய்வுக் கருவிகள் உருவாக்கப்பெற்று பொதுவெளிப் பயன்பாட்டிற்கு இணையத்தில் அளிக்கப்பெற்றுள்ளது.

 

மொழித் தொழில்நுட்பப் புலம்

 

பார்வையாளர்

website hit counter

© மொழித் தொழில்நுட்பப் புலம், செம்மொழித் தமிழாய்வு மத்திய நிறுவனம், செம்மொழிச் சாலை, பெரும்பாக்கம், சென்னை 600 100