May 15, 2019

භාෂාව සඳහා අවශ්‍ය දත්ත (ඩේටා) ප්‍රමාණය floppy තැටියක මතකයද?


ඔබ පළමු භාෂාව ඉගෙන ගන්නා විට, ඔබගේ මොළය තුල ගබඩා කරන තොරතුරු සදහා මෙගාබයිට් 1.5 ක පමණ මොළයේ ගබඩා  ඉඩක් වෙන්කර ගන්නා බවද එය තමා අපේක්ෂා කළ ප්‍රමාණයට වඩා බොහෝසෙයින් අඩු බවත් නිව්යෝක්හි රොචෙස්ටර් විශ්ව විද්‍යාලයේ ආචාර්ය Frank Mollica (ෆ්රෑන්ක් මොලිකා) පවසා තිබේ. එය මුල් යුගයේ පරිගණක සඳහා භාවිතා කළ floppy  තැටියක මතක ප්‍රමාණයට සමානය. මෙම අධ්‍යනය සඳහා මොලිකා සහ ඔහුගේ සගයන් තොරතුරු න්‍යාය ලෙස හැඳින්වෙන ගණිත අංශයේ කොටසක් භාවිතා කර තිබේ. ඉංග්‍රීසි භාෂාව සඳහා මොළයට  අවශ්‍යවන දත්ත ප්‍රමාණය බිට් (bit) කොපමණ සංඛ්‍යාවක්දැයි සොයා ගැනීමට තොරතුරු න්‍යායෙන් ගණනය කිරීමක් කර තිබේ. එය හුදෙක් ඇස්තමේන්තු කිරිමක් පමණක් වන නමුත් එමගින් අනෙක් භාෂා සදහා ගණනයට මෙන්ම ඉංග්‍රීසි භාෂාව සඳහා ගණනය යාවත්කාලින කිරීමට අවශ්‍ය පසුබිම සකස් කර ඇතැයි ඔහු පවසා තිබේ.

ඔබ දන්නා වචනයක් ඇසෙන විට, ඔබට එය අවබෝධ කර ගැනීමට උපකාර කිරීම සඳහා ඔබේ මොළය සියලු වර්ගවල තොරතුරු වලට පිවිසෙන විට: වචනය සෑදී ඇති ශබ්ද, එහි තේරුම, වාක්‍යයේ ඇති සන්දර්භය, වාක්‍යයේ කාල පරාසය යනාදී තව බොහෝ දේ සළකනු ලැබේ.

“භාෂාව සහ සන්නිවේදනය ආහාර හා ජලය ලෙස අතිශයින් වැදගත් වේ. අපි සන්නිවේදනය මගින් තොරතුරු හුවමාරු කර ගැනීම, සබඳතා ගොඩනඟා ගැනීම, කලාත්මක නිර්මාණ වැනි නොයෙක් කාර්යයන් ඉටු කරන්නෙමු. මෙම නව මුලික  විශේෂාංගය මගින් මොළය තුල භාෂාව විද්‍යාමාන වන ආකාරය සහ එය අපගේ දෛනික ජීවිතය හැඩ ගැස්වීම සඳහා කෙසේ බලපාන්නේද බව අපි සොයා සොයා බැලුවෙමු. අපි සියලු දෙනාටම කථා කිරීම සඳහා උපන් භාෂාවක් තිබේ. පසුව එය සාමාන්‍යයෙන් අපේ මව් භාෂාව බවට පත් වේ. විවිධ මාර්ග ඔස්සේ තවත් අමතර භාෂාවක් අප හසුරුවා ගතහොත් එමගින් විවිධ වෙනත් සංස්කෘතීන් හා අත්දැකීම් අපට විවර කර ගත හැකිය.” ප්‍රකාශයේ දැක්වේ.

අධ්‍යන කණ්ඩායමේ ගණනය කිරීම හා අර්ථනිරුපන අනුව ඉංග්‍රීසි ශබ්ද කෝෂයක සාමාන්‍යයෙන් ඇති  වචන 40,000 ක් ඉගෙනගැනීම සඳහා බිට්(bit) 400,000 ක් පමණ අවශ්‍යය. එක් වචනයකට බොහෝ තේරුම් ඇති නිසා එම වචනවල අර්ථය තේරුම් ගැනීම සඳහා තවත් විශාල bit ප්‍රමාණයක් අවශ්‍යය. වචන නිර්මාණය කරන විශේෂිත ශබ්ද phonemes (ශබ්දිම)  50 ක් සඳහා එකකට bit 15 බැගින් bit 750 ක් පමණ අවශ්‍ය වේ. වචනයක සම්පුර්ණ අර්ථය සඳහා වාක් කෝෂිය අර්ථ විචාරය (lexical semantics) සැලකිය යුතුය.  turkey” වචනය සැලකු විට ඒ සමග විශාල තොරතුරු ප්‍රමාණයක් දැනෙන අතර එමගින් ඌට පියාඹිය හැකිද? ඇවිදිය හැකිද? යනාදිය දැනගත හැකි වේ. මේ සියල්ල සැලකීමෙන් වචන 400,000 වෙනුවෙන් bit මිලියන 12 ක පමණ දත්ත අවශ්‍ය වන බව ඔවුන්ගේ අදහසයි.

භාෂා ඉගෙන ගැනීමේදී සමහර වචන යෙදෙවන වාර ප්‍රමාණයද වැදගත් වන අතර මෙම වචනවල සංඛ්‍යාත තොරතුරු ගබඩා කිරීම සඳහා bit 80,000 ක් පමණ යෙදවිය යුතුය. අවසන් වශයෙන්, වාක්‍ය රචනය - වාක්‍යයන් පාලනය කරන රීති මාලාවන්, අවම වශයෙන් bit  700 ක් පමණ වේ . මේ ආකාරයෙන් සැලකු විට ඉංග්‍රීසි භාෂාව සදහා මෙගාබයිට් 1.56 ක් දත්ත එනම්  floppy තැටියේ ධාරිතාවට වඩා තරමක් වැඩි ප්‍රමාණයක් අවශ්‍ය වේ.

කෙසේවෙතත් මේවා හුදෙක් ගණනය කිරීම් වන අතර එය තවදුරටත් සංවර්ධනය කළ යුතු බවත් වෙනත් භාෂාවන් සඳහා වූ ගණනය කිරිම් වලටද යොදාගත හැකි බවත් මොලිකා පවසා තිබේ.

අන්තර්ජාලය ඇසුරෙන් සකස්කළේ හර්ෂ ලංකේශ්වර

0 comments:

Post a Comment