ఒసిఆర్(OCR)
విజ్ఞాన సర్వస్వంతో సమ్మిళితం కావాలంటే ఈ వ్యాసం నుండి ఇతర వ్యాసాలకు మరిన్ని లింకులుండాలి. (సెప్టెంబరు 2016) |
ఒసిఆర్ అనగా ఆప్టికల్ కేరెక్టర్ రీడర్, ఎదైనా పాఠ్యాన్ని బొమ్మ రూపంలో గ్రహించినపుడు దానిలోని పాఠ్యాన్ని గుర్తించగల ఉపకరణం. ఇంగ్లీషు లాంటి భాషలకు సమర్థవంతమైన సాఫ్ట్వేర్లు, భారతీయ భాషలకు అభివృద్ధి దశనుండి 2015 ప్రాంతంలో విడుదలైన సాఫ్ట్వేర్లు వున్నాయి.[1]
ఆప్టికల్ కారక్టర్ రికగ్నిషన్ (దృష్టాక్షర గుర్తింపు), సాధారణంగా ఓసీఆర్ అని పిలుస్తారు. చేత్తో వ్రాసిన, టైపు చేసిన, ముద్రించిన పాఠ్యాం యొక్క స్కాన్ చేసిన బొమ్మలనుండి యంత్రానికి అర్థమయ్యే సంకేత పాఠ్యంగా స్వతహాగా (ఆటోమేటిగ్గా) మార్చే ప్రక్రియ. ముద్రిత పుస్తకాలను డిజిటైజర్ చేసే ప్రక్రియల్లో ఇది ముఖ్యమైనది. తద్వారా ఆ పుస్తకాలు యాంత్రికంగా అన్వేషించవచ్చు. ప్యాటర్న్ గుర్తింపు, కృత్రిమ తెలివితేటలు,, కంప్యూటరు విజన్ శాస్త్రాలయందు ఓసీఆర్ పరిశోధనాంశం.
తొలినాళ్ళల్లో ప్రోగ్రాము కేవలం ఒక ఖతికి మాత్రమే పనిచేసేది. ఇప్పుడు ఆంగ్లభాషలకు చాలా రకాల ఖతులు వాడినా చాలా చక్కగా పనిచేసే ఓసీఆర్లు అందుబాటులో ఉన్నాయి. . బొమ్మలు, ఫార్మాటింగు, ఖాళీ జాగాలతో సహా పుస్తకంలో ఉన్నట్టే రమారమీ యాంత్రిక పత్రీకరణ చేసే ఓసీఆర్లు అందుబాటులో ఉన్నాయి.
తెలుగు ఒసిఆర్ కూడా కొత్త సాంకేతికాలను ఆధారం చేసుకొని చాలా ఖతులకు 0-10శాతం దోషాలతో పనిచేయగల సామర్ధ్యం పొందినవి అభివృద్ధి చేయబడినవి.[2] భారత భాషల అధ్యయన సంస్థ కూడా ఒసిఆర్ ను 2018లో విడుదల చేసింది. దీనికి సంబంధించిన పాత పరిశోధన ప్రకారం తెలుగు భాష పనితనంలో దోషం 17 శాతంగా ఉంది.[3]
ఇవీ చూడండి
మార్చుమూలాలు
మార్చు- ↑ Schaeffer, Jaron (Jun 22, 2010). "Google Drive Blog: Optical character recognition (OCR) in Google Docs". drive.googleblog.com. Retrieved April 11, 2016.
- ↑ Achanta, Rakesh (Sep 20, 2015). "Telugu OCR framework using Deep Learning - 1509.05962.pdf" (PDF). pdf.js. Retrieved April 11, 2016.
- ↑ Arya, Deepak (September 17, 2011). "Experiences of Integration and Performance Testing of Multilingual OCR for Printed Indian Scripts" (PDF). Retrieved March 8, 2019.[permanent dead link]