చేతిరాత గుర్తింపు

చేతిరాత గుర్తింపు (HWR), also known as చేతితో రాసిన టెక్స్ట్ గుర్తింపు (HTR) ఇది పేపర్ డాక్యుమెంట్ లు, ఫోటోగ్రాఫ్ లు, టచ్ స్క్రీన్ లు , ఇతర పరికరాల నుంచి చేతిరాత ఇన్ పుట్ ని అందుకోవడం , చేతివ్రాత గుర్తింపు అనేది చేతితో రాసిన ఇన్‌పుట్‌ను గుర్తించి, అర్థం చేసుకోగల కంప్యూటర్ సామర్థ్యం. దీనిని కొన్నిసార్లు ‘చేతితో రాసిన వచన గుర్తింపు’ అంటారు.[1] భాష్యం చెప్పే కంప్యూటర్ యొక్క సామర్థ్యం.వ్రాతపూర్వక వచనం యొక్క చిత్రం ఆప్టికల్ స్కానింగ్ (ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్) లేదా ఇంటెలిజెంట్ వర్డ్ రికగ్నిషన్ ద్వారా కాగితం ముక్క నుండి "ఆఫ్ లైన్" గా గ్రహించబడుతుంది. ప్రత్యామ్నాయంగా, పెన్ చిట్కా యొక్క కదలికలు "లైన్" లో గ్రహించబడతాయి, ఉదాహరణకు పెన్-ఆధారిత కంప్యూటర్ స్క్రీన్ ఉపరితలం ద్వారా, ఎక్కువ ఆధారాలు అందుబాటులో ఉన్నందున ఇది సాధారణంగా సులభమైన పని. ఇందులో చేతివ్రాత గుర్తింపు వ్యవస్థ ఆకృతీకరణను నిర్వహిస్తుంది, సరైన విభజనను అక్షరాలుగా చేస్తుంది , చాలా వరకు సరిఅయిన ఆమోదయోగ్యమైన పదాలను కనుగొంటుంది.చేతితో రాసిన టెక్ట్స్ ని గుర్తించడం అనేది ఇంటెలిజెంట్ క్యారెక్టర్ రికగ్నిషన్(ICR)గా పేర్కొనబడుతుంది, ఎందుకంటే ఐసిఆర్ పరిష్కరించడానికి అవసరమైన అల్గారిథమ్ లు జనరిక్ OCRని పరిష్కరించడం కంటే మరింత తెలివితేటలు అవసరం అవుతాయి.[2]చేతివ్రాత గుర్తింపును ఇన్‌పుట్ పద్దతిగా చూడటం ప్రజలకు అలవాటు అయినప్పటికీ, డెస్క్‌టాప్ లేదా నోట్‌బుక్ కంప్యూటర్లలో ఇది విస్తృతంగా ఉపయోగించబడలేదు. కీబోర్డ్ ఇప్పటికీ వేగంగా, నమ్మదగిన ఇన్పుట్ పద్ధతిగా విస్తృతంగా పరిగణించబడుతుంది.

కంట్రీ స్టార్ టెక్స్ విలియమ్స్ సంతకం.

చేతివ్రాత గుర్తింపులో రెండు రకాలు ఉన్నాయి. మొదటిది రెండింటిలో పాతది, దీనిని ఆఫ్‌లైన్ చేతివ్రాత గుర్తింపు అంటారు.

ఇక్కడే చేతితో రాసిన ఇన్‌పుట్ స్కాన్ చేయబడి లేదా ఫోటో తీయబడి కంప్యూటర్‌కు ఇవ్వబడుతుంది.

రెండవది ఆన్‌లైన్, ఇక్కడే స్టైలస్ / టచ్‌స్క్రీన్ ద్వారా రచన ఇన్‌పుట్ అవుతుంది.

ఆఫ్ లైన్ గుర్తింపు

మార్చు

ఆఫ్ లైన్ హ్యాండ్ రైటింగ్ గుర్తింపులో ఒక ఇమేజ్ లోని టెక్ట్స్ ని లెటర్ కోడ్ లుగా ఆటోమేటిక్ గా మార్చడం , కంప్యూటర్ , టెక్ట్స్ ప్రాసెసింగ్ అప్లికేషన్ ల్లో ఇది ఉంటుంది. ఈ ఫారం ద్వారా పొందిన డేటా చేతివ్రాత యొక్క స్థిర ప్రాతినిధ్యంగా పరిగణించబడుతుంది. వేర్వేరు వ్యక్తులు వేర్వేరు చేతివ్రాత శైలులను కలిగి ఉన్నందున ఆఫ్‌లైన్ చేతివ్రాత గుర్తింపు చాలా కష్టం. ,, నేటి వరకు, OCR ఇంజిన్లు ప్రధానంగా మెషిన్ ప్రింటెడ్ టెక్ట్స్ , చేతి "ప్రింటెడ్" (క్యాపిటల్ లెటర్స్ లో రాయబడ్డ) టెక్ట్స్ కొరకు ఐ.సి.ఆర్.

అక్షర సంగ్రహణ

మార్చు

ఆఫ్‌లైన్ అక్షర గుర్తింపు తరచుగా వ్రాసిన రూపం లేదా పత్రాన్ని స్కాన్ చేస్తుంది. స్కాన్ చేసిన చిత్రంలో ఉన్న వ్యక్తిగత అక్షరాలను సంగ్రహించాల్సిన అవసరం ఉందని దీని అర్థం. ఈ దశను చేయగల సాధనాలు అందుబాటులో ఉన్నాయి.  అయితే, ఈ దశలో అనేక లోపాలు ఉన్నాయి. కనెక్ట్ చేయబడిన అక్షరాలను రెండు అక్షరాలతో కూడిన ఒకే ఉప-చిత్రంగా తిరిగి ఇవ్వడం చాలా సాధారణం. గుర్తింపు దశలో ఇది పెద్ద సమస్యను కలిగిస్తుంది. కనెక్ట్ చేయబడిన అక్షరాల ను సరిగా నిర్దారించటానికి అనేక అల్గోరిథంలు అందుబాటులో ఉన్నాయి.

అక్షర గుర్తింపు

మార్చు

వ్యక్తిగత అక్షరాలను వేరు చేసిన తరువాత, అనుబంధ కంప్యూటర్ అక్షరాన్ని గుర్తించడానికి ఒక గుర్తింపు ఇంజిన్ ఉపయోగించబడుతుంది. అనేక విభిన్న గుర్తింపు పద్ధతులు ప్రస్తుతం అందుబాటులో ఉన్నాయి.

ఆన్-లైన్ గుర్తింపు

మార్చు

ఆన్-లైన్ చేతివ్రాత గుర్తింపుకు రాసేటప్పుడు రచనను రికార్డ్ చేయడానికి టచ్ స్క్రీన్ లేదా ఇతర డిజిటల్ పరికరం అవసరం. వేళ్లు లేదా ఇన్‌పుట్ పెన్నులు లేదా గ్రాఫిక్స్ టాబ్లెట్‌లతో కూడిన స్మార్ట్‌ఫోన్‌లు, టాబ్లెట్‌లు వంటి అనేక రకాల ఇన్‌పుట్ పరికరాలను ఉపయోగించవచ్చు. ఈ ఇన్పుట్ పరికరాలు ఇన్పుట్ పెన్ ఎక్కడ ఉందో దాని గురించి సమాచారాన్ని అందిస్తుంది. కొన్ని పరికరాలు పెన్ టచ్‌స్క్రీన్‌లో లేనప్పటికీ, దాని పైన ఉన్నప్పటికీ ఈ సమాచారాన్ని అందిస్తాయి. ఉపయోగించిన సాంకేతికతను బట్టి ఇన్పుట్ యొక్క కోఆర్డినేట్లు ఎంత ఒత్తిడి తెచ్చాయో కూడా సమాచారాన్ని అందించాయి.ప్రీప్రాసెసింగ్ యొక్క ఉద్దేశ్యం అసంబద్ధమైన ఇన్పుట్ డేటాను విస్మరించడం, ఇది ప్రతికూల ప్రభావాన్ని తగ్గిస్తుంది. ఇందులో వేగం, ఖచ్చితత్వం ఉంటాయి. ఇది సాధారణంగా ఇమేజ్ బైనరైజేషన్ , నార్మలైజేషన్, శాంప్లింగ్, స్మూతీంగ్, డెనోయిజింగ్ ప్రిప్రాసెసింగ్ కలిగి ఉంటుంది.

చేతిరాత గుర్తింపులో సవాళ్లు

మార్చు

ఒక వ్యక్తి నుంచి స్ట్రోక్ ల యొక్క భారీ వైవిధ్యం , సందిగ్ధత ఉంటుంది

ఒక వ్యక్తి యొక్క చేతిరాత శైలి కూడా కాలానుగుణంగా మారుతూ ఉంటుంది , అస్థిరంగా ఉంటుంది.

కాలక్రమేణా డీగ్రేడేషన్ వల్ల సోర్స్ డాక్యుమెంట్/ఇమేజ్ యొక్క నాణ్యత సరిగ్గా లేకపోవడం వలన ఇబ్బంది

ప్రింట్ చేయబడ్డ డాక్యుమెంట్ ల్లో టెక్ట్స్ ఒక సరళరేఖలో ఉంటుంది, అయితే మానవులు తెల్లకాగితంపై సరళరేఖలో టెక్ట్స్ ని రాయాల్సిన అవసరం లేదు.

కలిపి రాతలో అనేది క్యారెక్టర్లను వేరు చేయడం , గుర్తించడం సవాలుగా ఉంటుంది

చేతిరాతలోని టెక్ట్స్ కు కుడివైపున వేరియబుల్ రొటేషన్ ఉంటుంది, ఇది ప్రింట్ చేయబడ్డ టెక్ట్స్ కు విరుద్ధంగా ఉంటుంది, ఇక్కడ అన్ని టెక్ట్స్ తిన్నగా ఉంటుంది.

రాబోయే పరిష్కారాలు

మార్చు

చేతితో రాసిన పత్రాలు , సందేశాలను గుర్తించడానికి , డిజిటలైజ్ చేయడానికి కంప్యూటర్లు, తెలుసుకోవడానికి చాలా సాంకేతిక వ్యవస్థలు ఉన్నాయి. విభిన్న అక్షరాలు, అక్షరాలు , అంకెలు తెలుసుకొటానికి చాలా లోతైన అభ్యాసం (డీప్ లెర్నింగ్) అవసరం అవుతుంది, విభిన్న చేతివ్రాత శైలుల కారణంగా తేడాలు ఉన్నప్పటికీ వాటిని గుర్తించగల లోతైన అభ్యాసం neural networks , న్యురల్ నెట్‌వర్క్‌లు వస్తున్నాయి. లోతైన అభ్యాసం యంత్రాలను కాలక్రమేణా నేర్చుకోవడానికి వేర్వేరు చేతివ్రాత ఉన్నప్పటికీ అక్షరాలను ఎలా గుర్తించాలో యంత్రం నేర్చుకోవచ్చు

మూలాలు

మార్చు
  1. "Why is handwriting recognition so difficult for AI?". ThinkAutomation (in బ్రిటిష్ ఇంగ్లీష్). 2020-07-07. Archived from the original on 2020-11-01. Retrieved 2020-10-30.
  2. "How to easily do Handwriting Recognition using Deep Learning". AI & Machine Learning Blog (in ఇంగ్లీష్). 2020-09-16. Retrieved 2020-10-30.