వికీపీడియా:వికీప్రాజెక్టు/గూగుల్ అనువాద వ్యాసాలు

యాంత్రికానువాదం ద్వారా చేర్చిన వ్యాసాలపై జరిగిన చర్చలు
గూగుల్ యాంత్రికానువాదం ద్వారా వికీలో చేరిన వేలాది వ్యాసాలపై అనేక చర్చోపచర్చల తరువాత, వాటిని శుద్ధి చేసేందుకు అనేక విఫలయత్నాలు జరిగాక, చివరికి వాటిని తొలగించాలని సముదాయం నిశ్చయించింది. 2020 ఫిబ్రవరి 5 న ఆ వ్యాసాలన్నిటినీ తొలగించారు. ఆయా సందర్భాల్లో జరిగిన చర్చల వివరాలను కింది ట్యాబుల్లో చూడొచ్చు.
ప్రాజెక్టు | 2010 నవంబరు | 2016 జూలై | 2016 సెప్టెంబరు | 2016 డిసెంబరు | 2018 జూలై | 2020 జనవరి | ఇతర చర్చలు

ఈ పేజీలో గూగుల్ ట్రాన్స్లేటర్ టూల్కిట్ గూగుల్ అనువాద పరికరం ఉపయోగించి అనువాదం మెరుగు చేసి ఎక్కించిన వ్యాసాలకు సంబంధించిన విధి విధానాలు, తీసుకోవలసిన చర్యలు, సూచనలు మొదలగు కొన్ని మార్గదర్శకాలు చర్చించబడతాయి. ఎవరైనా ఇక్కడ కొత్త సూచనలు, చర్చలు చేయవచ్చు. ఏకపక్షంగా గూగుల్ ఈ ప్రాజెక్టుని 2009-2011లో నడిపి దాదాపు 1989 వ్యాసాలు చేర్చింది.(క్వెరీ ప్రకారం 2015-05-23 న 1991 లెక్కకు వచ్చాయి వీటిలో 1989 గూగుల్ ప్రాజెక్టు సభ్యుల పనిగా ప్రాజెక్టు కాలరేఖ ప్రకారం విశ్లేషణలో గుర్తించడమైనది)

సమస్య పరిచయం

మార్చు

ప్రసిద్ధ శోధనా యంత్రపు కంపెనీ గూగుల్ యాంత్రిక అనువాద పరికరం "గూగుల్ ట్రాన్స్‌లేట్" ను ఆవిష్కరించింది. అయితే ఈ ఆన్లైను పరికరం కొన్ని భాషలకే ఎంతోకొంత నాణ్యమైన అనువాదాలు చేయగలదు. ఇలా ఏ భాషలకు నాణ్యతగా పనిచేస్తుందన్న విషయం ఆయా భాషలకు లభ్యమౌతున్న అనువాద గ్లాసరీలు, పదకోశాలను అనుసరించి ఉంటుంది. మిగిలిన భాషలన్నింటికీ యాంత్రిక అనువాదం అభివృద్ధి చెయ్యాలంటే కొంత యంత్రానికి తర్ఫీదు ఇవ్వగల నాణ్యమైన అనువాద పాఠ్యాలు ఉండాలి, అంతేకాక విస్తృతమైన అనువాద గ్లాసరీలు తయారు చెయ్యాలి. దీన్ని సాధించడానికి గూగుల్ ఒక ట్రాన్స్‌లేటర్ టూల్ కిట్ అనే పనిముట్టును తయారుచేసి క్రౌడ్‌సోర్సింగ్ (మందకు అప్పజెప్పడం) అనే విన్నూత ప్రక్రియను అవలభించింది. ఇది ఇరుపక్షాలకి లాభించే సర్దుబాటే. ఈ పరికరాన్ని ఉపయోగించి అనువాదాలు చేసిన పాఠ్యం ఆయా భాషల్లో అనువాద గ్లాసరీలు అభివృద్ధి చెందడానికి, ఈ అనువాద పాఠ్యం ఉపయోగించి యాంత్రిక అనువాదాన్ని మరింత మెరుగుపరచడానికి ఉపయోగపడతాయి. అలాగే ఆ భాషల్లో అనువాదాలు చేసేవారికి రాను రాను యాంత్రిక అనువాదం సలహాలు మెరుగౌతాయి.


గూగుల్ ఒక ట్రాన్స్‌లేటర్ టూల్ కిట్ అనువాద గ్లాసరీల అభివృద్ధికి మూల పాఠ్యంగా వికీపీడియాను ప్రోత్సహిస్తుంది. అందువల్ల అది ఏదైనా ఒక ఆంగ్ల వికీపీడియా వ్యాసాన్ని ఎంపిక చేసుకొని, దాన్ని కావలసిన భాషలోకి తర్జుమా చేసి, నేరుగా ఆ పరికరంలో నుండే ఆయా ప్రాంతీయ భాషా వికీలోకి ఎక్కించే సదుపాయం కల్పించింది. దీనిని ఉపయోగించి కొంతమంది ఔత్సాహికులు మరియు కొంతమంది ప్రతిఫలం ఆశించి పనిచేసేవారు (గూగుల్ ప్రాజెక్టు) ఆంగ్ల వికీ వ్యాసాలను తెలుగులోకి తర్జుమా చేసి, క్రమం తప్పకుండా అనేక పెద్ద వ్యాసాలను తెవికీలో నేరుగా చేర్చుతున్నారు.

గూగుల్ వారి వివరణ

మార్చు

వికీమేనియా 2010 (జులై 9-11) లో గూగుల్ ప్రతినిధి ఈ ప్రాజెక్టు పై ప్రసంగించారు. [1],[2]46 శాతం వికీపీడియా పేజీ వీక్షణలు గూగుల్ ద్వారా జరుగుతున్నాయి. గూగుల్ తన లక్ష్య సాధనకు (సమగ్ర సమాచారాన్ని ప్రజలకు అందుబాటులో చేయటం) వికీపీడియాలో విషయాలను పెంచటానికి గూగుల్ అనువాద పరికరం తయారు చేశారు. సాధారణ అనువాద పద్దతులలో వాక్య విశ్లేషణ ఆధారంగా జరుగుతుంది. దీనికి భిన్నంగా, రెండుభాషలలోని, మూల వ్యాసం, అనువాద వ్యాసాలలో పదాల, వ్యాసాల జతల జాబితా ఆధారంగా ఈ అనువాద పద్ధతి పనిచేస్తుంది. ఈ జాబితా ఎంత పెద్దదైతే అనువాదం అంత మెరుగుగా వుంటుంది.

ఈ పరికరం సహాయంతో పదానికి పదం, పదబంధానికి పదబంధం యాంత్రికంగా అనువదిస్తుంది, ఆ తరువాత అనువాదకుడు దీనిని మెరుగు (కొత్త పదాలు లేక పదబంధాలు లేక వాక్య నిర్మాణం సరిచేయటం చేస్తాడు. మానవ సహాయం శాతం రూపంలో ఇవ్వబడుతుంది. దీనిని ఆధారంగా ముద్రించాల లేదా అన్న నిర్ణయం తీసుకోవచ్చు.

గూగుల్ అనువాదం పరికరం ద్వారా 2500 భాష జతలు పూర్తి యాంత్రికంగా, 100000భాష జతలు మానవ సహాయంతో అనువాదం చేయవచ్చు. పాశ్చాత్య భాషలలో అనువాద కార్పస్ ఎక్కువగా (ఐక్యరాజ్య సమితిలో పత్రాలను అన్ని అధికారిక భాషలలో వున్నాయి), భారతీయ భాషలలో దీనిని పెంచడానికి ఆగష్టు 2008 లో హిందీతో మొదటి ప్రయోగం జరిగింది. వికీమీడియా ఫౌండేషన్ సహకారంతో హిందీ వికీపీడియన్లని సంప్రదించారు. 100 కి పైగా వ్యాసాలను అనువదించారు. ఇది సత్ఫలితాలనిచ్చింది. అనువాద వ్యాసాలను శోధనాయంత్రాలలో వాడిన పదాల ప్రాధాన్యతల ఆధారంగా ఎంపిక చేశారు. 60 శాతం అనువాద వ్యాసాలు, శోధించిన వ్యాసాలలో మొదటి స్థానంలో, 80 శాతం వ్యాసాలు మొదటి ఐదు స్థానాలలో వున్నాయి.

ఆ తరువాత అరబిక్, ఇండిక్ (తమిళం, తెలుగు, బెంగాలి..)స్వాహిలి భాషలలో ప్రయోగాలు జరుగుతున్నాయి. అరబిక్ లో ఔత్సాహికులు, నగదు కోసం పనిచేసే అనువాదకులు పనిచేశారు. 1000 పైగా వ్యాసాలు (5మిలియన్ పదాలు)చేర్చగా 20 శాతం వ్యాసాలు తిరస్కరించబడ్డాయి. స్వాహిల్ లో పోటీల ద్వారా నిర్వహించారు. 800 మంది నమోదు చేయగా, 100 మంది క్రియాశీలంగా వున్నారు.

ఇండిక్ భాషలలో 10 మిలియన్ పదాలతో, 1000 కి పైగా వ్యాసాలను చేర్చారు. తమిళం లో 3 మిలియన్ పదాలు (మొత్తం వికీ 6.5 మిలియన్ పదాలు), తెలుగులో 1.55 మిలియన్ పదాలు చేర్చారు.0.7మిలియన్ పదాల చేర్చిన తరువాత బెంగాలి భాష వారుదీనిని తిరస్కరించారు. జూన్ 2009 లో ప్రజలకు విడుదల చేశారు.

గూగుల్.ఆర్గ్

గూగుల్.ఆర్గ్ (ఇప్పటి వరకు చేసిన గూగుల్.కాం వారికి భిన్నంగా) పరిసరాలు, శక్తి, ఆరోగ్యం రంగాలలో వ్యాసాల సంఖ్యను గణనీయంగా పెంచడానికి పూర్తిగా ఔత్సాహికుల విధానంలో(గూగుల్ మాప్ మేకర్ పద్ధతి) నిర్వహిస్తున్నారు.

గూగుల్ వారికి ఎదురైన ఇబ్బందులు
  • కుడి నుండి ఎడమకు రాయు భాషలు(RTL), స్థలకేటాయింపు పదాలు(placeholder), లింకులు
  • వాక్యానుగత అనువాదం
  • మూసలు అనువాదన చేయబోయే భాషలో వుండకపోవడం
  • వికీపీడియా లో నేరుగా ముద్రణ చేయడం లేక మునుజూపు ముద్రణ.

తమిళ వికీ వారి స్పందనలు

మార్చు

తమిళ వికీపీడియన్ రవిశంకర్ తయారుచేసిన ప్రసంగాన్ని [3] మయూరనాథన్ వికీమేనియాలో వ్యక్తీకరించారు. దానిలో మఖ్యవిషయాలు. మార్చి 2009 లో గూగుల్ అనువాద పని గోప్యంగా ప్రారంభమైంది. ఫిభ్రవరి 2010 లో గూగుల్ తో సమన్వయం మొదలైంది.

సాంకేతిక సమస్యలు
  • అత్యధిక ఎరుపు లింకులు
  • మూసలు దిగుమతి చేయటం లేదు
  • బొమ్మలు దిగుమతి చేయటం లేదు.
  • గూగుల్ అనువాద పరికరం వాడుకరికి సౌలభ్య లోపాలు.
నిర్వహణ సమస్యలు
  • వ్యాసాల ఎంపిక భారత దేశంలో ఇంగ్లీషు శోధన పదాల ప్రాధాన్యంగా జరిగింది. అందువలన అమెరికన్ పాప్ గాయనీగాయకుల వ్యాసాలు అనువాదం తమిళ భాష వారికి ఉపయోగంలేదు.
  • ఇప్పటికే వున్న వ్యాసాల తొలగించి వాటి స్థానంలో అనువాద వ్యాసాలు స్థాపించబడుట
  • అనువాదకులు ఒక ఖాతా ద్వారా పని చేశారు.
  • ఔత్సాహిక వికీపీడియన్ల స్పందనల సమయం, నగదు ప్రతిఫలం అనువాదకులు ఆకాంక్షకి సరిపోలేదు.
  • 15 పైగా అనువాదకులు వివిధ అనువాద సంస్థల ద్వారా పనిచేస్తున్నారు.సమన్వయంలో లోపాలు ఏర్పడుతున్నాయి.
వికీపీడియా తత్వ సమస్యలు
  • నగదు పని చేసే అనువాదకులకు/వికీపీడియన్లు (గూగుల్) వలన, సాధారణ వికీపీడియన్లలో ఆసక్తి తగ్గిపోతున్నది
  • స్వల్పకాలికంగా ఉపాధి కల్పించబడుతున్నది. దీర్ఘకాలికంగా దీని ఫలితాలు ఎలా వుంటాయో తెలియదు.
గూగుల్ తో సంప్రదింపుల ఫలితాలు
  • అనువాద వ్యాసాల శుద్ధి అనువాదకులే చేయాలి
  • గూగుల్ అనువాద సభ్యులు, గూగుల్ అనువాద వ్యాసాల వర్గాలు గూగుల్ అనువాదకులు వాడాలి
  • అనువాదకులు వ్యక్తిగత ఖాతాలో వికీలో పనిచేయాలి

తెవికీ అనుభవాలు

మార్చు
  • ఈ అనువాదాలు చేస్తున్న సభ్యులెవరూ, తెవికీ లో అనుభవంగలవారు కాదు.
  • చాలా మటుకు ఈ అనువాదాలు మానవ సహాయంతో చేస్తున్నా, కొన్ని వాక్య నిర్మాణాలు, పదాల ఎంపిక అంత సహజంగా ఉండటం లేదు.
  • అప్పటికే ఉన్న వ్యాసాలను బేఖాతరు చేస్తూ ఈ అనువాదకులు కొత్త వ్యాసాలను పాతవాటిపై రాస్తున్నారు. దీని గురించి తెవికీ సభ్యులు కొంత ఆందోళన వ్యక్తం చేశారు. "యాంత్రిక అనువాదాలను అడ్డుకోవాలి" అనే అభిప్రాయం నుండి "పెద్ద ఆందోళన చెందాల్సిన అవసరం లేదు" వరకు అనేక భిన్నమైన అభిప్రాయాలు వెలువడ్డాయి.
  • ఈ వ్యాసాల వల్ల తెవికీలో అతి వేగంగా విస్తృతమైన విషయాలపై పెద్ద పెద్ద వ్యాసాలు సమకూరుతున్నాయి.
  • ఈ అనువాదాలు కొంత వరకు కృత్తిమంగా ఉండటం వలన వాటిని సహజంగా తయారు చెయ్యటానికి కొంత వికీ సభ్యుల ప్రయత్నం అవసరం

గూగుల్ తో సంప్రదింపుకోసం సూచనలు

మార్చు
  • తమిళ వికీ వారి సూచనలను తెలుగు వికీ అనువాదాలకు వర్తించడం
  • గూగుల్ తో జులై 2010 లో బెంగుళూరు లో జరిగిన సమావేశంలో తమిళ ప్రతినిధితో పాటు అర్జున పాల్గొన్నారు. అనువాద విధానాలు మెరుగు చేయటం గురించి చర్చ జరిగింది. అవి తమిళంలో అమలు ఐన తర్వాత, తెలుగుకు అమలుచేస్తామన్నారు. గూగుల్ తో ఈ విషయానికి సంబంధించి పనిచేయటానికి అసక్తిగల వారు గూగుల్ నిర్వహించే ప్రత్యేక మెయిలింగ్ లిస్టులో సభ్యత్వానికి అర్జున ని సంప్రందించగలరు.

గూగుల్ యాంత్రిక అనువాదాల పథకం -సముదాయ స్పందన

మార్చు

గూగుల్ పథకం ద్వారా ఇప్పటికి అనువాదం చేయబడిన, లేక అనువాదానికి ప్రతిపాదించిన వ్యాసాల జాబితా ఇతర వివరాలు గూగుల్ గుంపు సభ్యులకు పంచబడినది. [4]. స్పందన ఈ నెలాఖరులోగా తెలపమని కోరుతున్నాను. తమిళ వికీ వారి అనుభవం ప్రకారం మార్చిన విధానం (http://lists.wikimedia.org/pipermail/wikimediaindia-l/2010-D ecember/001376.html) పై కూడా స్పందనలు ఈ ప్రాజెక్టు చర్చా పేజీలో తెలపండి. చర్చలకు సంబంధిత తెవికీ ఫేస్బుకు సరణి లో (http://www.facebook.com/#!/home.php?sk=group_166361376723388&ap=1) అయిన వాడవచ్చు. -- అర్జున 12:29, 13 డిసెంబర్ 2010 (UTC)

నేరుగా ఆన్లైన్ లో మార్పులు చేయటానికి ఈ లింకు వాడండి. ముఖ్యంగా ఇప్పటి వరకు చేసిన వ్యాసాల నాణ్యత నిర్ణయం, కావలసిన కొత్త వ్యాసాలను గుర్తించితే బాగుంటుంది. https://spreadsheets.google.com/ccc?key=0AtVHTVzubonwdGJIMGhvWGpWN0dNdGtQU3M2TzNPUmc&hl=en#gid=0

యాంత్రిక అనువాద వ్యాసాల సంస్కరణ

మార్చు
  • ఒక పదం వున్న ఎర్రలింకులను తొలగించటానికి వికీ ఎడిటర్ లో వెతుకు మరియ పునస్థాపించు (Search and Replace లో) వాడవలసిన రెగ్యులర్ ఎక్స్ప్రెషన్ వివరాలు

వెతుకుటకు: \[\[([^\]]*)]] పునస్థాపించు: $1 Treat search string as regular expression ను చెక్ చేయాలి, ఒక్కొక్క దానిని వెతుకుతు అవసరమైతే మారుస్తూ పోవాలి.

సంస్కరించిన తరువాత యాంత్రిక అనువాదం మూస తొలగించి వ్యాసాన్ని గూగుల్ అనువాద వ్యాసాలు-మెరుగుపరచిన వర్గంలో చేర్చాలి.

1000అధిక వీక్షణలు లో గూగుల్ అనువాద వ్యాసాల స్థితి

మార్చు

పై న 201304 మరియు 201403లో కనిపించేవి

మార్చు
20 పేజీలు

అధిక వీక్షణల పై ప్రభావం

మార్చు

201403 లో అధిక 1000 వీక్షణలలో వ్యాసాలలో 34 నమోదైనవి కాబట్టి వీటి శాతం 34/1000=0.034 అనగా 3.4 శాతంగా వుంది.

పేజీ అభ్యర్ధనలపై ప్రభావం

మార్చు

201403 లో మొబైల్ కాని పేజీఅభ్యర్ధనలు 1.9M వుండగా, 979 గూగుల్ ప్రాజెక్టువ్యాసాలు కలిపి 56910 అభ్యర్ధనలు కలిగివున్నాయి. అంటే 56910/(1.9*1000*1000)=0.02995263 అనగా 2.9 శాతంగా వున్నాయి. ఒక వ్యాసానికి సగటు అభ్యర్ధనల శాతం 2.9/979 =0.002962206 అనమాట. ఈ గణాంకాలు R script ద్వారా [5]విశ్లేషించబడ్డాయి.

గూగుల్ యాంత్రికానువాద వ్యాసాలు కాని ప్రదర్శిత వ్యాసాల తో పోలిక

2013 వరకు గల 334 ప్రదర్శిత వ్యాసాలు 201403 లో 328 సహజంగా అభివృద్ధి చెందిన వ్యాసాలకు 66805 అభ్యర్ధనలు కలిగి వున్నాయి. అంటే వీటి శాతం 3.51. ఒక వ్యాసానికి సగటు అభ్యర్ధనల శాతం 3.34/328 =0.010722 అనమాట. అంటే స్వచ్ఛంద సభ్యుల వ్యాసాలు 0.010722/0.002962206= 3.61 రెట్లు ఎక్కువ ప్రభావం కలిగివున్నాయి. అనువాద వ్యాసాల ఎంపికకు తెలుగు ప్రాధాన్యత ఆధారం కాదుకాబట్టి,ఇది ఒక రకంగా ఉహించకలిగినదైనా. ఇటువంటి లెక్కింపు కొంత ఖచ్చితత్వాన్ని ఇస్తుంది.

విశ్లేషణ బలహీనతలు

మార్చు

గూగుల్ అనువాద వ్యాసాలు మానవీయంగా వర్గీకరించబడ్డాయి కావున 97.9 శాతంవ్యాసాలు మాత్రమే ఈ విశ్లేషణలో వాడబడినవి. కొన్ని మెరుగుపరచబడనా వర్గాలు సరిచేయనందున, కొన్ని గూగుల్ కాని వ్యాసాలుగా పేర్కొనబడివుండవచ్చు. తెలిసిన ఉదాహరణ అన్నా_హజారే వ్యాసం(112 అభ్యర్ధనలు) గూగుల్ వ్యాసాల పట్టికలో చేరలేదు కాని సహజవ్యాసాల పట్టికలో తొలగించబడినది.

ఈ ప్రాజెక్టు ఖర్చు పై అంచనా

మార్చు

గూగుల్ బ్లాగులో హిందీ అనువాదానికి 100 వ్యాసాలకు 600000 పదాలు అనువదించారని చెప్పారు, వ్యాసానికి సగటున 6000 పదాలు తీసుకుంటే 1000 వ్యాసాలకి 6 M పదాలవుతాయి. అనువాదం రేటు పదానికి 0.10సెంటు (అనువాదం బ్లాగులలో కనబడే రేటు) తీసుకుంటే, 600,000USD ఖర్చయి వుండవచ్చు.ఇది దాదాపు మూడు సంవత్సరాలు నడిచిందనుకుంటే సంవత్సరా నికి 200KUSD 1USD=45 రూ చొప్పున 90 లక్షలు కేవలం తెలుగుకే ఖర్చయివుండవచ్చు. తెలుగు అనువాదంపై అనుభవం కలవారు ఈ అంచనాని మెరుగు చేయండి.

శుద్ధి అనుభవాలు

మార్చు

ఇవీ చూడండి

మార్చు

వనరులు

మార్చు
  1. వికీమేనియాప్రదర్శన పత్ర ప్రతిపాదన
  2. "Translating Wikipedia". Google. Retrieved 1 May 2015.
  3. A Review on Google Translation project in Tamil
  4. పంచిన మెయిల్, (మీరు ఇప్పటికే సభ్యుడు కాకపోతే సభ్యుడవ్వండి. అప్పడు ఈ ఫైల్ చూడగలుగుతారు)
  5. వాడుకరి:Arjunaraoc/R Script for page views of a set of articles in a month using JSON