వికీపీడియా:వికీప్రాజెక్టు/గూగుల్ అనువాద వ్యాసాలు
యాంత్రికానువాదం ద్వారా చేర్చిన వ్యాసాలపై జరిగిన చర్చలు | |
---|---|
గూగుల్ యాంత్రికానువాదం ద్వారా వికీలో చేరిన వేలాది వ్యాసాలపై అనేక చర్చోపచర్చల తరువాత, వాటిని శుద్ధి చేసేందుకు అనేక విఫలయత్నాలు జరిగాక, చివరికి వాటిని తొలగించాలని సముదాయం నిశ్చయించింది. 2020 ఫిబ్రవరి 5 న ఆ వ్యాసాలన్నిటినీ తొలగించారు. ఆయా సందర్భాల్లో జరిగిన చర్చల వివరాలను కింది ట్యాబుల్లో చూడొచ్చు.
| |
ప్రాజెక్టు | 2010 నవంబరు | 2016 జూలై | 2016 సెప్టెంబరు | 2016 డిసెంబరు | 2018 జూలై | 2020 జనవరి | ఇతర చర్చలు |
ఈ పేజీలో గూగుల్ ట్రాన్స్లేటర్ టూల్కిట్ గూగుల్ అనువాద పరికరం ఉపయోగించి అనువాదం మెరుగు చేసి ఎక్కించిన వ్యాసాలకు సంబంధించిన విధి విధానాలు, తీసుకోవలసిన చర్యలు, సూచనలు మొదలగు కొన్ని మార్గదర్శకాలు చర్చించబడతాయి. ఎవరైనా ఇక్కడ కొత్త సూచనలు, చర్చలు చేయవచ్చు. ఏకపక్షంగా గూగుల్ ఈ ప్రాజెక్టుని 2009-2011లో నడిపి దాదాపు 1989 వ్యాసాలు చేర్చింది.(క్వెరీ ప్రకారం 2015-05-23 న 1991 లెక్కకు వచ్చాయి వీటిలో 1989 గూగుల్ ప్రాజెక్టు సభ్యుల పనిగా ప్రాజెక్టు కాలరేఖ ప్రకారం విశ్లేషణలో గుర్తించడమైనది)
సమస్య పరిచయం
మార్చుప్రసిద్ధ శోధనా యంత్రపు కంపెనీ గూగుల్ యాంత్రిక అనువాద పరికరం "గూగుల్ ట్రాన్స్లేట్" ను ఆవిష్కరించింది. అయితే ఈ ఆన్లైను పరికరం కొన్ని భాషలకే ఎంతోకొంత నాణ్యమైన అనువాదాలు చేయగలదు. ఇలా ఏ భాషలకు నాణ్యతగా పనిచేస్తుందన్న విషయం ఆయా భాషలకు లభ్యమౌతున్న అనువాద గ్లాసరీలు, పదకోశాలను అనుసరించి ఉంటుంది. మిగిలిన భాషలన్నింటికీ యాంత్రిక అనువాదం అభివృద్ధి చెయ్యాలంటే కొంత యంత్రానికి తర్ఫీదు ఇవ్వగల నాణ్యమైన అనువాద పాఠ్యాలు ఉండాలి, అంతేకాక విస్తృతమైన అనువాద గ్లాసరీలు తయారు చెయ్యాలి. దీన్ని సాధించడానికి గూగుల్ ఒక ట్రాన్స్లేటర్ టూల్ కిట్ అనే పనిముట్టును తయారుచేసి క్రౌడ్సోర్సింగ్ (మందకు అప్పజెప్పడం) అనే విన్నూత ప్రక్రియను అవలభించింది. ఇది ఇరుపక్షాలకి లాభించే సర్దుబాటే. ఈ పరికరాన్ని ఉపయోగించి అనువాదాలు చేసిన పాఠ్యం ఆయా భాషల్లో అనువాద గ్లాసరీలు అభివృద్ధి చెందడానికి, ఈ అనువాద పాఠ్యం ఉపయోగించి యాంత్రిక అనువాదాన్ని మరింత మెరుగుపరచడానికి ఉపయోగపడతాయి. అలాగే ఆ భాషల్లో అనువాదాలు చేసేవారికి రాను రాను యాంత్రిక అనువాదం సలహాలు మెరుగౌతాయి.
గూగుల్ ఒక ట్రాన్స్లేటర్ టూల్ కిట్ అనువాద గ్లాసరీల అభివృద్ధికి మూల పాఠ్యంగా వికీపీడియాను ప్రోత్సహిస్తుంది. అందువల్ల అది ఏదైనా ఒక ఆంగ్ల వికీపీడియా వ్యాసాన్ని ఎంపిక చేసుకొని, దాన్ని కావలసిన భాషలోకి తర్జుమా చేసి, నేరుగా ఆ పరికరంలో నుండే ఆయా ప్రాంతీయ భాషా వికీలోకి ఎక్కించే సదుపాయం కల్పించింది. దీనిని ఉపయోగించి కొంతమంది ఔత్సాహికులు మరియు కొంతమంది ప్రతిఫలం ఆశించి పనిచేసేవారు (గూగుల్ ప్రాజెక్టు) ఆంగ్ల వికీ వ్యాసాలను తెలుగులోకి తర్జుమా చేసి, క్రమం తప్పకుండా అనేక పెద్ద వ్యాసాలను తెవికీలో నేరుగా చేర్చుతున్నారు.
గూగుల్ వారి వివరణ
మార్చువికీమేనియా 2010 (జులై 9-11) లో గూగుల్ ప్రతినిధి ఈ ప్రాజెక్టు పై ప్రసంగించారు. [1],[2]46 శాతం వికీపీడియా పేజీ వీక్షణలు గూగుల్ ద్వారా జరుగుతున్నాయి. గూగుల్ తన లక్ష్య సాధనకు (సమగ్ర సమాచారాన్ని ప్రజలకు అందుబాటులో చేయటం) వికీపీడియాలో విషయాలను పెంచటానికి గూగుల్ అనువాద పరికరం తయారు చేశారు. సాధారణ అనువాద పద్దతులలో వాక్య విశ్లేషణ ఆధారంగా జరుగుతుంది. దీనికి భిన్నంగా, రెండుభాషలలోని, మూల వ్యాసం, అనువాద వ్యాసాలలో పదాల, వ్యాసాల జతల జాబితా ఆధారంగా ఈ అనువాద పద్ధతి పనిచేస్తుంది. ఈ జాబితా ఎంత పెద్దదైతే అనువాదం అంత మెరుగుగా వుంటుంది.
ఈ పరికరం సహాయంతో పదానికి పదం, పదబంధానికి పదబంధం యాంత్రికంగా అనువదిస్తుంది, ఆ తరువాత అనువాదకుడు దీనిని మెరుగు (కొత్త పదాలు లేక పదబంధాలు లేక వాక్య నిర్మాణం సరిచేయటం చేస్తాడు. మానవ సహాయం శాతం రూపంలో ఇవ్వబడుతుంది. దీనిని ఆధారంగా ముద్రించాల లేదా అన్న నిర్ణయం తీసుకోవచ్చు.
గూగుల్ అనువాదం పరికరం ద్వారా 2500 భాష జతలు పూర్తి యాంత్రికంగా, 100000భాష జతలు మానవ సహాయంతో అనువాదం చేయవచ్చు. పాశ్చాత్య భాషలలో అనువాద కార్పస్ ఎక్కువగా (ఐక్యరాజ్య సమితిలో పత్రాలను అన్ని అధికారిక భాషలలో వున్నాయి), భారతీయ భాషలలో దీనిని పెంచడానికి ఆగష్టు 2008 లో హిందీతో మొదటి ప్రయోగం జరిగింది. వికీమీడియా ఫౌండేషన్ సహకారంతో హిందీ వికీపీడియన్లని సంప్రదించారు. 100 కి పైగా వ్యాసాలను అనువదించారు. ఇది సత్ఫలితాలనిచ్చింది. అనువాద వ్యాసాలను శోధనాయంత్రాలలో వాడిన పదాల ప్రాధాన్యతల ఆధారంగా ఎంపిక చేశారు. 60 శాతం అనువాద వ్యాసాలు, శోధించిన వ్యాసాలలో మొదటి స్థానంలో, 80 శాతం వ్యాసాలు మొదటి ఐదు స్థానాలలో వున్నాయి.
ఆ తరువాత అరబిక్, ఇండిక్ (తమిళం, తెలుగు, బెంగాలి..)స్వాహిలి భాషలలో ప్రయోగాలు జరుగుతున్నాయి. అరబిక్ లో ఔత్సాహికులు, నగదు కోసం పనిచేసే అనువాదకులు పనిచేశారు. 1000 పైగా వ్యాసాలు (5మిలియన్ పదాలు)చేర్చగా 20 శాతం వ్యాసాలు తిరస్కరించబడ్డాయి. స్వాహిల్ లో పోటీల ద్వారా నిర్వహించారు. 800 మంది నమోదు చేయగా, 100 మంది క్రియాశీలంగా వున్నారు.
ఇండిక్ భాషలలో 10 మిలియన్ పదాలతో, 1000 కి పైగా వ్యాసాలను చేర్చారు. తమిళం లో 3 మిలియన్ పదాలు (మొత్తం వికీ 6.5 మిలియన్ పదాలు), తెలుగులో 1.55 మిలియన్ పదాలు చేర్చారు.0.7మిలియన్ పదాల చేర్చిన తరువాత బెంగాలి భాష వారుదీనిని తిరస్కరించారు. జూన్ 2009 లో ప్రజలకు విడుదల చేశారు.
- గూగుల్.ఆర్గ్
గూగుల్.ఆర్గ్ (ఇప్పటి వరకు చేసిన గూగుల్.కాం వారికి భిన్నంగా) పరిసరాలు, శక్తి, ఆరోగ్యం రంగాలలో వ్యాసాల సంఖ్యను గణనీయంగా పెంచడానికి పూర్తిగా ఔత్సాహికుల విధానంలో(గూగుల్ మాప్ మేకర్ పద్ధతి) నిర్వహిస్తున్నారు.
- గూగుల్ వారికి ఎదురైన ఇబ్బందులు
- కుడి నుండి ఎడమకు రాయు భాషలు(RTL), స్థలకేటాయింపు పదాలు(placeholder), లింకులు
- వాక్యానుగత అనువాదం
- మూసలు అనువాదన చేయబోయే భాషలో వుండకపోవడం
- వికీపీడియా లో నేరుగా ముద్రణ చేయడం లేక మునుజూపు ముద్రణ.
తమిళ వికీ వారి స్పందనలు
మార్చుతమిళ వికీపీడియన్ రవిశంకర్ తయారుచేసిన ప్రసంగాన్ని [3] మయూరనాథన్ వికీమేనియాలో వ్యక్తీకరించారు. దానిలో మఖ్యవిషయాలు. మార్చి 2009 లో గూగుల్ అనువాద పని గోప్యంగా ప్రారంభమైంది. ఫిభ్రవరి 2010 లో గూగుల్ తో సమన్వయం మొదలైంది.
- సాంకేతిక సమస్యలు
- అత్యధిక ఎరుపు లింకులు
- మూసలు దిగుమతి చేయటం లేదు
- బొమ్మలు దిగుమతి చేయటం లేదు.
- గూగుల్ అనువాద పరికరం వాడుకరికి సౌలభ్య లోపాలు.
- నిర్వహణ సమస్యలు
- వ్యాసాల ఎంపిక భారత దేశంలో ఇంగ్లీషు శోధన పదాల ప్రాధాన్యంగా జరిగింది. అందువలన అమెరికన్ పాప్ గాయనీగాయకుల వ్యాసాలు అనువాదం తమిళ భాష వారికి ఉపయోగంలేదు.
- ఇప్పటికే వున్న వ్యాసాల తొలగించి వాటి స్థానంలో అనువాద వ్యాసాలు స్థాపించబడుట
- అనువాదకులు ఒక ఖాతా ద్వారా పని చేశారు.
- ఔత్సాహిక వికీపీడియన్ల స్పందనల సమయం, నగదు ప్రతిఫలం అనువాదకులు ఆకాంక్షకి సరిపోలేదు.
- 15 పైగా అనువాదకులు వివిధ అనువాద సంస్థల ద్వారా పనిచేస్తున్నారు.సమన్వయంలో లోపాలు ఏర్పడుతున్నాయి.
- వికీపీడియా తత్వ సమస్యలు
- నగదు పని చేసే అనువాదకులకు/వికీపీడియన్లు (గూగుల్) వలన, సాధారణ వికీపీడియన్లలో ఆసక్తి తగ్గిపోతున్నది
- స్వల్పకాలికంగా ఉపాధి కల్పించబడుతున్నది. దీర్ఘకాలికంగా దీని ఫలితాలు ఎలా వుంటాయో తెలియదు.
- గూగుల్ తో సంప్రదింపుల ఫలితాలు
- అనువాద వ్యాసాల శుద్ధి అనువాదకులే చేయాలి
- గూగుల్ అనువాద సభ్యులు, గూగుల్ అనువాద వ్యాసాల వర్గాలు గూగుల్ అనువాదకులు వాడాలి
- అనువాదకులు వ్యక్తిగత ఖాతాలో వికీలో పనిచేయాలి
తెవికీ అనుభవాలు
మార్చు- ఈ అనువాదాలు చేస్తున్న సభ్యులెవరూ, తెవికీ లో అనుభవంగలవారు కాదు.
- చాలా మటుకు ఈ అనువాదాలు మానవ సహాయంతో చేస్తున్నా, కొన్ని వాక్య నిర్మాణాలు, పదాల ఎంపిక అంత సహజంగా ఉండటం లేదు.
- అప్పటికే ఉన్న వ్యాసాలను బేఖాతరు చేస్తూ ఈ అనువాదకులు కొత్త వ్యాసాలను పాతవాటిపై రాస్తున్నారు. దీని గురించి తెవికీ సభ్యులు కొంత ఆందోళన వ్యక్తం చేశారు. "యాంత్రిక అనువాదాలను అడ్డుకోవాలి" అనే అభిప్రాయం నుండి "పెద్ద ఆందోళన చెందాల్సిన అవసరం లేదు" వరకు అనేక భిన్నమైన అభిప్రాయాలు వెలువడ్డాయి.
- ఈ వ్యాసాల వల్ల తెవికీలో అతి వేగంగా విస్తృతమైన విషయాలపై పెద్ద పెద్ద వ్యాసాలు సమకూరుతున్నాయి.
- ఈ అనువాదాలు కొంత వరకు కృత్తిమంగా ఉండటం వలన వాటిని సహజంగా తయారు చెయ్యటానికి కొంత వికీ సభ్యుల ప్రయత్నం అవసరం
గూగుల్ తో సంప్రదింపుకోసం సూచనలు
మార్చు- తమిళ వికీ వారి సూచనలను తెలుగు వికీ అనువాదాలకు వర్తించడం
- గూగుల్ తో జులై 2010 లో బెంగుళూరు లో జరిగిన సమావేశంలో తమిళ ప్రతినిధితో పాటు అర్జున పాల్గొన్నారు. అనువాద విధానాలు మెరుగు చేయటం గురించి చర్చ జరిగింది. అవి తమిళంలో అమలు ఐన తర్వాత, తెలుగుకు అమలుచేస్తామన్నారు. గూగుల్ తో ఈ విషయానికి సంబంధించి పనిచేయటానికి అసక్తిగల వారు గూగుల్ నిర్వహించే ప్రత్యేక మెయిలింగ్ లిస్టులో సభ్యత్వానికి అర్జున ని సంప్రందించగలరు.
గూగుల్ యాంత్రిక అనువాదాల పథకం -సముదాయ స్పందన
మార్చుగూగుల్ పథకం ద్వారా ఇప్పటికి అనువాదం చేయబడిన, లేక అనువాదానికి ప్రతిపాదించిన వ్యాసాల జాబితా ఇతర వివరాలు గూగుల్ గుంపు సభ్యులకు పంచబడినది. [4]. స్పందన ఈ నెలాఖరులోగా తెలపమని కోరుతున్నాను. తమిళ వికీ వారి అనుభవం ప్రకారం మార్చిన విధానం (http://lists.wikimedia.org/pipermail/wikimediaindia-l/2010-D ecember/001376.html) పై కూడా స్పందనలు ఈ ప్రాజెక్టు చర్చా పేజీలో తెలపండి. చర్చలకు సంబంధిత తెవికీ ఫేస్బుకు సరణి లో (http://www.facebook.com/#!/home.php?sk=group_166361376723388&ap=1) అయిన వాడవచ్చు. -- అర్జున 12:29, 13 డిసెంబర్ 2010 (UTC)
- నేరుగా ఆన్లైన్ లో మార్పులు చేయటానికి ఈ లింకు వాడండి. ముఖ్యంగా ఇప్పటి వరకు చేసిన వ్యాసాల నాణ్యత నిర్ణయం, కావలసిన కొత్త వ్యాసాలను గుర్తించితే బాగుంటుంది. https://spreadsheets.google.com/ccc?key=0AtVHTVzubonwdGJIMGhvWGpWN0dNdGtQU3M2TzNPUmc&hl=en#gid=0
- చూడండి అర్జున సమీక్ష(31.12.2010 నాటి)
యాంత్రిక అనువాద వ్యాసాల సంస్కరణ
మార్చు- సుజాత రాసిన యాంత్రిక అనువాద వ్యాసాల సంస్కరణ తెవికీ వార్త వ్యాసం
- {{DEFAULTSORT: XYZ}} XYZ అనువాదం చేయకుండా అలానే వుంచారు. దీనివలన వర్గాలు చూసేటప్పుడు ఇంగ్లీషు అక్షరాల పట్టీలో వ్యాసం కనబడుతున్నది. వీటిని తెలుగు లో కి మార్చాలి.
- ఒక పదం వున్న ఎర్రలింకులను తొలగించటానికి వికీ ఎడిటర్ లో వెతుకు మరియ పునస్థాపించు (Search and Replace లో) వాడవలసిన రెగ్యులర్ ఎక్స్ప్రెషన్ వివరాలు
వెతుకుటకు: \[\[([^\]]*)]] పునస్థాపించు: $1 Treat search string as regular expression ను చెక్ చేయాలి, ఒక్కొక్క దానిని వెతుకుతు అవసరమైతే మారుస్తూ పోవాలి.
సంస్కరించిన తరువాత యాంత్రిక అనువాదం మూస తొలగించి వ్యాసాన్ని గూగుల్ అనువాద వ్యాసాలు-మెరుగుపరచిన వర్గంలో చేర్చాలి.
1000అధిక వీక్షణలు లో గూగుల్ అనువాద వ్యాసాల స్థితి
మార్చు- వికీపీడియా:వికీప్రాజెక్టు/గూగుల్ అనువాద వ్యాసాలు/200912-1000అధికవీక్షణలు,17వ్యాసాలు
- వికీపీడియా:వికీప్రాజెక్టు/గూగుల్ అనువాద వ్యాసాలు/201304-1000 అధిక వీక్షణలు,41వ్యాసాలు
- వికీపీడియా:వికీప్రాజెక్టు/గూగుల్ అనువాద వ్యాసాలు/201403-1000అధిక వీక్షణలు,34 వ్యాసాలు
పై న 201304 మరియు 201403లో కనిపించేవి
మార్చు- 20 పేజీలు
అధిక వీక్షణల పై ప్రభావం
మార్చు201403 లో అధిక 1000 వీక్షణలలో వ్యాసాలలో 34 నమోదైనవి కాబట్టి వీటి శాతం 34/1000=0.034 అనగా 3.4 శాతంగా వుంది.
పేజీ అభ్యర్ధనలపై ప్రభావం
మార్చు201403 లో మొబైల్ కాని పేజీఅభ్యర్ధనలు 1.9M వుండగా, 979 గూగుల్ ప్రాజెక్టువ్యాసాలు కలిపి 56910 అభ్యర్ధనలు కలిగివున్నాయి. అంటే 56910/(1.9*1000*1000)=0.02995263 అనగా 2.9 శాతంగా వున్నాయి. ఒక వ్యాసానికి సగటు అభ్యర్ధనల శాతం 2.9/979 =0.002962206 అనమాట. ఈ గణాంకాలు R script ద్వారా [5]విశ్లేషించబడ్డాయి.
- గూగుల్ యాంత్రికానువాద వ్యాసాలు కాని ప్రదర్శిత వ్యాసాల తో పోలిక
2013 వరకు గల 334 ప్రదర్శిత వ్యాసాలు 201403 లో 328 సహజంగా అభివృద్ధి చెందిన వ్యాసాలకు 66805 అభ్యర్ధనలు కలిగి వున్నాయి. అంటే వీటి శాతం 3.51. ఒక వ్యాసానికి సగటు అభ్యర్ధనల శాతం 3.34/328 =0.010722 అనమాట. అంటే స్వచ్ఛంద సభ్యుల వ్యాసాలు 0.010722/0.002962206= 3.61 రెట్లు ఎక్కువ ప్రభావం కలిగివున్నాయి. అనువాద వ్యాసాల ఎంపికకు తెలుగు ప్రాధాన్యత ఆధారం కాదుకాబట్టి,ఇది ఒక రకంగా ఉహించకలిగినదైనా. ఇటువంటి లెక్కింపు కొంత ఖచ్చితత్వాన్ని ఇస్తుంది.
విశ్లేషణ బలహీనతలు
మార్చుగూగుల్ అనువాద వ్యాసాలు మానవీయంగా వర్గీకరించబడ్డాయి కావున 97.9 శాతంవ్యాసాలు మాత్రమే ఈ విశ్లేషణలో వాడబడినవి. కొన్ని మెరుగుపరచబడనా వర్గాలు సరిచేయనందున, కొన్ని గూగుల్ కాని వ్యాసాలుగా పేర్కొనబడివుండవచ్చు. తెలిసిన ఉదాహరణ అన్నా_హజారే వ్యాసం(112 అభ్యర్ధనలు) గూగుల్ వ్యాసాల పట్టికలో చేరలేదు కాని సహజవ్యాసాల పట్టికలో తొలగించబడినది.
ఈ ప్రాజెక్టు ఖర్చు పై అంచనా
మార్చుగూగుల్ బ్లాగులో హిందీ అనువాదానికి 100 వ్యాసాలకు 600000 పదాలు అనువదించారని చెప్పారు, వ్యాసానికి సగటున 6000 పదాలు తీసుకుంటే 1000 వ్యాసాలకి 6 M పదాలవుతాయి. అనువాదం రేటు పదానికి 0.10సెంటు (అనువాదం బ్లాగులలో కనబడే రేటు) తీసుకుంటే, 600,000USD ఖర్చయి వుండవచ్చు.ఇది దాదాపు మూడు సంవత్సరాలు నడిచిందనుకుంటే సంవత్సరా నికి 200KUSD 1USD=45 రూ చొప్పున 90 లక్షలు కేవలం తెలుగుకే ఖర్చయివుండవచ్చు. తెలుగు అనువాదంపై అనుభవం కలవారు ఈ అంచనాని మెరుగు చేయండి.
శుద్ధి అనుభవాలు
మార్చుఇవీ చూడండి
మార్చు- యాంత్రిక అనువాద వ్యాసాల జాబితా వర్గం రూపంలో వర్గం:గూగుల్ అనువాద వ్యాసాలు
- అనువాదాలు చేసిన ప్రాజెక్టు సభ్యులు వర్గం:యాంత్రిక అనువాదాలు చేసే సభ్యులు
- Signpost (2014-04-29)coverage of Research "Popularity does not breed quality (and vice versa)
- en:Google Translate
- Small impact of the large Google Translation Project on Telugu Wikipedia - అర్జున వ్యాసం 2015-06-24 నాటి వికీపీడియా సైన్ పోస్ట్ పత్రిక
- వికీపీడియా:వికీప్రాజెక్టు/గూగుల్ అనువాద వ్యాసాల శుద్ధి
వనరులు
మార్చు- ↑ వికీమేనియాప్రదర్శన పత్ర ప్రతిపాదన
- ↑ "Translating Wikipedia". Google. Retrieved 1 May 2015.
- ↑ A Review on Google Translation project in Tamil
- ↑ పంచిన మెయిల్, (మీరు ఇప్పటికే సభ్యుడు కాకపోతే సభ్యుడవ్వండి. అప్పడు ఈ ఫైల్ చూడగలుగుతారు)
- ↑ వాడుకరి:Arjunaraoc/R Script for page views of a set of articles in a month using JSON