ग्रामीण भारत के सुरम्य परिदृश्यों के बीच बसे आगरा के शांत गाँव में, एक उल्लेखनीय परिवर्तन हो रहा है। प्रीति पी., अपने क्षेत्र के कई अन्य लोगों की तरह, आम तौर पर प्रति दिन 1 डॉलर से कम कमाने के लिए अपना दिन कपड़े सिलाई में बिताती थीं। हालाँकि, आज, वह एक अभूतपूर्व पहल में योगदान देने के लिए अपनी मूल कन्नड़ भाषा का उपयोग कर रही है, जिसमें भारत में एआई और डेटा एनोटेशन के परिदृश्य को बदलने की क्षमता है।
मनु चोपड़ा द्वारा 2021 में स्थापित स्टार्टअप कार्या इस बदलाव में सबसे आगे है। इस सामाजिक प्रभाव संगठन ने एआई की दुनिया में सबसे महत्वपूर्ण चुनौतियों में से एक को संबोधित करने के लिए Google और Microsoft सहित कुछ तकनीकी उद्योग के दिग्गजों के साथ मिलकर काम किया है: अरबों गैर-अंग्रेजी लोगों को बेहतर सेवा देने के लिए उच्च गुणवत्ता वाले डेटा की आवश्यकता। भारत में बोलने वाले उपयोगकर्ता।
डेटा एनोटेशन की शक्ति
आगरा और पड़ोसी गांवों में प्रीति और 70 अन्य कार्यकर्ता भारत की स्थानीय भाषाओं में पाठ, आवाज और छवि डेटा एकत्र करने और लेबल करने के लिए कार्या के साथ जुड़ गए हैं। ये डेटा एनोटेशन कार्यकर्ता प्रासंगिक प्रतिक्रियाएँ उत्पन्न करने के लिए एआई चैटबॉट्स और वर्चुअल असिस्टेंट के लिए आधार प्रदान करने में महत्वपूर्ण भूमिका निभाते हैं, जिससे एआई को गैर-अंग्रेजी बोलने वालों के लिए अधिक सुलभ बनाया जा सकता है।
जो चीज़ Karya को अन्य डेटा विक्रेताओं से अलग करती है, वह उचित मुआवजे के प्रति इसकी प्रतिबद्धता है। अधिकांश श्रमिक, मुख्य रूप से ग्रामीण समुदायों की महिलाएँ, प्रचलित न्यूनतम वेतन से 20 गुना तक प्राप्त करते हैं, जिससे उनकी आजीविका में उल्लेखनीय सुधार होता है। प्रीति के लिए, कार्या के साथ काम करके होने वाली आय ने उसे अपने घर में पर्याप्त सुधार करने की अनुमति दी।
कार्या के पीछे 27 वर्षीय कंप्यूटर इंजीनियर मनु चोपड़ा ने उद्योग में उचित वेतन के महत्व पर प्रकाश डाला और जोर देकर कहा कि "ऐसे काम के लिए कम वेतन उद्योग की विफलता है।" पहल इस मुद्दे को यह सुनिश्चित करके संबोधित करती है कि डेटा एनोटेशन श्रमिकों को उनके योगदान के लिए अच्छी तरह से मुआवजा दिया जाता है।
कार्या के साथ सिलिकॉन वैली की साझेदारी
सिलिकॉन वैली के दिग्गजों ने कार्या के दृष्टिकोण की क्षमता को पहचाना है और उच्च गुणवत्ता वाले डेटा की मांग को पूरा करने के लिए स्टार्टअप की ओर रुख कर रहे हैं। Microsoft ने अपने AI उत्पादों के लिए स्थानीय भाषण डेटा स्रोत के लिए Karya की सेवाओं का लाभ उठाया है। बिल एंड मेलिंडा गेट्स फाउंडेशन बड़े भाषा मॉडलों के लिए उपयोग किए जाने वाले डेटा में लिंग पूर्वाग्रह को कम करने के लिए कार्या के साथ सहयोग करता है। दूसरी ओर, Google 85 भारतीय जिलों में भाषण डेटा एकत्र करने के लिए कार्या और अन्य स्थानीय संगठनों के साथ साझेदारी कर रहा है, जिसमें सभी जिलों में विस्तार करने और 125 भारतीय भाषाओं के लिए जेनरेटिव एआई मॉडल विकसित करने की योजना है।
मुख्य चुनौती गैर-अंग्रेजी डेटासेट की अपर्याप्तता, भारतीय भाषाओं में बातचीत संबंधी डेटा की कमी और भारतीय भाषाओं में सीमित डिजिटल सामग्री को संबोधित करना है। कई मौजूदा एआई मॉडल को मुख्य रूप से अंग्रेजी भाषा के इंटरनेट डेटा पर प्रशिक्षित किया गया है, जिससे दक्षिण एशियाई भाषाओं में लागू होने पर गलत शब्दों की उत्पत्ति और व्याकरण के साथ कठिनाइयों जैसे मुद्दे सामने आते हैं।
कार्या के दृष्टिकोण का उद्देश्य न केवल डेटा गुणवत्ता को बढ़ाना है बल्कि ग्रामीण क्षेत्रों में उन श्रमिकों को सशक्त बनाना भी है जिनके पास अन्यथा ऐसे अवसरों तक पहुंच नहीं है। स्टार्टअप का ऐप ऑफ़लाइन काम करता है और सीमित साक्षरता वाले लोगों के लिए आवाज समर्थन प्रदान करता है, जिससे यह श्रमिकों की एक विस्तृत श्रृंखला के लिए सुलभ हो जाता है।
मनु चोपड़ा का दृष्टिकोण डेटा एनोटेशन से परे तक फैला हुआ है। वह कार्या के माध्यम से गरीबी से लड़ने की इच्छा रखता है, उसकी अपनी पृष्ठभूमि एक गरीब पड़ोस में पली-बढ़ी है। उनके स्टार्टअप ने एआई सिस्टम और अनुसंधान में उपयोग किए जाने वाले डेटा की गुणवत्ता और विविधता में सुधार करते हुए, बड़ी मात्रा में भाषण डेटा एकत्र करना संभव बना दिया है।
उचित मुआवज़े का प्रभाव
श्रमिकों को उचित मुआवजा प्रदान करने के कार्या के प्रयासों को तकनीकी समुदाय द्वारा मान्यता दी गई है। माइक्रोसॉफ्ट रिसर्च इंडिया के एक शोधकर्ता सैकत गुहा ने कार्या के डेटा की गुणवत्ता की सराहना की और इस बात पर जोर दिया कि उचित वेतन के परिणामस्वरूप बेहतर डेटा गुणवत्ता होती है। स्टार्टअप बड़े भाषा मॉडल में लिंग-संबंधी पूर्वाग्रहों को कम करने के लिए एक महत्वपूर्ण परियोजना में भी शामिल है, जो अधिक समावेशी एआई की दिशा में एक महत्वपूर्ण कदम है।
कार्या का प्रभाव भारत से बाहर तक फैला हुआ है, क्योंकि कंपनी अफ्रीका और दक्षिण अमेरिका में संगठनों के लिए एक सेवा के रूप में अपने मंच का विस्तार करने के अवसर तलाश रही है। यह पहल न केवल डेटा गुणवत्ता को बढ़ाती है बल्कि ग्रामीण क्षेत्रों में व्यक्तियों को सशक्त बनाती है, जिससे उन्हें कमाने और अपने परिवारों को शिक्षित करने का मौका मिलता है।
अगरारा और येलंदूर जैसे गांवों में हो रहा परिवर्तन एआई और डेटा एनोटेशन उद्योग में एक महत्वपूर्ण बदलाव को दर्शाता है, जो उचित मुआवजे, गुणवत्ता डेटा और समावेशिता के प्रति प्रतिबद्धता से प्रेरित है। Google और Microsoft जैसे तकनीकी दिग्गजों के साथ Karya की साझेदारी एक ऐसे भविष्य का मार्ग प्रशस्त करती है जहाँ AI वास्तव में भारत और उसके बाहर अरबों गैर-अंग्रेजी बोलने वालों की विविध आवश्यकताओं को पूरा करता है।