चित्रों से ऑनलाइन टेक्स्ट को मुफ़्त में पहचानें। मुफ्त ओसीआर के लिए ऑनलाइन सेवाएं

उदाहरण के लिए, कभी-कभी उपयोगकर्ताओं को किसी स्कैन किए गए पृष्ठ, जैसे PDF से Word टेक्स्ट फ़ाइल प्राप्त करने की आवश्यकता होती है। इन मामलों में, ABBYY FineReader का अक्सर उपयोग किया जाता है। लेकिन यह कार्यक्रम मुफ्त नहीं है, हालांकि इसकी बड़ी कार्यक्षमता है जो आपकी आवश्यकताओं को पूरी तरह से संतुष्ट करेगी। यदि यह तरीका आपको सूट नहीं करता है, तो आइए मुख्य ऑनलाइन और ऑफलाइन सेवाओं पर करीब से नज़र डालें और पीडीएफ से वर्ड तक टेक्स्ट रिकग्निशन के बारे में सवाल का जवाब दें, जो कई लोगों को चिंतित करता है।


इस सर्विस का बड़ा प्लस यह है कि यहां आप 50 एमबी तक की फाइल अपलोड कर सकते हैं। अन्य सेवाओं के विपरीत, यह वास्तव में बहुत कुछ है। दुर्लभ मामलों में, समाप्त पाठ में ऐसे खंड होते हैं जहां आपके सुधार की आवश्यकता होती है, लेकिन सामान्य तौर पर पाठ सामान्य गुणवत्ता का होता है।

पीडीएफ से वर्ड कन्वर्टर सेवा pdf2doc.com/ru

सबसे पहले, ऐसी सेवाएं छात्रों और अन्य लोगों के काम के समय को बहुत कम कर देती हैं जिनके पेशे स्कैन की गई फाइलों के संपर्क में हैं। पीडीएफ फाइलें बड़ी होती हैं और फ्लैश ड्राइव, डिस्क और विभिन्न उपकरणों की मेमोरी में बहुत अधिक जगह लेती हैं। यहां आप द्वारा ऐसी फ़ाइलों को स्थानांतरित करने की प्रक्रिया जोड़ सकते हैं ईमेल. रूपांतरण के बाद, फ़ाइलें अपना प्रारंभिक वजन कम से कम 10 - 20% तक कम कर देती हैं।

पर होना होम पेज pdf2doc.com, आप कन्वर्ट करने के तरीके के बारे में टिप्स देखेंगे। स्क्रीन के बीच में, सबसे ऊपर, आप भाषा चुन सकते हैं. अंग्रेजी और मुख्य यूरोपीय भाषाओं का चयन किया जा सकता है। युक्तियों के नीचे, एक पूर्ण-चौड़ाई वाला पैनल है जहां आप चुन सकते हैं कि वास्तव में क्या परिवर्तित करने की आवश्यकता है - पीडीएफ से डीओसी, पीडीएफ से जेपीजी, जेपीजी से पीडीएफ, आदि। इस पैनल के नीचे भी एक वर्किंग विंडो है जिसमें कन्वर्जन होता है।

pdf2doc.com सेवा के लाभ हैं:

  • काम करने के लिए, आपको साइट पर पंजीकरण करने की आवश्यकता नहीं है।
  • प्रमुख लोकप्रिय भाषाओं के लिए समर्थन।
  • सेवा का उपयोग करना आसान है, स्कूली बच्चों, छात्रों और विभिन्न स्तरों के शिक्षकों के लिए अनिवार्य है।
  • पीडीएफ दस्तावेजों को डीओसी में बदलने और इसके विपरीत तेजी से काम करता है।

सेवा के साथ काम करना शुरू करने के लिए, साइट पर जाएँ - http://pdf2doc.com/en/।

  1. अपने से डाउनलोड करने के लिए एक फ़ाइल का चयन करें हार्ड ड्राइवऔर डाउनलोड पर क्लिक करें। आप एक ही समय में कई फ़ाइलों का चयन भी कर सकते हैं, लेकिन डाउनलोड गति काफ़ी कम हो जाएगी।
  2. कनवर्ट करना शुरू करने के लिए, "डाउनलोड करें" पर क्लिक करें और थोड़ी देर प्रतीक्षा करें।
  3. अगला, परिणामी फ़ाइल को WORD के रूप में सहेजें।

पाठ, अन्य समान सेवाओं की तरह, दोनों को एक दिशा (पीडीएफ से वर्ड) और दूसरे में परिवर्तित किया जा सकता है। ऐसा करने के लिए, मेनू में "एनी टू पीडीएफ़" लिंक का चयन करें, और फिर ऊपर वर्णित योजना का पालन करें।

ABBYY FineReader सेवा का उपयोग करके WORD में PDF टेक्स्ट को पहचानें

लेख की शुरुआत में इस सेवा के बारे में कहा गया था। आइए इसकी क्षमताओं और यह कैसे काम करता है, इस पर करीब से नज़र डालें।

सेवा आपको दस्तावेज़ों को परिवर्तित और संपादित करते समय अतिरिक्त स्वरूपों का उपयोग करने के साथ-साथ उन्नत सुविधाओं के साथ काम करने की अनुमति देती है। मूल्य निर्धारण पैकेज परिवर्तनीय पृष्ठों में मापा जाता है। तो तैयार पाठ के 200 पृष्ठों के 1 महीने के पैकेज को $ 5 में खरीदा जा सकता है। अगले महीने के लिए वही पैकेज खरीदते समय, पिछले महीने की शेष राशि को मौजूदा में जोड़ दिया जाता है। उन उपयोगकर्ताओं के लिए जो भुगतान नहीं करना चाहते हैं, उनके लिए भी अच्छी खबर है - आप प्रति माह 10 पृष्ठों तक बिल्कुल मुफ्त में परिवर्तित कर सकते हैं।

साइट पर जाने पर, उपयोगकर्ता को साइट का उच्च-गुणवत्ता वाला डिज़ाइन, साथ ही ब्लॉकों की एक सक्षम व्यवस्था दिखाई देगी। पहले पृष्ठ पर, सेवा हमें हरे बटन - "पहचानें" पर क्लिक करके पीडीएफ और जेपीजी को माइक्रोसॉफ्ट वर्ड या एक्सेल में बदलने की पेशकश करती है।

एबीबीवाई फाइनरीडर सेवा की विशेषताएं

  • स्कैन किए गए दस्तावेज़ों या PDF से FB2 या ePub बुक बनाएं। सेवा आपको इसे जितनी जल्दी हो सके करने की अनुमति देती है, कुछ ही मिनटों में आप अपनी पसंदीदा पुस्तक का आनंद लेंगे, इसे अपने टैबलेट या फोन पर पढ़ सकते हैं।
  • PDF को WORD दस्तावेज़ों में बदलें। पीडीएफ सेवा द्वारा संसाधित करने के बाद, आप तालिकाओं और चित्रों के साथ काम करने सहित सामग्री को अपने विवेक से संपादित करने में सक्षम होंगे।
  • फाइनरीडर ऑनलाइन पाठ के साथ किसी भी स्कैन या तस्वीर को समर्थित फाइलों में से एक (WORD, PowerPoint, Excel) में परिवर्तित करता है। हस्तलिखित ग्रंथों को छोड़कर।
  • परिवर्तित दस्तावेज़ को आसानी से किसी भी क्लाउड स्टोरेज में निर्यात किया जा सकता है: वनड्राइव, एवरनोट, गूगल ड्राइव, आदि।
  • 190 से अधिक विश्व भाषाओं के लिए समर्थन।
  • परिवर्तित दस्तावेज़ 14 दिनों के लिए सेवा के भंडारण में रह सकते हैं, जिसके बाद उन्हें पुनर्प्राप्ति की संभावना के बिना हटा दिया जाएगा। इसलिए, इस अवधि के दौरान उन्हें आपके कंप्यूटर पर डाउनलोड करने के लिए समय होना आवश्यक है।

एबीबीवाई फाइनरीडर सेवा का उपयोग करने के लिए, सेवा की आधिकारिक वेबसाइट - https://finereaderonline.com/ru-ru पर जाएं।


OCR सॉफ़्टवेयर आपको फ़ोटोग्राफ़ या स्कैन किए गए दस्तावेज़ों को सीधे वाक्यों में बदलने की अनुमति देता है।

तथ्य यह है कि छवि पर पाठ को रेखापुंज, डॉट्स के एक सेट के रूप में प्रस्तुत किया गया है। उल्लिखित सॉफ़्टवेयर बिंदुओं के एक सेट को एक पूर्ण पाठ में परिवर्तित करता है, जो संपादन और बचत के लिए उपलब्ध है।

पत्र पहचान मुद्रित या हस्तलिखित पुस्तकों और दस्तावेजों को डिजिटाइज़ करने की प्रक्रिया को अनुकूलित करने के लिए डिज़ाइन की गई है।

डिजिटलीकरण की यह विधि एक छवि से मैन्युअल टाइपिंग की गति की तुलना में बहुत तेज है। यह पुस्तकालयों और अभिलेखागार के डिजिटलीकरण में व्यापक रूप से उपयोग किया जाता है। अगला, पाँच पर विचार करें सबसे अच्छे प्रतिनिधिइसी तरह के कार्यक्रमों के परिवार।

एबीबीवाई फाइन रीडर 10

फाइनरीडर उन सभी कार्यक्रमों में निर्विवाद नेता है जो एक छवि पर पाठ को पहचानते हैं। विशेष रूप से, ऐसा कोई सॉफ़्टवेयर नहीं है जो सिरिलिक को अधिक स्पष्ट रूप से संसाधित करता हो। सामान्य तौर पर, फाइनरीडर में 179 भाषाएँ हैं, जिसके पाठ को अत्यंत सफलतापूर्वक पहचाना गया है।

उपयोगकर्ताओं को निराश करने वाली एकमात्र परिस्थिति यह है कि कार्यक्रम का भुगतान किया जाता है। केवल मुफ्त वितरण परीक्षण संस्करण 15 दिनों के लिए। इस अवधि के दौरान 50 पृष्ठों की स्कैनिंग की अनुमति है।

फिर आपको प्रोग्राम का उपयोग करने के लिए भुगतान करना होगा। फाइनरीडर किसी भी अधिक या कम उच्च-गुणवत्ता वाली छवि को आसानी से "खा" लेता है। स्रोत पूरी तरह अप्रासंगिक है। चाहे वह फोटो हो, पेज का स्कैन हो, या अक्षरों वाली कोई तस्वीर हो।

लाभ:

  • सटीक पहचान;
  • पढ़ने वाली भाषाओं की एक बड़ी संख्या;
  • स्रोत छवि की गुणवत्ता के प्रति सहिष्णुता।

गलती:

  • 15 दिनों के लिए परीक्षण संस्करण।

ओसीआर क्यूनीफॉर्म

छवियों से टेक्स्ट जानकारी पढ़ने के लिए नि: शुल्क कार्यक्रम। मान्यता सटीकता विचाराधीन पिछले कार्यक्रम की तुलना में कम परिमाण का एक क्रम है। लेकिन कैसे मुफ्त उपयोगिता, कार्यक्षमता अभी भी शीर्ष पर है।

दिलचस्प! क्यूनिफॉर्म टेक्स्ट, ग्राफिक्स और यहां तक ​​कि विभिन्न तालिकाओं के ब्लॉक को पहचानता है। इसके अलावा, यहां तक ​​कि अनलाइन टेबल को भी पढ़ा जा सकता है।

सटीकता सुनिश्चित करने के लिए, विशेष शब्दकोश मान्यता प्रक्रिया से जुड़े होते हैं, जो स्कैन किए गए दस्तावेज़ों से शब्दावली को फिर से भरते हैं।

लाभ:

  • मुफ्त वितरण;
  • पाठ की शुद्धता की जांच करने के लिए शब्दकोशों का उपयोग करना;
  • खराब गुणवत्ता की फोटोकॉपी से टेक्स्ट स्कैन करना।

कमियां:

  • अपेक्षाकृत कम सटीकता;
  • समर्थित भाषाओं की एक छोटी संख्या।

विनस्कैन2पीडीएफ

यह एक पूर्ण कार्यक्रम भी नहीं है, बल्कि एक उपयोगिता है। स्थापना की आवश्यकता नहीं है, और निष्पादन योग्य फ़ाइल का वजन केवल कुछ किलोबाइट है। पहचानने की प्रक्रिया अत्यंत तेज है, हालांकि, परिणामी दस्तावेज विशेष रूप से पीडीएफ प्रारूप में सहेजे जाते हैं।

वास्तव में, पूरी प्रक्रिया तीन बटन दबाकर की जाती है: स्रोत, गंतव्य का चयन करना और, वास्तव में, प्रोग्राम लॉन्च करना।

उपयोगिता को कई फाइलों के तेजी से बैच प्रसंस्करण के लिए डिज़ाइन किया गया है। उपयोगकर्ताओं की सुविधा के लिए, एक बड़ा इंटरफ़ेस भाषा पैक प्रदान किया गया है।

लाभ:

  • सुवाह्यता;
  • तेज काम;
  • उपयोग में आसानी।

कमियां:

  • न्यूनतम आकार;
  • केवल आउटपुट फ़ाइल स्वरूप।

simpleocr

छवियों से ओसीआर के लिए एक महान छोटा कार्यक्रम। पांडुलिपियों को पढ़ने का भी समर्थन करता है। परेशानी यह है कि रूसी इंटरफ़ेस भाषा पैक या मान्यता के लिए समर्थित भाषाओं की सूची में शामिल नहीं है।

हालाँकि, यदि आपको अंग्रेजी, डेनिश या फ्रेंच स्कैन करने की आवश्यकता है, तो इससे बेहतर मुफ्त विकल्प नहीं है।

अपने क्षेत्र में, कार्यक्रम सटीक फ़ॉन्ट डिकोडिंग, शोर हटाने और ग्राफिक छवि निष्कर्षण प्रदान करता है। इसके अलावा, प्रोग्राम इंटरफ़ेस में एक टेक्स्ट एडिटर बनाया गया है, जो लगभग वर्डपैड के समान है, जो प्रोग्राम की उपयोगिता को बहुत बढ़ाता है।

लाभ:

  • सटीक पाठ पहचान;
  • सुविधाजनक पाठ संपादक;
  • एक छवि से शोर को दूर करना।

कमियां:

  • रूसी भाषा का पूर्ण अभाव।

फ्रीमोर ओसीआर

कार्यक्रम आपको छवियों से पाठ और ग्राफिक्स को जल्दी से निकालने की अनुमति देता है। सॉफ्टवेयर प्रदर्शन हानि के बिना कई स्कैनर का समर्थन करता है। निकाले गए टेक्स्ट को टेक्स्ट डॉक्यूमेंट या एमएस ऑफिस डॉक्यूमेंट के रूप में सेव किया जा सकता है।

इसके अलावा, एक बहु-पृष्ठ पहचान समारोह प्रदान किया जाता है।

फ्रीमोर ओसीआर नि:शुल्क वितरित किया जाता है, हालांकि, इंटरफ़ेस केवल अंग्रेजी में है। लेकिन यह परिस्थिति किसी भी तरह से उपयोगिता को प्रभावित नहीं करती है, क्योंकि नियंत्रण सहज तरीके से व्यवस्थित होते हैं।

लाभ:

  • मुफ्त वितरण;
  • कई स्कैनर के साथ काम करने की क्षमता;
  • अच्छी पहचान सटीकता।

कमियां

  • इंटरफ़ेस में रूसी भाषा का अभाव;
  • मान्यता के लिए रूसी भाषा पैक डाउनलोड करने की आवश्यकता है।

यदि आपने एक सैद्धांतिक अध्याय लिखने का त्वरित तरीका चुना है, जिसके बारे में हमने पैराग्राफ 2.1 में बात की थी, तो सबसे अधिक संभावना है कि आप दस्तावेजों को स्कैन किए बिना नहीं करेंगे। अन्यथा, आप इस बिंदु को छोड़ सकते हैं और पुस्तकालय में मिली सामग्री पर नोट्स लेना शुरू कर सकते हैं।

इससे पहले कि आप स्कैन करना शुरू करें, आपको यह तय करने की आवश्यकता है कि आप अपना काम लिखते समय वास्तव में क्या उपयोग करना चाहते हैं। और इसके लिए आपको पहले उपलब्ध साहित्य को देखना होगा और आवश्यक बिंदुओं को एक पेंसिल से हाइलाइट करना होगा।

जब मैंने पहली बार अपने पहले टर्म पेपर के लिए एक पत्रिका के लेख को स्कैन किया, तो यह मेरे लिए एक अकल्पनीय रूप से कठिन काम था। स्कैनर और फाइनरीडर के साथ कई घंटों के काम के परिणामस्वरूप, मैं बकवास के साथ समाप्त हो गया जिसे संपादित नहीं किया जा सका। अंत में, मुझे सब कुछ हाथ से उठाना पड़ा। आपके साथ ऐसा होने से रोकने के लिए, आइए स्कैनिंग के सभी तकनीकी पहलुओं पर करीब से नज़र डालें।

स्कैन करने के लिए, हमें, निश्चित रूप से, एक स्कैनर की आवश्यकता होती है। इसे खरीदना नहीं पड़ता है। उदाहरण के लिए, आप किसी मित्र से कुछ समय के लिए ऋण ले सकते हैं। मैं कैनोस्कैन लाइड 60 स्कैनर का उपयोग करता हूं। हालांकि यह सबसे नया मॉडल नहीं है, मुझे वास्तव में यह कॉम्पैक्ट, तेज और उपयोग में आसान "डिवाइस" पसंद है। यदि आपने एक स्कैनर उधार लिया है, तो इसके काम करने के लिए, आपको पहले ड्राइवर प्रोग्राम को स्थापित करना होगा। डिवाइस के साथ आए या निर्माता की वेबसाइट से डाउनलोड किए गए इंस्टॉलेशन डिस्क पर ड्राइवर और इंस्टॉलेशन गाइड हमेशा मिल सकते हैं। ड्राइवर स्थापित करने के बाद, कनेक्टिंग कॉर्ड का उपयोग करके स्कैनर को कंप्यूटर से कनेक्ट करें। अब आप सीधे स्कैन करना शुरू कर सकते हैं।

लेकिन पहले, कुछ सिद्धांत। आपको पता होना चाहिए कि स्कैनिंग प्रक्रिया में दो चरण होते हैं:

1. दस्तावेज़ को सीधे स्कैन करना। इस स्तर पर, स्कैनर स्कैन किए गए दस्तावेज़ की सतह की तस्वीरें लेता है और परिणामी छवि को नियमित .jpg .gif फ़ाइल या किसी अन्य प्रारूप में कंप्यूटर में सहेजता है;

2. दस्तावेज़ पहचान। यह एक स्कैनर द्वारा ली गई छवि से पाठ को एक नियमित परीक्षण में बदलने की प्रक्रिया है, जिसे बाद में Word में सहेजा और संपादित किया जा सकता है। एक विशेष कार्यक्रम (सबसे लोकप्रिय एडोब फाइनरीडर है) का उपयोग करके एक स्कैनर की भागीदारी के बिना मान्यता प्राप्त की जाती है। इस प्रकार, आप पहले पाठ की कई शीटों को स्कैन कर सकते हैं और उन्हें एक छवि के रूप में सहेज सकते हैं और उसके बाद ही उन्हें पाठ में परिवर्तित कर सकते हैं।

तो चलिए शुरू करते हैं चरण एक - स्कैनिंग:

- स्कैनर ड्राइवर चलाएँ: प्रारंभ - सभी कार्यक्रम - कैनन - स्कैनगियर(मैं अपने स्कैनर के लिए ड्राइवर का नाम निर्दिष्ट करता हूं)। ड्राइवर विंडो दिखाई देगी:

- स्कैनर का ढक्कन खोलें और एक किताब, पत्रिका या उनकी कॉपी नीचे टेक्स्ट के साथ रखें, जितना संभव हो स्कैनर के काम करने वाले सतह के किनारों के संबंध में:

यहां यह सुनिश्चित करना बहुत महत्वपूर्ण है कि स्कैनर कवर स्कैन किए गए दस्तावेज़ को यथासंभव कसकर दबाता है, बाहरी प्रकाश को स्कैनर की कार्यशील सतह में प्रवेश करने से रोकता है जो दस्तावेज़ के संपर्क में है;

- स्कैनर ड्राइवर में आवश्यक सेटिंग्स करें। पहला चरण उस रिज़ॉल्यूशन को सेट करना है जिसमें दस्तावेज़ को स्कैन किया जाएगा। रिज़ॉल्यूशन एक माप है जो स्कैन किए जाने पर किसी वस्तु में विवरण के स्तर को निर्धारित करता है और डॉट्स प्रति इंच (डीपीआई, या डीपीआई) में मापा जाता है। रिज़ॉल्यूशन जितना अधिक होगा, छवि गुणवत्ता उतनी ही बेहतर होगी। लेकिन, पाठ दस्तावेज़ों को स्कैन करते समय, अधिकतम रिज़ॉल्यूशन सेट करने का कोई मतलब नहीं है, क्योंकि इससे कोई फायदा नहीं होगा। साथ ही, उच्च रिज़ॉल्यूशन पर स्कैन करने में अधिक समय लगता है। मेरा सुझाव है कि रिज़ॉल्यूशन को 400-500 डीपीआई के बीच सेट करें। इस सेटिंग के साथ, छवियां अच्छी पहचान के लिए पर्याप्त गुणवत्ता वाली होती हैं, और स्कैनिंग प्रक्रिया में अधिक समय नहीं लगता है। मेरा सुझाव है कि मैं अपनी प्रिंटर सेटिंग का स्क्रीनशॉट देखूं:


आरंभ करने के लिए, आपको जाने की आवश्यकता है "उन्नत मोड"।स्रोत हमेशा रहेगा "गोली"(सपाट तल स्कैनर)। कलर मोड सेट करना बेहतर है "काला और सफेद", क्योंकि हमें पाठ को स्कैन करने के लिए रंगों की आवश्यकता नहीं है, और इससे आउटपुट छवियों का आकार कम हो जाएगा। अनुमति, जैसा कि मैंने कहा, सेट किया जाना चाहिए 400 टन/दिन. आउटपुट छवि आकार - आवश्यक "ए4". अब आप सुरक्षित रूप से बटन दबा सकते हैं "स्कैन". मेरा स्कैनर इस तरह से डिज़ाइन किया गया है कि यह स्कैन की गई छवियों को सबसे पहले याद रखता है आंतरिक मेमॉरी, और केवल जब ड्राइवर विंडो बंद होती है तो उन्हें कंप्यूटर पर सहेजने की पेशकश करता है। मैं केवल उस स्थान को निर्दिष्ट कर सकता हूं जहां कार्य के परिणाम सहेजे जाएंगे।

आपको इस तरह की फाइलें मिलनी चाहिए:

जब ऐसी छवि को बड़ा किया जाता है, तो पाठ स्पष्ट रूप से दिखाई देना चाहिए।

दूसरा चरणमान्यताप्राप्त चित्र और पाठ में उनका रूपांतरण। जैसा कि मैंने कहा, इसके लिए आपको एक विशेष कार्यक्रम की आवश्यकता है - अच्छा पाठक. इस लिंक (32 एमबी) से कार्यक्रम डाउनलोड करें। पुरालेख पासवर्ड - वेबसाइट. मेरे द्वारा सुझाए गए संस्करण को स्थापना (पोर्टेबल) की आवश्यकता नहीं है। प्रोग्राम फोल्डर में कई अलग-अलग फाइलें होंगी, लेकिन आपको केवल एक की जरूरत है - फाइनरीडर.exe. इस फाइल पर डबल क्लिक करने से आपके कंप्यूटर पर प्रोग्राम लॉन्च हो जाएगा।

कार्यक्रम का यह संस्करण काफी पुराना है। मैंने इसका उपयोग करते हुए नीचे दिए गए सभी स्क्रीनशॉट लिए। यदि यह संस्करण अच्छा पाठकयह आपके लिए शुरू नहीं होता - एक नया चुनें।

खिड़की अच्छा पाठकनिम्नलिखित रूप है:

आपके द्वारा पहले स्कैन किए गए दस्तावेज़ों को प्रिंट करने की भाषा सेट करने के बाद, आप पहचानना शुरू कर सकते हैं। यदि पाठ में एक साथ दो भाषाएँ हैं (उदाहरण के लिए, रूसी और अंग्रेजी), तदनुसार स्थापना करें।

पहचान शुरू करने के लिए, पहले बटन के दाईं ओर तीर पर क्लिक करें स्कैन- और फिर - छवि खोलें:

एक छवि चयन विंडो खुलेगी। वह फ़ोल्डर खोलें जहाँ आपने स्कैन की गई छवियों को सहेजा था, क्लिक करें सीटीआरएल + ए(अंग्रेजी) कीबोर्ड पर और बटन दबाएं खुला हुआ.

उसके बाद, खिड़की में बाईं ओर अच्छा पाठकजोड़ी गई फ़ाइलों के थंबनेल, केंद्र में - चालू दिखाई देंगे इस पलचयनित थंबनेल बड़ा है, नीचे और भी बड़ा आवर्धन है, और दाईं ओर पहचान परिणाम है:

उदाहरण के लिए, मैंने केवल दो चित्र लिए। ऊपर दिए गए स्क्रीनशॉट में उनमें से पहले को हाइलाइट किया गया है, और अब हम इसे पहचानते हैं। जैसा कि आप देख सकते हैं, छवि लंबवत रूप से स्कैन की गई है, पाठ को पहचानने के लिए, छवि को पहले 90 डिग्री घुमाया जाना चाहिए। ऐसा करने के लिए, और बटन का उपयोग करें। अगला चरण प्रोग्राम को यह बताना है कि छवि के किस भाग को पहचानने की आवश्यकता है, और उस प्रकार का डेटा भी सेट करें जो आउटपुट टेक्स्ट, टेबल या इमेज होना चाहिए। इसके लिए क्रमशः बटन हैं: . उदाहरण के लिए, यदि आपको टेक्स्ट ब्लॉक को चिन्हित करने की आवश्यकता है, तो टेक्स्ट ब्लॉक के ऊपरी बाएँ कोने में बायाँ-क्लिक करें, फिर बायाँ-क्लिक करें और बाएँ बटन को पकड़कर, उसे निचले दाएँ कोने में खींचें। उदाहरण के लिए, मैंने मान्यता के लिए पूरी तरह से एक छवि तैयार की:

जैसा कि आप देख सकते हैं, उपरोक्त उदाहरण में सभी टेक्स्ट ब्लॉक हरे रंग में हाइलाइट किए गए हैं, जबकि चित्र लाल रंग में हाइलाइट किए गए हैं। इसी तरह मान्यता के लिए टेबल तैयार किए जाते हैं। इसके लिए बटन का इरादा है। अगली तस्वीर पर जाने के लिए, बाईं ओर इसके थंबनेल पर बायाँ-क्लिक करें। इस प्रकार, स्कैनिंग के परिणामस्वरूप प्राप्त सभी छवियां मान्यता के लिए तैयार की जाती हैं। छवियों की तैयारी पूरी होने के बाद, उन सभी का चयन किया जाना चाहिए। ऐसा करने के लिए, थंबनेल पैनल पर एक खाली जगह में बायाँ-क्लिक करें (इसे कहा जाता है पैकेट) और दबाएं CTRL+A(अंग्रेजी) कीबोर्ड पर। अगला, बटन पर क्लिक करें और तब तक प्रतीक्षा करें अच्छा पाठकछवियों को पाठ में परिवर्तित करता है। उसके बाद, आप बटन का उपयोग करके प्राप्त पाठ को Word में सहेज सकते हैं, जिस पर क्लिक करने के बाद एक विंडो खुलेगी। इसमें आपको सेविंग के लिए फॉर्मेट सेलेक्ट करना है - माइक्रोसॉफ्ट वर्ड, और सभी पृष्ठों को सहेजने के लिए बॉक्स को भी चेक करें:

बटन दबाने के बाद ठीक हैकार्यक्रम बनाएगा शब्द दस्तावेज़और इसमें पहचाने गए पृष्ठों से पाठ को उस क्रम में सम्मिलित करता है जिसमें वे थंबनेल पैनल (बैच) में हैं। परिणामी दस्तावेज़ को तुरंत फ़ाइल संरचना में एक फ़ोल्डर में सहेजें थीसिसऔर आप संपादन शुरू कर सकते हैं। यह कैसे किया जाता है इसका वर्णन my नि: शुल्क पाठ्यक्रम.

और आखिरी पल। यदि आपने किसी अखबार या पत्रिका को स्कैन किया है, तो टेक्स्ट अक्सर कॉलम में दिया जाता है (जैसा कि ऊपर के उदाहरण में है)। Word के इन स्तंभों को एक में बदलने की आवश्यकता है। कॉलम में टेक्स्ट का चयन करें और कमांड चलाएँ: प्रारूप - कॉलम - एक - ठीक. इसके बाद ही आप पेज सेटअप, मार्जिन इंडेंट, फॉन्ट आदि में पोर्ट्रेट ओरिएंटेशन सेट कर सकते हैं।

किसी दस्तावेज़ को कैसे स्कैन करें और इसे एमएस वर्ड में कैसे पहचानें

हम आपसे पहले ही चर्चा कर चुके हैं। लेकिन आप न केवल एक प्रोग्राम की मदद से टेक्स्ट को पहचान सकते हैं। यह आपके कंप्यूटर पर बिना किसी प्रोग्राम के ऑनलाइन सेवाओं का उपयोग करके किया जा सकता है।

और वास्तव में, यदि आपको एक बार पाठ को पहचानने की आवश्यकता है, और भविष्य में आप इस कार्यक्रम का उपयोग नहीं करने जा रहे हैं, तो कुछ प्रोग्राम क्यों स्थापित करें? या क्या आपको इसे महीने में एक बार करने की ज़रूरत है? इस मामले में, कंप्यूटर पर एक अतिरिक्त प्रोग्राम की जरूरत नहीं है।

आइए कुछ ऐसी सेवाओं पर नज़र डालें जिनका आप उपयोग कर सकते हैं छवि से पाठ को मुफ्त में पहचानें, आसान और तेज़।

मुफ्त ऑनलाइन ओसीआर

किसी चित्र से ऑनलाइन पाठ को पहचानने के लिए एक बहुत अच्छी सेवा सेवा है मुफ्त ऑनलाइन ओसीआर. इसे पंजीकरण की आवश्यकता नहीं है, यह लगभग किसी भी प्रारूप के चित्र से पाठ को पहचानता है। 58 भाषाओं के साथ काम करता है। पाठ पहचान उत्कृष्ट है।

इस सेवा का उपयोग करना आसान है। जब आप उस पर जाते हैं, तो आपके पास केवल दो विकल्प होंगे: अपने कंप्यूटर से फ़ाइल अपलोड करें, या यदि छवि इंटरनेट पर है तो उसका URL पेस्ट करें।

यदि आपकी छवि कंप्यूटर पर है, तो बटन पर क्लिक करें किसी फाइल का चयन करें , फिर अपनी फ़ाइल चुनें, और बटन पर क्लिक करें डालना. आपको अपनी ग्राफ़िक फ़ाइल नीचे और उसके ऊपर एक बटन दिखाई देगा ओसीआर. इस बटन पर क्लिक करें और आपको वह टेक्स्ट मिलेगा जो आप पेज के नीचे पा सकते हैं।

ऑनलाइन ओसीआर नेट

यह भी एक बहुत अच्छी सेवा है जो आपको मुफ्त में और पंजीकरण के बिना चित्रों से टेक्स्ट को ऑनलाइन पहचानने की अनुमति देती है। यह रूसी, चीनी, कोरियाई और जापानी सहित 48 भाषाओं का समर्थन करता है। इसके साथ आरंभ करने के लिए, पर जाएं ऑनलाइन ओसीआर, बटन दबाएँ फ़ाइल का चयन करें, और अपने कंप्यूटर पर फ़ाइल का चयन करें। आकार प्रतिबंध हैं - फ़ाइल का वजन 5 एमबी से अधिक नहीं होना चाहिए।

आसन्न क्षेत्रों में, पाठ दस्तावेज़ की भाषा और विस्तार का चयन करें जिसमें छवि से प्राप्त पाठ होगा। इसके बाद नीचे कैप्चा दर्ज करें और बटन पर क्लिक करें बदलनादायी ओर।

नीचे पाठ होगा जिसे आप कॉपी कर सकते हैं, और पाठ के ऊपर इस पाठ के साथ फ़ाइल डाउनलोड करने के लिए एक लिंक होगा।

एबीबीवाई फाइनरीडर ऑनलाइन

इसकी बहुमुखी प्रतिभा के मामले में बहुत अच्छी सेवा। पर एबीबीवाई फाइनरीडर ऑनलाइनआप न केवल किसी चित्र से पाठ को पहचान सकते हैं, बल्कि दस्तावेज़ों का अनुवाद भी कर सकते हैं, चित्रों से तालिकाओं का एक्सेल में और स्कैन से अनुवाद कर सकते हैं।

इस सेवा में पंजीकरण है, लेकिन आप प्रवेश द्वार का उपयोग करके प्राप्त कर सकते हैं सामाजिक जाल Facebook, Google+ सेवाएं, या Microsoft खाता।

इस दृष्टिकोण का लाभ यह है कि बनाए गए दस्तावेज़ आपके खाते में 14 दिनों तक संग्रहीत रहेंगे, और यदि आप उन्हें अपने कंप्यूटर से हटा भी देते हैं, तो आप सेवा पर वापस लौट सकते हैं और उन्हें फिर से डाउनलोड कर सकते हैं।

ऑनलाइन ओसीआर एन

रूसी में जानकारी के साथ पिछले एक के समान एक सेवा। सेवा कैसे काम करती है ऑनलाइन ओसीआरअन्य सभी के समान - फ़ाइल चुनें बटन पर क्लिक करें, चित्र अपलोड करें, टेक्स्ट दस्तावेज़ की भाषा और आउटपुट स्वरूप चुनें, और टेक्स्ट पहचानें बटन पर क्लिक करें।

चित्रों से पाठ पहचान के अलावा, सेवा छवियों का अनुवाद करने की क्षमता प्रदान करती है पीडीएफ प्रारूप, एक्सेल, एचटीएमएल और अन्य, और दस्तावेज़ की संरचना और लेआउट चित्र में एक से मेल खाएगा।

इस सेवा का पंजीकरण भी है, और इसकी सहायता से आपके द्वारा बनाई गई फ़ाइलें आपके व्यक्तिगत खाते में संग्रहीत की जाएंगी।

मेरी राय में, चित्रों से पाठ पहचान की ये सेवाएँ सर्वश्रेष्ठ हैं। मुझे उम्मीद है कि वे आपके भी काम आएंगे। साथ ही शायद मैं सब नहीं हूं अच्छी सेवाएंप्रबुद्ध। मैं आपकी टिप्पणियों की प्रतीक्षा कर रहा हूं कि आप इन सेवाओं को कितना पसंद करते हैं, आप किन सेवाओं का उपयोग करते हैं और उनमें से कौन सी आपकी राय में सबसे सुविधाजनक हैं।

आप "सभी पाठ्यक्रम" और "उपयोगिता" अनुभागों में अधिक विस्तृत जानकारी प्राप्त कर सकते हैं, जिसे साइट के शीर्ष मेनू के माध्यम से एक्सेस किया जा सकता है। इन अनुभागों में, लेखों को विषय के आधार पर ब्लॉक में समूहित किया जाता है जिसमें विभिन्न विषयों पर सबसे विस्तृत (जहाँ तक संभव हो) जानकारी होती है।

आप ब्लॉग की सदस्यता भी ले सकते हैं और सभी नए लेखों के बारे में जान सकते हैं।
इसमें ज्यादा समय नहीं लगता है। बस नीचे दिए गए लिंक पर क्लिक करें:

एबीबीवाई फाइनरीडर ऑनलाइनहम स्कैन किए गए दस्तावेज़ों और डिजिटल फ़ोटो को ऑनलाइन पहचानते हैं।

अब सब फ्री है:

  • 10 पेज $3.00
  • 30 पृष्ठ $8.00
  • 100 पृष्ठ $20.00
  • 300 पृष्ठ $50.00
  • 1000 पृष्ठ $70.00
एबीबी फाइनरीडर- सबसे अच्छा कार्यक्रमइस डोमेन में। अब उसे खाओ ऑनलाइन संस्करण. यह उन लोगों के लिए सुविधाजनक होगा जिन्हें इसकी अक्सर आवश्यकता नहीं होती है। आपको अपने कंप्यूटर पर डाउनलोड करने की आवश्यकता नहीं है अतिरिक्त कार्यक्रम(प्रत्येक संसाधन लेता है, और फिर सिस्टम धीमा होने लगता है)।
  • बहुभाषी दस्तावेजों की मान्यता (एक साथ 3 भाषाओं तक): अंग्रेजी, रूसी, फ्रेंच, जर्मन, स्पेनिश, यूक्रेनी... (कुल 37 भाषाएं);
  • आप निम्न में से किसी भी स्वरूप में फ़ाइलों को पहचान सकते हैं:
    1. *.जेपीजी (*.जेपीईजी)
    2. *.झगड़ा (*.झगड़ा)
    3. *.पीसीएक्स
    4. *.dcx
    5. *.बीएमपी
    6. *.png
    7. *.djvu, *.djv
    8. *.पीडीएफ
  • स्वरूपों में परिवर्तित करना
    1. टेक्स्ट दस्तावेज़ (*.txt)
    2. आरटीएफ दस्तावेज़ (* .rtf)
    3. दस्तावेज़ पीडीएफ (*। पीडीएफ)
    4. दस्तावेज़ PDF/A (*.pdf)
  • दस्तावेज़ को सफलतापूर्वक पहचानने और अपनी पसंद के प्रारूप में सहेजे जाने के बाद, आप इसे कार्य इतिहास से डाउनलोड कर सकते हैं। यहां आप अपने काम की स्थिति देख सकते हैं:
    1. प्रसंस्करण में - आपको तब तक प्रतीक्षा करने की आवश्यकता है जब तक कि सर्वर आपकी छवि को पहचान न ले;
    2. मान्यता प्राप्त - दस्तावेज़ प्रसंस्करण पूरा हो गया है, और आप पहले से ही मान्यता परिणाम डाउनलोड कर सकते हैं;
    3. पहचान त्रुटि - दस्तावेज़ पहचाना नहीं गया था;
    4. मान्यता की निम्न गुणवत्ता। कार्य मुफ्त में पूरा हुआ - दस्तावेज़ को बड़ी संख्या में त्रुटियों के साथ पहचाना गया।
    5. मान्यता प्राप्त दस्तावेज़ 72 घंटों के लिए सर्वर पर संग्रहीत हैं और आपकी प्रोफ़ाइल में ऑर्डर इतिहास से डाउनलोड करने के लिए उपलब्ध हैं,
    6. यदि आपके लिए मेल द्वारा डाउनलोड लिंक प्राप्त करना अधिक सुविधाजनक है, तो बस "ईमेल द्वारा मान्यता परिणाम के लिए एक लिंक भेजें" बॉक्स को चेक करें और एक पत्र की प्रतीक्षा करें जिसमें कहा गया हो कि आपका दस्तावेज़ मान्यता प्राप्त है।

https:// ड्राइव.google.com

पाठ पहचान सुविधा Google डॉक्स में उपलब्ध है।
रूसी सहित 29 भाषाएँ मान्यता प्राप्त हैं। समर्थित प्रारूप .JPG, .GIF, .PNG और .PDF दस्तावेज़ हैं। 10 एमबी. File.PDF 10 पृष्ठों से अधिक नहीं।

  1. हम Google डॉक्स पर जाते हैं, आप Google मेल से जा सकते हैं।
  2. माउस का उपयोग करके, एक छवि या PDF फ़ाइल को ब्राउज़र विंडो (इन गूगल क्रोमयह निश्चित रूप से काम करता है)।
  3. नीचे एक विंडो दिखाई देती है और शीर्ष पर एक छोटा मेनू होता है।
  4. नीचे के 2 आइटम के बगल में स्थित बॉक्स को चेक करें (जैसा कि आप चित्र में देख सकते हैं):
    • V - टेक्स्ट को इससे कन्वर्ट करें पीडीएफ फाइलेंऔर चित्र
    • वी - प्रत्येक बूट से पहले सेटिंग्स की पुष्टि करें
  5. विंडो बंद करें और इमेज को फिर से अपलोड करें।
  6. अब, लोड करते समय, यह पाठ को पहचानने की पेशकश करता है, आपको केवल भाषा निर्दिष्ट करने की आवश्यकता होती है।
  7. तब चित्र को चित्र के रूप में सहेजा गया था, लेकिन यदि आप इसे पाठ संपादक के साथ खोलते हैं, तो चित्र के नीचे मान्यता प्राप्त पाठ होगा।

https:// img2txt.com

Img2txtछवि पहचान सेवा।
रूसी में सेवा, बिल्कुल मुफ्त।
ऑनलाइन काफी जल्दी पहचान लेता है। सच है, उन्होंने मुझे एक कतार में रखा, लेकिन मैं पहली पंक्ति में था। मैंने त्रुटियों की जाँच की। उत्कृष्ट गुणवत्ता के पाठ का एक छोटा टुकड़ा (मैंने अपनी साइट से एक स्क्रीनशॉट लिया, यह कहां बेहतर है?) ने प्रत्येक शब्द में 2 त्रुटियां दीं। यह स्कैन के साथ बहुत बेहतर काम करता है। सेवा को ध्यान में लाया जाएगा। आप अच्छे परिणाम की उम्मीद कर सकते हैं। यूक्रेन में हमेशा अच्छे प्रोग्रामर रहे हैं।

https://www. onlineocr.net

ऑनलाइन ओसीआरपाठ पहचान सेवा।

स्रोत प्रारूप

  1. जेपीजी/जेपीईजी,
  2. टीआईएफ / टीआईएफएफ,
  3. टीआईएफएफ बहुपृष्ठ,
  4. पीडीएफ बहुपृष्ठ।
बहुपृष्ठ दस्तावेज़ में, पृष्ठों को चुनिंदा रूप से पहचाना जा सकता है।

स्वरूपों में परिवर्तित हो जाता है

  1. दस्तावेज़ पीडीएफ (*। पीडीएफ)
  2. Microsoft Word दस्तावेज़ (*.doc)
  3. दस्तावेज़ माइक्रोसॉफ्ट एक्सेल(*.xls)
  4. HTML दस्तावेज़ (* .html)
  5. आरटीएफ दस्तावेज़ (* .rtf)
  6. पाठ दस्तावेज़ (* .txt) बनाई गई फ़ाइल मूल दस्तावेज़ (टेबल, कॉलम, फ़ॉन्ट, आदि) की संरचना को बिल्कुल दोहराएगी।

    परिणाम

    ऑनलाइन अपने आभासी कार्यालय में मान्यता के परिणाम वाली फाइलें, उन्हें डाउनलोड करें एचडीडी, संपादित करें, ईमेल करें और प्रिंट करें।

    परिसीमन

    1. फ़ाइल का आकार अधिक नहीं होना चाहिए 20 एमबी.
    2. उच्च-गुणवत्ता वाला पहचान परिणाम प्राप्त करने के लिए, छवि रिज़ॉल्यूशन कम से कम होना चाहिए 200 डीपीआई.