ښه ماسپښین
شاید موږ هر یو د کار سره مخ شو کله چې تاسو اړتیا لرئ د کاغذ سند د برقی بڼه کې ژباړئ. دا په تیره بیا د هغو کسانو لپاره چې مطالعه کوي، د اسنادو سره کار، د الیکترینیک لغاتونو په وسیله ژباړل شوي متنونه اړین دي.
په دې مقاله کې غواړم د دې بهیر ځینې اساسات شریک کړم. په عموم کې، د سکیننګ او متن پیژندنه ډیر وخت وخت نیسي، ځکه چې ډیری عملیات باید په لاس کې ترسره شي. موږ به هڅه وکړو چې څه شی، څنګه او ولې.
هرڅومره ژر یو شی نه پوهیږي. د سکیننګ وروسته (په سکینر کې ټول شیټونه ضایع کړئ) تاسو به د BMP، JPG، PNG، GIF بڼه عکس ولرئ (هلته کیدی شي نور فارمیټونه وي). نو له دې انځور څخه تاسو متن ته اړتیا لرئ - دا پروسیجر د پیژندنې په نامه یادېږي. پدې ترتیب کې، او لاندې به وړاندې شي.
منځپانګې
- .1 د سکیننګ او پیژندنې لپاره څه اړتیا ده؟
- 2. د متن سکینګ اختیارونه
- .3 د لاسوند متن متن پیژندل
- 3.1 متن
- 3.2 انځورونه
- 3.3 میزونه
- 3.4 غیر ضروري توکي
- د PDF / DJVU فایلونو پیژندنه
- 5. د کار پایلې د چک او ساتلو تېروتنه
.1 د سکیننګ او پیژندنې لپاره څه اړتیا ده؟
1) سکینر
د چاپ شوي سندونو ژباړل د متن لپاره، تاسو لومړی د سکینر اړتیا ته اړتیا لرئ او په وینا، د "اصلي" پروګرامونه او چلوونکي چې ورسره ورسره وو. د دوی سره تاسو اسناد کولی شی او د نور پروسس لپاره یې وساتئ.
تاسو کولی شئ د نورو انالوګ څخه کار واخلئ، مګر هغه سافټویر چې په کټ کې د سکینر سره راغلی وي معمولا ډیر چټک کار کوي او ډیر انتخابونه لري.
د کوم ډول سکینر په نظر کې نیولو سره - د کار سرعت ممکن د پام وړ توپیر ولري. سکینرونه شته چې کولی شي په 10 ثانیو کې د یوې پاڼې څخه یوه عکس ترلاسه کړي، دا داسې دي چې دا به په 30 ثانیو کې ترلاسه کړي. که تاسو د 200-300 پاڼې په اړه کتاب ولرئ - زما په اند دا ستونزمن کار ندی ستونزمن کیدی چې څو ځلې به په وخت کې توپیر ولری؟
2) د پیژندلو لپاره پروګرام
زموږ په مقاله کې، زه به تاسو ته د سکیننګ لپاره د غوره پروګرامونو څخه او په بشپړ ډول د اسنادو پیژندنه کې تاسو ته ښایې ښودل شي - ABBYY FineReader. له پروګرام تادیه شوی، نو ژر به زه د بل لپاره یو بل سره اړیکه ونیسم - د کوونی فارم مفت آزادی. سمه ده، زه د دوی پرتله نه کوم، د حقیقت له مخې چې فین ریډر په ټولو برخو کې ګټلی دی، زه سپارښتنه کوم چې ټول ورته ورته کړم.
ABBYY FineReader 11
رسمي ځای: //www.abbyy.ru/
د خپل ډول غوره پروګرامونه. دا د انځور په متن کې د متن پیژندلو لپاره ډیزاین شوی. ډیری انتخابونه او ځانګړتیاوې جوړې کړې. دا د فونټ ډوډۍ نسکورولی شي، حتی د لاسي لیکونو نسخه ملاتړ کوي (که څه هم ما په شخصي توګه دا هڅه نه ده کړې، زه فکر کوم چې دا په لاس کې د لاسي لیک نسخه پیژني، مګر تر هغه چې تاسو د خطاطې بشپړ کالی لیک لاسلیک نه لرئ). د هغې سره د کار کولو په اړه نور معلومات په لاندې ډول بحث کیږي. موږ دلته یادونه کوو چې مقاله به په 11 پروګرامونو کې کار پوښښ کړي.
د یوې قاعدې په توګه، د ABBYY FineReader بیلابیل نسخې د یو بل څخه ډیر توپیر نلري. تاسو کولی شئ په اسانۍ سره په یو بل سره ترسره کړئ. اصلي توپیر کیدی شي د اسانتیا، د پروګرام سرعت او د هغې وړتیا کې وي. د بیلګې په توګه، پخوانی نسخه د PDF سند او د DJVU د خلاصولو څخه انکار کول ...
3) سکینټونه
هو، دلته دلته، ما پریکړه وکړه چې اسناد په جلا جلا کالم کې واخیست. په ډیری مواردو کې، د درسي کتابونو، ورځپاڼو، مقالو، مجلو او نورو سکنټونو سکین هغه کتابونه او ادبيات چې په غوښتنه کې دي. زه څه شی یم؟ د شخصي تجربې څخه، زه کولی شم ووایم چې هغه څه چې تاسو یې اسکین غواړئ - کېدی شي چې په خالص کې وي! کله چې ما په یوه شبکه کې یو کتاب یا بل مخکې سکینډ موندلی و، په څو وخت کې زه وخت نیولی شم. ما یوازې متن باید په سند کې کاپي کړم او ورسره دوام وموم.
د دې ساده مشورې څخه - مخکې له دې چې تاسو ځینې شیان وینئ، وګورئ که څوک لا دمخه یې سکین کړی وي او تاسو د خپل وخت ضایع کولو ته اړتیا نلري.
2. د متن سکینګ اختیارونه
دلته، زه به د سکینر لپاره ستاسو د موټر چلوونکو په اړه خبرې مه کوئ، هغه پروګرامونه چې له هغې سره لاړل، ځکه چې د سکینر ماډل مختلف دي، سافټویر هم په هر ځای کې توپیر لري او اټکل کوي او حتی په روښانه توګه دا ښودل چې عملیات څنګه غیر واقعا دي.
مګر ټول سکینرونه یو شان سیسټمونه لري چې ستاسو د کار سرعت او کیفیت باندې خورا تاثیر لري. دلته د هغوی په اړه زه به دلته خبرې وکړم. زه به په ترتیب سره لیست لرم.
1) د سکین کیفیت - DPI
لومړی، د ډیپلوماټیک کیفیت په انتخابونو کې د 300 DPI څخه کم نه وټاکه. دا به مشوره وشي چې حتی نور هم وساتئ، که امکان ولري. د DPI شاخص لوړ دی، پاک به ستاسو عکس وتړل شي، او همداسې به، نور پروسس به چټکتیا سره ترسره شي. برسېره پردې، د سکین کیفیت لوړ - تاسو لږ غلطیان چې تاسو یې باید سم سم کړئ.
غوره انتخاب، معمولا 300-400 ډیپلومات وړاندې کوي.
2) کرومیټیټیټ
دا پیرامیټر د اسکین وخت ډیر اغیزمن کوي (د الرې په توګه، DPI هم اغیز لري، مګر دا خورا پیاوړي دي، او یوازې کله چې کارن خورا لوړه ارزښتونه ټاکي).
معمولا دری طریقې دي:
- تور او سپینه (د ساده متن لپاره مناسبه)
- سپین (د میزونو او انځورونو سره د متن لپاره مناسب).
- رنګ (د رنګ مجلو لپاره، کتابونه، په عمومي توګه، اسناد، چیرې رنګ خورا مهم دی).
معمولا د اسکین وخت د رنګ په انتخاب پورې اړه لري. په هرصورت، که تاسو یو لوی سند ولرئ، حتی په ټولیزه توګه 5-10 ثانیې په مجموع کې به په ښه توګه پایله ولري ...
3) عکسونه
تاسو کولی شئ سند یوازې نه یوازې د سکیننګ له لارې ترلاسه کړئ، بلکه د دې انځور عکس واخلئ. د یوې قاعدې په توګه، په دې حالت کې تاسو یو څه نورې ستونزې ولرئ: د انځور اختصاص، چټک. د دې له امله، دا د السته راوړلو متن لا نور تمدید او پروسس ته اړتیا لري. په شخصي توګه، زه د دې سوداګرۍ لپاره د کیمرونو کارولو وړاندیز نه کوم.
دا مهمه ده چې ياد ولرئ چې هر ډول سند به ونه پيژندل شي، ځکه چې د سکین کیفیت کولی شي خورا ټیټ وي ...
.3 د لاسوند متن متن پیژندل
موږ داسې انګیرل کیږو چې هغه سورت شوي پاڼې چې تاسو یې ترلاسه کړې وې ترلاسه کړې. معمولا دوی شکلونه دي: ټیف، بی بی بی، جpg، PNG. په عمومي توګه، د ABBYY فین ریڈر لپاره - دا خورا مهم نه دی ...
په ABBYY فین ریډر کې د تصویر پرانیستلو وروسته، د یوې قاعدې په توګه، پروګرام په ماشین کې د سیمو غوره کول پیلوي او دوی پیژني. خو کله ناکله هغه غلطه کوي. د دې لپاره موږ په پام کې لرو چې د غوښتل شویو سیمو انتخاب په سمه توګه وګورو.
دا مهمه ده! هیڅوک نه پوهیږي چې په پروګرام کې د اسنادو پرانیستلو وروسته، د سرچینې سند په کړکۍ کې ښي لور ته ښودل کیږي، په کوم کې چې تاسو په مختلفو سیمو باندې ګوته نیسي. د "شناخت" تڼۍ په کلیک کولو وروسته، په ښي خوا کې د پروګرام پروګرام به تاسو ته بشپړ متن راوړي. د پیژندلو وروسته، د لارې په توګه، دا مشوره ورکول کیږي چې د فین ریډر په لیکلو کې د غلطیتونو پلټنه وګورئ.
3.1 متن
دا ساحه د متن په نښه کولو لپاره کارول کیږي. انځورونه او میزونه باید له دې څخه بې برخې شي. نیمګړی او غیر معمولی فونونه باید په مینځنی توګه داخل شی ...
د متن ساحه غوره کولو لپاره، د FineReader په سر کې پینل ته پام وکړئ. یو تڼۍ شته "T" (وګورئ. د سکرین اس شاټ لاندې، د مږو لیکونکی په دې تڼۍ کې دی). په هغې باندې کلیک وکړئ، نو لاندې انځور کې لاندې دقیقه مستطیل ساحه انتخاب کړئ چې متن یې موقعیت لري. د لارې په توګه، په ځینو مواردو کې تاسو اړتیا لرئ چې د 2-3 درسي بلاکسونه جوړ کړئ، او ځینې وختونه په هره صفحه 10-12، ځکه د متن بڼه کولی شي توپیر ولري او ټولې برخې د یوې مستطیل سره غوره نشي.
دا مهمه ده چې یادونه وکړو چې عکسونه باید متن متن ته ورننوځي! په راتلونکي کې، دا به تاسو ته ډیر وخت وساتي ...
3.2 انځورونه
د انځورونو او هغو ساحو په نښه کولو لپاره کارول شوي چې د پیرود کیفیت یا غیر معمولي فکس له امله پیژندل ستونزمن دي.
لاندې د اس اسټینټ شاټ کې، د میس لیکونکی په هغه تڼۍ کې واقع دی چې د "انځور" ساحې انتخابولو لپاره کارول کیږي. د لارې په توګه، د پاڼی یوه برخه په بشپړ ډول په دې ساحه کې غوره کیدی شي، او د FineReader وروسته به دا سند په یو سند کې د عادي تصویر په توګه داخل کړي. د یوازې "بیوقوف" کاپی به ...
په عموما، دا ساحه د بېوزلو سکین شوي میزونو په نښه کولو لپاره کارول کیږي، ترڅو خپل ځانونه غیر معیاري متن او فټیو روښانه کړي.
3.3 میزونه
لاندې د اسلاین شاټ د میزونو په نښه کولو لپاره تڼۍ ښیي. په عمومی توګه، زه په شخصی توګه کاروم. حقیقت دا دی چې تاسو باید په سمه توګه په میز کې هر کرښه راښکاره کړئ او دا وښودئ چې څه شی او پروګرام څنګه. که چیرې میز کوچنی وي او په ښه کیفیت کې نه وي، زه د دې مقاصدو لپاره "انځور" ساحه کاروم. په دې توګه ډیری وخت وساتئ، او بیا تاسو کولی شئ په چټکۍ سره د کلمې په اساس میز کې میز جوړ کړئ.
3.4 غیر ضروري توکي
دا یادونه ضروري ده. ځینې وختونه په دې پاڼه کې غیر ضروري عناصر شتون لري چې متن یې پیژندل ستونزمن کوي، یا اجازه ورنکړي چې تاسو وغواړئ چې غوښتل شوي سیمې غوره کړئ. دوی کولی شي په "ټولیز" سره په ټوله توګه لیرې کړي.
د دې کولو لپاره، د انځور سمولو موډل ته لاړ شئ.
د اییرر وسیله غوره کړئ او ناپاکه سیمه انتخاب کړئ. دا به له منځه تللی شي او په دې ځای کې به د کاغذ سپینه پاڼه وي.
د لارې په توګه، زه تاسو ته د امکان تر ممکن حد پورې د دې اختیار څخه کار واخلم. ټولې متنې سیمې چې تاسو یې ټاکلې دي هڅه وکړئ، چیرې چې د متن یوه ټوټه ته اړتیا نلري، یا کوم غیر ضروري نکات شتون لري، بلوڅتیا، اخترونه - د اییرر سره لرې کړئ. د دې پیژندنه مننه به چټکه وي!
د PDF / DJVU فایلونو پیژندنه
په عموم کې، د پیژندګلوي بڼه به د نورو څخه توپیر نه وي - د بیلګې په توګه تاسو کولی شئ د هغې سره د انځورونو په څیر کار وکړئ. یوازینی شی چې پروګرام باید زاړه نسخه نه وي، که تاسو د PDF / DJVU فایل نه خلاص کړئ - نسخه 11 ته تازه کړئ.
لږ مشوره. په FineReader کې د سند پرانستلو وروسته - دا به په اوتومات ډول د سند پیژندلو لپاره پیل شي. اکثرا په PDF / DJVU فایلونو کې، د پاڼې یو ځانګړي ساحه په ټوله سند کې اړتیا نه ده! په ټولو پاڼو کې د داسې یوې ساحې د لرې کولو لپاره، الندې کارونه وکړئ:
1. د انځور سمونې برخې ته لاړ شئ.
2. د "trimming" اختیار فعال کړئ.
.3 هغه سیمې وټاکئ چې تاسو یې په ټولو پاڼو کې اړتیا لرئ.
4. په ټولو پاڼو او ټیمونو کې درخواست وکړئ کلیک وکړئ.
5. د کار پایلې د چک او ساتلو تېروتنه
داسې ښکاري چې اوس هم ستونزې شتون لري کله چې ټولې سیمې غوره شوې، بیا یې پیژندل - لیږدئ او یې وژغورل ... دا هلته نه و!
لومړی، موږ دې سند ته اړتیا لرو!
د پېژندلو وروسته، د ښي لارې په کړکۍ کې، به د "چک" تڼۍ وي، لاندې د اسڪرين شاټ وګورئ. وروسته له هغې، د FineReader پروګرام به په اتوماتيک ډول تاسو ته هغو سیمو ته وښودل شي چیرته چې پروګرام غلطیت لري او دا په مناسب ډول د یو یا بل علامت نښه نشي کولی. تاسو به یواځې غوره کړئ، یا تاسو د پروګرام نظر سره موافق یاست، یا خپل کرکټر داخل کړئ.
په لاره کې، په نیمایي قضیې کې، نږدې، پروګرام به تاسو ته چمتو شوی سمه کلمه وړاندې کړي - تاسو باید د هغه انتخاب غوره کولو لپاره یوازې مایک کاروئ.
دوهم، د چک کولو وروسته تاسو اړتیا لرئ چې د بڼه بڼه غوره کړئ چې تاسو یې د خپل کار پایلې وژغورئ.
دلته د FineReader تاسو ته بشپړ ټکي درکوي: تاسو کولی شئ په ساده ډول معلومات په یو یو پر بل کې انتقال کړئ، او تاسو کولی شئ په لسګونو فارغونو کې دا خوندي کړئ. مګر زه غواړم چې یو بل مهم اړخ څرګند کړم. کوم ډول بڼه چې تاسو غوره کوئ، د کاپي ډول غوره کولو لپاره خورا مهم دی! په زړه پورې انتخابونه په پام کې ونیسئ ...
عصري کاپي
هغه سیمې چې تاسو یې په پېژندل شوي سند کې په پاڼه کې غوره کړې د سرچینې په سند کې سم سره سمون لري. یو ډیر آسانه لاره چې ستاسو لپاره مهمه وي نو د متن بڼه نشو ورکولی. په لاره کې، فونګانې به هم اصلي وي. زه د دې اختیار سره سپارښتنه کوم چې دا سند په کلام کې انتقال کړم، ترڅو هلته نور کار ته دوام ورکړم.
د کار وړ نقل
دا اختیار خورا ښه دی ځکه چې تاسو د متن متن لایحه شوی نسخه ترلاسه کړئ. د د "کیلو متر" داخل کول، کوم چې ممکن په اصلي سند کې وي - تاسو به نه لیدل کیږئ. ګټوره انتخاب کله چې تاسو به په مهمه توګه د معلوماتو په اړه معلومات ولرئ.
سمه ده، تاسو باید دا غوره نه کړئ که چیرې تاسو لپاره د ډیزاین، فونټ، اشغالونو د اندازې ساتلو لپاره مهم وي. ځینی وختونه، که پیژندل ډیر بریالی نه وي - ستاسو سند ممکن "بدل کړئ" د بدل شوي فارمیٹ کولو له کبله. په دې حالت کې، دا د سمه کاپي انتخاب غوره کولو لپاره مشوره ورکول کیږي.
ساده متن
د هغو کسانو لپاره یو اختیار چې د پاڼې څخه یوازې د هر څه پرته متن ته اړتیا لري. د اسنادو لپاره د انځورونو او میزونو پرته مناسب.
دا د آرٹیکل سکیننګ او پیژندنه پای ته رسوي. هيله لرم چې د دې ساده لارښوونو په مرسته تاسو خپلې ستونزې حل کړي ...
ښه راغلاست!