பொருளடக்கம்
ஒரு PDF கோப்பில் உள்ள ஒரு விரிதாளிலிருந்து மைக்ரோசாஃப்ட் எக்செல் தாளுக்கு தரவை மாற்றும் பணி எப்போதும் "வேடிக்கையானது". குறிப்பாக FineReader அல்லது அது போன்ற விலையுயர்ந்த அங்கீகார மென்பொருள் உங்களிடம் இல்லையென்றால். நேரடி நகலெடுப்பது பொதுவாக நல்ல எதற்கும் வழிவகுக்காது, ஏனெனில். தாளில் நகலெடுக்கப்பட்ட தரவை ஒட்டிய பிறகு, அவை பெரும்பாலும் ஒரு நெடுவரிசையில் "ஒன்றாக ஒட்டிக்கொண்டிருக்கும்". எனவே அவர்கள் ஒரு கருவியைப் பயன்படுத்தி மிகவும் கடினமாக பிரிக்கப்பட வேண்டும் நெடுவரிசைகள் மூலம் உரை தாவலில் இருந்து தேதி (தரவு - நெடுவரிசைகளுக்கு உரை).
நிச்சயமாக, உரை அடுக்கு இருக்கும் PDF கோப்புகளுக்கு மட்டுமே நகலெடுப்பது சாத்தியமாகும், அதாவது காகிதத்திலிருந்து PDF க்கு ஸ்கேன் செய்யப்பட்ட ஆவணத்துடன், இது கொள்கையளவில் இயங்காது.
ஆனால் அது மிகவும் வருத்தமாக இல்லை, உண்மையில் 🙂
உங்களிடம் Office 2013 அல்லது 2016 இருந்தால், ஓரிரு நிமிடங்களில், கூடுதல் நிரல்கள் இல்லாமல், PDF இலிருந்து Microsoft Excel க்கு தரவை மாற்றுவது மிகவும் சாத்தியமாகும். மேலும் Word மற்றும் Power Query இதற்கு நமக்கு உதவும்.
எடுத்துக்காட்டாக, ஐரோப்பாவிற்கான பொருளாதார ஆணையத்தின் இணையதளத்தில் உள்ள உரை, சூத்திரங்கள் மற்றும் அட்டவணைகளின் தொகுப்புடன் இந்த PDF அறிக்கையை எடுத்துக் கொள்வோம்:
… மற்றும் எக்செல் இல் இருந்து வெளியேற முயற்சிக்கவும், முதல் அட்டவணையைச் சொல்லவும்:
போகலாம்!
படி 1. Word இல் PDF ஐ திறக்கவும்
சில காரணங்களால், சிலருக்குத் தெரியும், ஆனால் 2013 முதல் மைக்ரோசாப்ட் வேர்ட் PDF கோப்புகளைத் திறக்கவும் அங்கீகரிக்கவும் கற்றுக்கொண்டது (ஸ்கேன் செய்யப்பட்டவை கூட, அதாவது உரை அடுக்கு இல்லாமல்!). இது முற்றிலும் நிலையான வழியில் செய்யப்படுகிறது: திறந்த வார்த்தை, கிளிக் செய்யவும் கோப்பு - திற (கோப்பு - திற) மற்றும் சாளரத்தின் கீழ் வலது மூலையில் உள்ள கீழ்தோன்றும் பட்டியலில் PDF வடிவமைப்பைக் குறிப்பிடவும்.
பின் நமக்கு தேவையான PDF கோப்பை தேர்வு செய்து கிளிக் செய்யவும் திறந்த (திறந்த). இந்த ஆவணத்தில் OCR ஐ உரைக்கு இயக்கப் போகிறது என்று வேர்ட் சொல்கிறது:
நாங்கள் ஒப்புக்கொள்கிறோம், சில வினாடிகளில் வேர்டில் ஏற்கனவே எடிட்டிங் செய்ய எங்கள் PDF திறக்கப்பட்டதைக் காண்போம்:
நிச்சயமாக, வடிவமைப்பு, பாணிகள், எழுத்துருக்கள், தலைப்புகள் மற்றும் அடிக்குறிப்புகள் போன்றவை ஆவணத்திலிருந்து ஓரளவு பறந்து செல்லும், ஆனால் இது எங்களுக்கு முக்கியமல்ல - எங்களுக்கு அட்டவணையில் இருந்து தரவு மட்டுமே தேவை. கொள்கையளவில், இந்த கட்டத்தில், அங்கீகரிக்கப்பட்ட ஆவணத்திலிருந்து அட்டவணையை வேர்டில் நகலெடுத்து எக்செல் இல் ஒட்டுவது ஏற்கனவே தூண்டுகிறது. சில நேரங்களில் இது வேலை செய்கிறது, ஆனால் பெரும்பாலும் இது எல்லா வகையான தரவு சிதைவுகளுக்கும் வழிவகுக்கிறது - எடுத்துக்காட்டாக, எண்கள் தேதிகளாக மாறலாம் அல்லது உரையாக இருக்கலாம், ஏனெனில் எங்கள் விஷயத்தில். PDF பிரிப்பான்களைப் பயன்படுத்துகிறது:
எனவே மூலைகளை வெட்ட வேண்டாம், ஆனால் எல்லாவற்றையும் இன்னும் கொஞ்சம் சிக்கலாக்குவோம், ஆனால் சரியானது.
படி 2: ஆவணத்தை இணையப் பக்கமாகச் சேமிக்கவும்
பெறப்பட்ட தரவை எக்செல் (பவர் வினவல் வழியாக) ஏற்றுவதற்கு, வேர்டில் உள்ள எங்கள் ஆவணம் வலைப்பக்க வடிவமைப்பில் சேமிக்கப்பட வேண்டும் - இந்த வடிவம், வேர்ட் மற்றும் எக்செல் இடையே ஒரு வகையான பொதுவான வகுப்பாகும்.
இதைச் செய்ய, மெனுவுக்குச் செல்லவும் கோப்பு - இவ்வாறு சேமி (கோப்பு - இவ்வாறு சேமி) அல்லது விசையை அழுத்தவும் F12 விசைப்பலகையில் மற்றும் திறக்கும் சாளரத்தில், கோப்பு வகையைத் தேர்ந்தெடுக்கவும் ஒரு கோப்பில் இணையப் பக்கம் (இணையபக்கம் - ஒற்றை கோப்பு):
சேமித்த பிறகு, நீங்கள் mhtml நீட்டிப்புடன் ஒரு கோப்பைப் பெற வேண்டும் (எக்ஸ்ப்ளோரரில் கோப்பு நீட்டிப்புகளைப் பார்த்தால்).
நிலை 3. பவர் வினவல் வழியாக கோப்பை எக்செல் இல் பதிவேற்றுகிறது
நீங்கள் உருவாக்கிய MHTML கோப்பை எக்செல் இல் நேரடியாகத் திறக்கலாம், ஆனால் முதலில், PDF இன் அனைத்து உள்ளடக்கங்களையும், உரை மற்றும் தேவையற்ற அட்டவணைகளின் தொகுப்புடன் ஒரே நேரத்தில் பெறுவோம், இரண்டாவதாக, தவறான காரணத்தால் தரவை மீண்டும் இழப்போம். பிரிப்பான்கள். எனவே, பவர் வினவல் செருகு நிரல் மூலம் எக்செல் இல் இறக்குமதி செய்வோம். இது முற்றிலும் இலவச ஆட்-ஆன் ஆகும், இதன் மூலம் நீங்கள் எந்த மூலத்திலிருந்தும் (கோப்புகள், கோப்புறைகள், தரவுத்தளங்கள், ஈஆர்பி அமைப்புகள்) எக்செல் இல் தரவைப் பதிவேற்றலாம், பின்னர் பெறப்பட்ட தரவை எல்லா வழிகளிலும் மாற்றி, விரும்பிய வடிவத்தை அளிக்கலாம்.
உங்களிடம் எக்செல் 2010-2013 இருந்தால், அதிகாரப்பூர்வ மைக்ரோசாஃப்ட் வலைத்தளத்திலிருந்து பவர் வினவலைப் பதிவிறக்கலாம் - நிறுவிய பின் நீங்கள் ஒரு தாவலைக் காண்பீர்கள். சக்தி வினவல். உங்களிடம் எக்செல் 2016 அல்லது புதியது இருந்தால், நீங்கள் எதையும் பதிவிறக்க வேண்டியதில்லை - எல்லா செயல்பாடுகளும் ஏற்கனவே எக்செல் இல் இயல்பாக கட்டமைக்கப்பட்டுள்ளன மற்றும் தாவலில் அமைந்துள்ளன தேதி (தேதி) குழுவில் பதிவிறக்கம் செய்து மாற்றவும் (பெறவும் & மாற்றவும்).
எனவே நாம் தாவலுக்குச் செல்கிறோம் தேதி, அல்லது தாவலில் சக்தி வினவல் மற்றும் ஒரு அணியை தேர்வு செய்யவும் தரவு பெற or வினவலை உருவாக்கவும் - கோப்பிலிருந்து - XML இலிருந்து. XML கோப்புகள் மட்டும் தெரியாமல் இருக்க, சாளரத்தின் கீழ் வலது மூலையில் உள்ள கீழ்தோன்றும் பட்டியலில் உள்ள வடிப்பான்களை மாற்றவும் அனைத்து கோப்புகள் (அனைத்து கோப்புகள்) மற்றும் எங்கள் MHTML கோப்பைக் குறிப்பிடவும்:
ஏனெனில், இறக்குமதி வெற்றிகரமாக முடிவடையாது என்பதை நினைவில் கொள்ளவும். பவர் வினவல் எங்களிடமிருந்து XML ஐ எதிர்பார்க்கிறது, ஆனால் உண்மையில் எங்களிடம் HTML வடிவம் உள்ளது. எனவே, தோன்றும் அடுத்த சாளரத்தில், பவர் வினவலுக்குப் புரியாத கோப்பின் மீது வலது கிளிக் செய்து அதன் வடிவமைப்பைக் குறிப்பிட வேண்டும்:
அதன் பிறகு, கோப்பு சரியாக அங்கீகரிக்கப்படும் மற்றும் அதில் உள்ள அனைத்து அட்டவணைகளின் பட்டியலையும் காண்போம்:
தரவு நெடுவரிசையில் உள்ள கலங்களின் வெள்ளை பின்னணியில் (வார்த்தை அட்டவணையில் இல்லை!) இடது சுட்டி பொத்தானைக் கிளிக் செய்வதன் மூலம் அட்டவணைகளின் உள்ளடக்கங்களைக் காணலாம்.
விரும்பிய அட்டவணை வரையறுக்கப்பட்டவுடன், பச்சை வார்த்தையின் மீது சொடுக்கவும் மேசை - மற்றும் நீங்கள் அதன் உள்ளடக்கங்களில் "விழ":
அதன் உள்ளடக்கங்களை "சீப்பு" செய்ய சில எளிய படிகளைச் செய்ய வேண்டும், அதாவது:
- தேவையற்ற நெடுவரிசைகளை நீக்கு (நெடுவரிசை தலைப்பில் வலது கிளிக் செய்யவும் - அகற்று)
- புள்ளிகளை காற்புள்ளிகளால் மாற்றவும் (நெடுவரிசைகளைத் தேர்ந்தெடுக்கவும், வலது கிளிக் செய்யவும் - மதிப்புகளை மாற்றுதல்)
- தலைப்பில் சம அடையாளங்களை அகற்றவும் (நெடுவரிசைகளைத் தேர்ந்தெடுக்கவும், வலது கிளிக் செய்யவும் - மதிப்புகளை மாற்றுதல்)
- மேல் வரியை அகற்று (முகப்பு - வரிகளை நீக்கு - மேல் வரிகளை நீக்கு)
- வெற்று கோடுகளை அகற்றவும் (முகப்பு - வரிகளை நீக்கு - வெற்று வரிகளை நீக்கு)
- முதல் வரிசையை அட்டவணை தலைப்புக்கு உயர்த்தவும் (முகப்பு - முதல் வரியை தலைப்புகளாகப் பயன்படுத்தவும்)
- வடிகட்டியைப் பயன்படுத்தி தேவையற்ற தரவை வடிகட்டவும்
அட்டவணை அதன் இயல்பான வடிவத்திற்கு கொண்டு வரப்பட்டால், அதை கட்டளையுடன் தாளில் இறக்கலாம் மூடி பதிவிறக்கவும் (மூடு & ஏற்றவும்) on முக்கிய தாவல். நாம் ஏற்கனவே வேலை செய்யக்கூடிய அத்தகைய அழகைப் பெறுவோம்:
- பவர் வினவலுடன் ஒரு நெடுவரிசையை அட்டவணையாக மாற்றுதல்
- ஒட்டும் உரையை நெடுவரிசைகளாகப் பிரித்தல்