Распознать таблицу из pdf в excel

Импорт данных из PDF в Excel через Power Query

Задача переноса данных из таблицы в PDF-файле на лист Microsoft Excel — это всегда «весело». Особенно если у вас нет дорогих программ распознавания типа FineReader или чего-то подобного. Прямое копирование обычно ни к чему хорошему не приводит, т.к. после вставки скопированных данных на лист, они, скорее всего, «слипнутся» в один столбец. Так что их потом придется кропотливо разделять с помощью инструмента Текст по столбцам с вкладки Данные (Data — Text to Columns) .

И само-собой, копирование возможно только для тех PDF-файлов, где есть текстовый слой, т.е. с только что отсканированным с бумаги в PDF документом это не сработает в принципе.

Но все не так грустно, на самом деле 🙂

Если у вас Office 2013 или 2016, то за пару минут без дополнительных программ вполне можно реализовать перенос данных из PDF в Microsoft Excel. А помогут нам в этом Word и Power Query.

Для примера, давайте возьмем вот такой PDF-отчет с кучей текста, формул и таблиц с сайта Европейской Экономической Комиссии:

. и попробуем вытащить из него в Excel, скажем первую таблицу:

Шаг 1. Открываем PDF в Word

Почему-то мало кто знает, но начиная с 2013 года Microsoft Word научился открывать и распознавать PDF файлы (даже отсканированные, т.е. без текстового слоя!). Делается это совершенно стандартным образом: открываем Word, жмем Файл — Открыть (File — Open) и уточняем PDF-формат в выпадающем списке в правом нижнем углу окна.

Затем выбираем нужный нам PDF-файл и жмем Открыть (Open) . Word сообщает нам, что собирается запустить распознавание этого документа в текст:

Соглашаемся и через несколько секунд увидим наш PDF открытым для редактирования уже в Word:

Само-собой, у документа частично слетит дизайн, стили, шрифты, колонтитулы и т.п., но для нас это не важно — нам нужны только данные из таблиц. В принципе, на этом этапе уже возникает соблазн дальше просто скопировать таблицу из распознанного документа в Word и просто вставить ее в Excel. Иногда это срабатывает, но чаще приводит ко всевозможным искажениям данных — например числа могут превратиться в даты или остаться текстом, как в нашем случае, т.к. в PDF используется не российские разделители:

Так что давайте не будем срезать углы, а сделаем все чуть сложнее, но правильно.

Этап 2. Сохраняем документ как веб-страницу

Чтобы потом загрузить полученные данные в Excel (через Power Query), наш документ в Word нужно сохранить в формате веб-страницы — этот формат является, в данном случае, неким общим знаменателем между Word’ом и Excel’ем.

Для этого идем в меню Файл — Сохранить как (File — Save As) или жмем клавишу F12 на клавиатуре и в открывшемся окне выбираем тип файла Веб-страница в одном файле (Webpage — Single file) :

После сохранения должен получиться файл с расширением mhtml (если у вас в Проводнике видны расширения файлов).

Этап 3. Загружаем файл в Excel через Power Query

Можно открыть созданный MHTML-файл в Excel напрямую, но тогда мы получим, во-первых сразу все содержимое PDF вместе текстом и кучей ненужных таблиц, а, во-вторых, опять потеряем данные из-за неправильных разделителей. Поэтому импорт в Excel мы будем делать через надстройку Power Query. Это совершенно бесплатная надстройка, с помощью которой можно загружать в Excel данные практически из любых источников (файлов, папок, баз данных, ERP-систем) и всячески затем полученные данные трансформировать, придавая им нужную форму.

Если у вас Excel 2010-2013, то скачать Power Query можно с официального сайта Microsoft — после установки у вас появится вкладка Power Query. Если у вас Excel 2016 или новее, то качать ничего не нужно — весь функционал уже встроен в Excel по-умолчанию и находится на вкладке Данные (Data) в группе Загрузить и преобразовать (Get & Transform) .

Так что идем либо на вкладку Данные, либо на вкладку Power Query и выбираем команду Получить данные или Создать запрос — Из файла — Из XML. Чтобы были видны не только XML-файлы — меняем в выпадающем списке в правом нижнем углу окна фильтры на Все файлы (All files) и указываем наш MHTML-файл:

Обратите внимание, что импорт успешно не завершится, т.к. Power Query ждет от нас XML, а у нас, на самом деле, HTML-формат. Поэтому в следующем появившемся окне нужно будет щелкнуть правой кнопкой мыши по непонятному для Power Query файлу и уточнить его формат:

После этого файл будет корректно распознан и мы увидим список всех таблиц, которые в нем есть:

Читать еще:  Выделить всю таблицу в excel сочетание клавиш

Посмотреть содержимое таблиц можно, если щелкать левой кнопкой мыши в белый фон (не в слово Table!) ячеек в столбце Data.

Когда нужная таблица определена, щелкните по зеленому слову Table — и вы «провалитесь» в её содержимое:

Останется проделать несколько простых действий, чтобы «причесать» ее содержимое, а именно:

  1. удалить ненужные столбцы (правой кнопкой мыши по заголовку столбца — Удалить)
  2. заменить точки на запятые (выделить столбцы, щелкнуть правой — Замена значений)
  3. удалить знаки равно в шапке (выделить столбцы, щелкнуть правой — Замена значений)
  4. удалить верхнюю строку (Главная— Удалить строки — Удаление верхних строк)
  5. удалить пустые строки (Главная — Удалить строки — Удаление пустых строк)
  6. поднять первую строку в шапку таблицы (Главная — Использовать первую строку в качестве заголовков)
  7. отфильтровать лишние данные с помощью фильтра

Когда таблица будет приведена в нормальный вид, ее можно выгрузить на лист командой Закрыть и загрузить (Close & Load) на Главной вкладке. И мы получим вот такую красоту, с которой уже можно работать:

Конвертер PDF в Excel

Конвертируйте PDF в таблицу Excel за считанные секунды.

Подписчики имеют больше преимуществ

  • Перестаньте ждать! Мгновенная конвертация
  • Документы неограниченного размера
  • Конвертируйте несколько документов одновременно
  • Неограниченный доступ ко всем инструментам
  • Защита файлов при помощи 256-разрядного SSL-шифрования
  • На любом компьютере
  • Приоритетная поддержка
  • 20 инструментов для извлечения, конвертирования, сжатия, слияния и разделения файлов PDF

Подписчики имеют больше преимуществ

  • Перестаньте ждать! Мгновенная конвертация
  • Документы неограниченного размера
  • Конвертируйте несколько документов одновременно
  • Неограниченный доступ ко всем инструментам
  • Защита файлов при помощи 256-разрядного SSL-шифрования
  • На любом компьютере
  • Приоритетная поддержка
  • 20 инструментов для извлечения, конвертирования, сжатия, слияния и разделения файлов PDF

Как конвертировать PDF в Excel бесплатно

  1. Выберите документ PDF, который необходимо конвертировать с компьютера.
  2. Наш бесплатный конвертер PDF в XLS преобразует ваш файл в формат электронной таблицы Excel.
  3. Ваш новый файл Excel совсем скоро будет готов к загрузке.
  4. После завершения преобразования PDF в Excel все оставшиеся файлы будут удалены с наших серверов.

Лучший конвертер PDF в Excel

Ни одна другая компания не предоставляет настолько же доступное и быстродействующее программное обеспечение для конвертации, как наше. Наш онлайн-конвертер PDF в XLS – лучшее средство для преобразования PDF-файлов в редактируемые таблицы Excel с формулами.

Автоматическое удаление файлов

Поскольку мы сохраняем конфиденциальность вашей информации, все файлы, загруженные в наш конвертер PDF (включая XLS, XLSX и другие форматы), автоматически удаляются с наших серверов после того, как вы загрузили конвертированные файлы.

Шифрование файлов

Все загрузки с наших серверов шифруются с использованием 256-битного шифрования SSL, что еще более повышает уровень безопасности. При этом данные из ваших PDF-файлов и документов Excel не доступны для просмотра даже при получении к ним несанкционированного доступа. Кроме того, любая переданная нам информация, не продается и не передается третьим лицам.

Удобный доступ

Если у вас есть подключение к Интернету, можно получить доступ к нашей программе и конвертировать PDF в Excel бесплатно, находясь в любой точки мира. Документы PDF, XLS и XLSX можно передать для конвертации с любой ОС, например, Mac, Linux или Windows, и с любого устройства, а затем сохранить их на своем носителе, вне зависимости от вида устройства.

Попробуйте бесплатно

Попробуйте наш онлайн-конвертер PDF в Excel бесплатно или оформите подписку по одному из наших тарифов, чтобы без ограничений пользоваться всеми инструментами конвертирования и редактирования. Кроме того, вы получите возможность конвертировать файлы любого размера и даже одновременно преобразовывать несколько файлов PDF в Excel.

Вы сказали «инструментов»?

Если нужно поворачивать, объединять или разделять PDF-файлы, наши инструменты позволяют это легко сделать. Если вам нужно сжать PDF, у нас есть соответствующий инструмент и для этого. Мы предлагаем гораздо больше, чем конвертер PDF в Excel – он может преобразовывать любые файлы в редактируемый формат.

Конвертер PDF в XLS (EXCEL)

Сконвертируйте ваши pdf-файлы в xls онлайн и бесплатно

  • Image
  • Document
  • Ebook
  • Audio
  • Archive
  • Video
  • Presentation
  • Font
  • Vector
  • CAD
  • abc
  • abw
  • csv
  • dbk
  • djvu
  • dng
  • doc
  • docm
  • docx
  • erf
  • ebm
  • ewm
  • emw
  • gzip
  • kwd
  • odt
  • oxps
  • ppt
  • pptx
  • pdf
  • rtf
  • rar
  • txt
  • wps
  • xls
  • xlsx
  • zip
  • Image
  • Document
  • Ebook
  • Audio
  • Archive
  • Video
  • Presentation
  • Font
  • Vector
  • CAD
  • abc
  • abw
  • csv
  • dbk
  • djvu
  • dng
  • doc
  • docm
  • docx
  • erf
  • ebm
  • ewm
  • emw
  • gzip
  • kwd
  • odt
  • oxps
  • ppt
  • pptx
  • pdf
  • rtf
  • rar
  • txt
  • wps
  • xls
  • xlsx
  • zip

Портативный формат документов

PDF ― это формат электронных документов, разработанный Adobe Systems с использованием некоторых функций языка PostScript. Официальная программа для просмотра документов в этом формате ― это Adobe Reader. Чаще всего PDF-файл представляет собой сочетание текста с растровой и векторной графикой, текстовыми формами, скриптами, написанными на JavaScript, а также иными элементами.

Читать еще:  Excel менять столбцы местами в excel

Лист Microsoft Excel (97-2003)

Формат XLS используется для описания документов программы Microsoft Excel. Этот файл представляет собой электронную таблицу. Все данные в документе распределены по ячейкам и хранятся в них. Каждая ячейка имеет уникальный адрес, обозначаемый буквами и арабскими цифрами. Ячейка может содержать неизменяемые данные и данные в виде формул, которые связывают несколько ячеек.

Конвертировать PDF-данных в электронные таблицы Excel

Скинуть файлы здесь или же

Максимальный размер файла!

The file exceeds the maximum file size allowed. Please feel free to use our desktop version.

Максимальное количество страниц превышено!

The file exceeds the maximum number of pages allowed. Please feel free to use our desktop version.

Максимальное количество страниц превышено!

Если вы хотите увеличить лимит до 2000 страниц, перейдите на пакет Hipdf Pro.

Максимальный размер файла!

Если вы хотите увеличить лимит до 50 МБ, обновите его до Hipdf Pro.

  • << fileData.file_name | subLengthStr(35) >>
  • Загрузка завершена В ожидании Загрузка не удалась Поврежденный файл Файл защищен Идёт конвертация Идёт сжатие PDF << fileData.operateProcess + '%' >><< fileData.output_size | fileSizeFormat >><< fileData.file_size | fileSizeFormat >> Конвертирование завершено Конвертирование не удалось! Сжатие не удалось!

Подписывайся to enable batch conversion. to enable batch compression. If you have subscribed, you need to Вход.

  • High Сжать больше, хуже качество
  • Medium Сжать хороршо, хорошее качество
  • Low Сжать меньше, лучшее качество

Как конвертировать PDF в Excel

Сначала перетащите файл в окно или просто нажмите кнопку «Выбрать файл», чтобы загрузить файл PDF. Затем наши серверы преобразуют ваш PDF в редактируемый Excel XLSX, и вам просто нужно будет его скачать.

Безопасность

Ваша конфиденциальность — наш приоритет. После конвертирования PDF в Excel мы всегда удаляем файлы с наших серверов через час. Ни один из ваших файлов или их содержимое не будут использоваться во второй раз.

Бесплатный конвертер PDF в Excel

Эта онлайн-служба абсолютно бесплатна. На самом деле нет ограничений на количество обрабатываемых файлов, и нет необходимости создавать учетную запись.

Мы поддерживаем кросс-платформу

Мы конвертируем PDF в Excel на всех платформах, независимо от того, какую систему ОС вы используете — Windows, Mac или Linux.

Другие инструменты

Конвертировать таблицы Excel в PDF

Легко конвертировать PDF в Word

Конвертировать PDF-данных в электронные таблицы Excel

Конвертировать PDF-файла в набор оптимизированных изображений в формате PNG

Самый простой способ сжать размер вашего файла PDF

Download Hipdf Desktop — PDFelement Pro

Accelerate your document workflows like never before

ТОП-10 лучших бесплатных программ для преобразования PDF в Excel

Каролина Цветков

Jul 26,2019 • Filed to: Конвертер PDF

Каждый из нас хотя бы раз пользовался форматом PDF и все мы знаем как он выглядит. Но, вы когда-нибудь пытались редактировать информацию из такого документа? Тогда вы точно заметили, что формат PDF не дает возможности сделать какое-либо действие, а если вам нужно скопировать или редактировать такой файл, то необходимо преобразовать его в другой формат. Есть несколько вариантов конвертации. Один из которых – это конвертировать документы с помощью бесплатного ПО. Ниже вы найдете 10 лучших программ для преобразования PDF в Excel, которыми вы можете пользоваться как на Windows, так и на Mac.

ТОП-10 лучших ПО преобразования PDF в Excel для Mac и Windows

1. PDFelement Pro

PDFelement ProPDFelement Pro это одна из самых надежных программ для конвертации PDF в Excel, вы можете легко выполнять преобразование и редактирование PDF. Если вы будете использовать это ПО, то вы сможете полностью управлять вашими PDF-файлами. У вас также появиться возможность преобразования нескольких PDF-файлов в такие форматы, как Excel, HTML, Word и т.п. Провайдер ПО предлагает подробную информацию о том, как перенести PDF в документ Excel на веб-сайте.

  • Вы можете создавать, объединять и разделять различные PDF-файлы
  • Возможность добавлять печать, примечания, комментарии и рисовать от руки на документах
  • Создавайте новые PDF-формы и заполняйте существующие
  • Возможность защитить PDF-файлы
  • Вы можете настроить закладки и сквозную нумерацию файлов
  • Вы можете редактировать и конвертировать отсканированный PDF-файл с расширенной функцией OCR распознавания текста

2. Free Online OCR

Free Online OCR- бесплатный онлайн-конвертер PDF в Excel, с которым у вас будет возможность создавать документы, которые будут выглядеть именно так, как вы хотите. Этот инструмент не требует от пользователя адреса электронной почты для получения нового формата документа. Бесплатный онлайн OCR использует оптическое распознавание символов для идентификации содержимого в файле PDF

  • Преобразование отсканированных файлов
  • Вы можете создать редактируемый текст
  • Изображения отформатированы как заголовки и зафиксированы на месте
  • Без ожидания получения ссылки для загрузки новых документов
  • Не распознает текст на цветном фоне
  • В новом документе есть лишние разрывы строк и посторонние вкладки
  • В большинстве случаев форматирование теряется
  • Отсутствует пакетная обработка
  • Преобразование одного файла за один раз

3. Nitro PDF to Word Converter

Nitro PDF to Word Converter это конвертер PDF в Excel. Он имеет две версии, одну из которых можно загрузить на рабочий стол устройств, использующих Windows, а также онлайн-версию. Онлайн-версия- бесплатна для использования. При использовании этого ПО, вы можете импортировать и экспортировать такие форматы, как PowerPoint, Word и Exce. Кроме этого вы можете загрузить несколько файлов.

  • Текст хорошо конвертируется
  • Плюс пакетной обработки
  • Окончательный формат отправляется вам по электронной почте
  • При конвертации достаточно хорошо сохраняется текст
  • Вы можете конвертировать исключительно 5 файлов в месяц
  • Изображения не выдерживают изменения формата
  • Лишние разрывы строк и пробелы

UniPDF — программа-конвертер PDF в Excel, поэтому при ее использовании вам не придется иметь дело с медленной загрузкой и другими подобными проблемами, с которыми вы сталкиваетесь при использовании онлайн-программ. Кроме того, вам не придется доверять свои файлы третьим лицам и испытывать страх, что кто-то будет использовать вашу информацию.

  • Сохраняет макет страницы, в том числе изображения
  • Вы можете конвертировать PDF в Word, Excel, Image, Text и HTML
  • Работает на Windows Vista и XP, 10, 8, 7
  • С пробной версией преобразование только 3 страниц или вам придется купить платную версию
  • Проблемы с форматированием текста
  • Столбцы сходятся друг с другом
  • В некоторых случаях размер текста отличается от размера оригинала
  • Могут отсутствовать некоторые буквы

5. Free File Converter

Free File Converter является одним из конвертеров файлов, который кроме преобразования PDF в Excel, может выполнять многое другое. Это онлайн ПО, в котором вы можете выполнять не только преобразование PDF в Excel и Word. При использовании этого редактора вы можете получить доступ к новому файлу, нажав на ссылку. Вы преобразовать документ в несколько форматов.

  • Сохраняет видео и файлы из eHow и DailyMotion
  • Не нужно вводить свою почту и ждать файл
  • Текст из PDF-файлов недостаточно хорошо конвертируется
  • Иногда теряются изображения
  • Форматирование не очень хорошее

6. Weeny Free PDF to Excel Converter

Weeny Free PDF to Excel Converter isэто бесплатное программное обеспечение, которое вы можете использовать для преобразования PDF-файлов в формат XLS. Редактор предлагает пользователю возможность установить диапазон страниц для документов, которые будут преобразованы. Также пользователь может конвертировать несколько файлов одновременно, что является большим плюсом по сравнению с другими продуктами рынка.

  • Вы можете конвертировать PDF-файлы доступные для поиска
  • Преобразование всех страниц из документа
  • Не поддерживает полное форматирование файла PDF
  • Не конвертирует отсканированные документы

7. Blue Fox Free PDF to Excel Converter

Blue Fox Free PDF to Excel Converter является универсальным конвертером PDF в Excel, с его помощью вы можете конвертировать PDF документы в Excel. Пользователь может конвертировать каждую из страниц файла PDF в отдельные листы. При желании, вы можете указать страницу, которую необходимо преобразовать в отдельный лист.

  • Автоматически дает название файлу Excel
  • Он преобразует только доступные для поиска и выделения документы
  • Процесс конвертации файла довольно сложный

8. Office Convert Pdf to Excel for XlS Free

Office Convert Pdf to Excel for XlS Free бесплатный редактор с возможностью преобразования файлов PDF в документы Excel. Редактор сохранит новый формат документа в выходной папке. Но важно обратить внимание, что конвертер не может сохранить параметры форматирования.

  • Создает и преобразует файл Excel в выбранную папку
  • Сохраняет изображения и текст из PDF-документа
  • Если вы используете бесплатную версию, вы не можете конвертировать сразу несколько файлов.

9. PDF to XLS Converter

PDF to XLS Converter это бесплатный и простой редактор, в нем вы можете выполнять преобразование PDF-документов в Excel. Программа сохраняет документы в местоположение по умолчанию, поэтому пользователю не придется их искать. Этот инструмент с простым интерфейсом, поэтому каждому будет легко им пользоваться.

  • Преобразование нескольких файлов
  • Выбор диапазона страниц
  • Не выполняет преобразование отсканированных PDF
  • Преобразование только документов доступных для поиска

Похожие статьи

Ссылка на основную публикацию
Похожие публикации
Adblock
detector