Как конвертировать PDF в Word на C#

Преобразование файлов PDF в документы Word — распространённая задача в бизнес-среде и разработке. Независимо от того, нужно ли вам отредактировать содержимое PDF или извлечь текст для дальнейшей обработки, использование надёжной библиотеки для конвертации крайне важно. В этой статье мы рассмотрим, как преобразовать PDF в Word на C# с помощью Spire.PDF для .NET — мощной библиотеки, поддерживающей как конвертацию с фиксированным, так и с гибким форматированием.

  • Библиотека C# .NET для конвертации PDF в Word

  • Конвертация PDF в Word с фиксированным форматированием

  • Конвертация PDF в Word с гибкой структурой

  • Заключение

Библиотека C# .NET для конвертации PDF в Word

Spire.PDF для .NET — это мощная библиотека для работы с PDF, позволяющая программно создавать, редактировать и конвертировать PDF-документы. Среди её возможностей — удобное преобразование PDF в Word (форматы .doc и .docx) с сохранением форматирования, изображений и структуры текста.

Чтобы начать работу:

  1. Установите Spire.PDF для .NET через NuGet:

    Install-Package Spire.PDF

  2. Добавьте необходимое пространство имён в код C#:

using Spire.Pdf;

Теперь рассмотрим два способа конвертации PDF в Word.

Конвертация PDF в Word с фиксированным форматированием

Фиксированный формат Word-документа сохраняет точное расположение элементов, как в исходном PDF, включая шрифты, изображения и структуру. Это полезно, когда нужно получить файл Word, идентичный оригинальному PDF.

Вот как это реализовать на C#:

using Spire.Pdf;


namespace ConvertPdfToFixedLayoutWord

{

class Program

{

static void Main(string[] args)

{

// Создаём объект PdfDocument

PdfDocument doc = new PdfDocument();


// Загружаем PDF-документ

doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.pdf");


// Конвертируем PDF в Doc

doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC);


// Конвертируем PDF в Docx

doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX);


// Освобождаем ресурсы

doc.Dispose();

}

}

}

Основные моменты:

  • Метод SaveToFile() позволяет сохранять как в .doc (Word 97-2003), так и в .docx (современный формат Word).

  • Выходной файл сохраняет исходную структуру PDF.

Конвертация PDF в Word с гибкой структурой

Если вам нужен редактируемый Word-документ, в котором текст и абзацы можно легко изменять (без жёсткой привязки к позиции), Spire.PDF позволяет преобразовать PDF в файл с гибкой структурой.

Вот реализация на C#:

using Spire.Pdf;


namespace ConvertPdfToFlexibleLayoutWord

{

class Program

{

static void Main(string[] args)

{

// Создаём объект PdfDocument

PdfDocument doc = new PdfDocument();


// Загружаем PDF-документ

doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pdf");


// Указываем параметры конвертации

doc.ConvertOptions.SetPdfToDocOptions(true, true);


// Конвертируем PDF в Doc

doc.SaveToFile("output/ToDoc.doc", FileFormat.DOC);


// Конвертируем PDF в Docx

doc.SaveToFile("output/ToDocx.docx", FileFormat.DOCX);


// Освобождаем ресурсы

doc.Dispose();

}

}

}

Основные моменты:

  • SetPdfToDocOptions(true, true) включает гибкое форматирование текста и автоматическое определение абзацев.

  • Полезно, если нужно изменить структуру документа в Word.

Заключение

С Spire.PDF для .NET конвертация PDF в Word на C# становится простой задачей. Независимо от того, нужен ли вам фиксированный макет (точная копия) или гибкая структура (для редактирования), Spire.PDF предоставляет необходимые инструменты для качественного преобразования.

Попробуйте интегрировать эту библиотеку в свои проекты, чтобы упростить процесс конвертации PDF в Word!

Дополнительные материалы:

Удачного программирования! 🚀