ByteScout PDF Extractor SDK – C# – Extract Text By Columns

Home
/
Articles
/
ByteScout PDF Extractor SDK – C# – Extract Text By Columns

ByteScout PDF Extractor SDK – C# – Extract Text By Columns

Program.cs

using System;
using Bytescout.PDFExtractor;
using System.Diagnostics;

namespace ExtractTextByColumns
{
    class Program
    {
        static void Main(string[] args)
        {
            // Create Bytescout.PDFExtractor.TextExtractor instance
            TextExtractor extractor = new TextExtractor();
            extractor.RegistrationName = "demo";
            extractor.RegistrationKey = "demo";

            // Load sample PDF document
            extractor.LoadDocumentFromFile(@".\columns.pdf");

            // Extract text by columns (useful if PDF document is designed in column layout like a newspaper)
            extractor.ExtractColumnByColumn = true;

            // Save extracted text to file
            extractor.SaveTextToFile(@".\result.txt");

            // Cleanup
            extractor.Dispose();

            // Open result file in default associated application
            ProcessStartInfo processStartInfo = new ProcessStartInfo(@".\result.txt");
            processStartInfo.UseShellExecute = true;
            Process.Start(processStartInfo);
        }
    }
}

Click here to get your Free Trial version of the SDK

ByteScout PDF Extractor SDK – C# – Extract Text By Columns

ByteScout PDF Extractor SDK – C# – Extract Text By Columns

Tutorials: