Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Serge Shikov                         2:5020/400     25 Jan 2001  13:20:53
 To : All
 Subject : Re: PDF to HTML
 -------------------------------------------------------------------------------- 
 
 
 "Sergey V. Leschenko" wrote:
 
 > 
 > Sergey Tkachuk wrote:
 > >Я в курсе :-)  Hо есть одно большое HО.  Посмотрим на подавляющее большинство
 > >PDF-файлов.  Видим мы там что-то, сильно отличное от прямоугольных картинок и
 > >обычного текста?  Hе видим.  Так что все не так страшно.
 >  Так все-таки?
 >    Есть книга в PDF, ее хотелось бы перевести в HTML (или в крайнем случае в
 > formatted text)
 
 В текст умеет ghostscript без всякого перла. При этом по уже описанным
 ранее причинам теряется порядок текста на странице (т.е. всякие
 колонтитулы могут оказаться в текстовом файле где угодно, как до текста,
 так и после него). Более того, некоторые софтины при генерации PS (а
 потом и PDF из него) выводят отдельно по одной букве, обеспечивая таким
 образом кернинг (раньше таким особо отличалась Ventura). В результате ты
 потом в тексте не имеешь даже абзацев, т.к. каждая буковка может быть
 индивидуально позиционирована на странице. Представляешь HTML:
 
 <div style="position: absolute: top: nnnpx; left: mmmpx;">
 тут одна буква...
 </div>
 
 <div style="position: absolute: top: nnnpx; left: mmmpx;">
 тут вторая буква...
 </div>
 
 В общем может тебе и повезет с конкретной книжкой, но в общем случае
 результат будет плачевный.
 --- ifmail v.2.15dev5
  * Origin: home (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 PDF to HTML   Sergey V. Leschenko   23 Jan 2001 18:42:59 
 PDF to HTML   Stanislav Shwartsman   23 Jan 2001 19:41:04 
 Re: PDF to HTML   Artem Chuprina   24 Jan 2001 18:18:48 
 Re: PDF to HTML   Serge Shikov   23 Jan 2001 20:47:58 
 Re: PDF to HTML   Sergey Tkachuk   24 Jan 2001 07:59:00 
 PDF to HTML   Yan Alexandrovsky   24 Jan 2001 08:25:28 
 Re: PDF to HTML   Sergey Tkachuk   24 Jan 2001 11:31:00 
 PDF to HTML   Yan Alexandrovsky   24 Jan 2001 14:32:33 
 Re: PDF to HTML   Sergey V. Leschenko   24 Jan 2001 15:11:57 
 Re: PDF to HTML   Serge Shikov   25 Jan 2001 13:20:53 
 Re^2: PDF to HTML   Paul Lou   24 Jan 2001 23:54:18 
 Re: PDF to HTML   Michael A. Borisov   26 Jan 2001 12:01:53 
 Re^2: PDF to HTML   Paul Lou   28 Jan 2001 00:11:24 
 Re: Re^2: PDF to HTML   Sergey V. Leschenko   26 Jan 2001 14:30:36 
 Re: PDF to HTML   Serge Shikov   25 Jan 2001 13:10:34 
 Re: PDF to HTML   Artur Penttinen   24 Jan 2001 14:22:40 
 Re: PDF to HTML   Serge Shikov   25 Jan 2001 15:34:10 
 Re: PDF to HTML   Artur Penttinen   25 Jan 2001 16:19:14 
 Re: PDF to HTML   Serge Shikov   25 Jan 2001 17:20:48 
Архивное /ru.perl/28253d200486.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional